谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效 DeepMind推出的V2A(Video-to-Audio)模型能够将视频内容与文本提示相结合,生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作,还能与其他视频生成模型,如Sora、可灵或Gen 3等,进行集成,从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模 AI项目与工具 2025年06月12日 21 点赞 0 评论 193 浏览
筑绘通AlphaDraw 筑绘通AlphaDraw是面向工程领域的新一代智能设计平台。 它嵌入包含行业标准数据、规范要求、工程经验及常用做法的知识库,同时搭配强大的工程设计智能生成算法,实现绘图10倍提效。 AI服务商 2025年06月05日 71 点赞 0 评论 193 浏览
Blackshark.ai blackshark人工智能地理空间平台通过全球范围内的机器学习,从当前的卫星和航空图像中提取有关地球基础设施的见解。 创作工具 1970年01月01日 0 点赞 0 评论 193 浏览
AI春联 | AI Couplets 是一款免费在线的AI春联生成器,根据用户想要的描述即可生成对应的春联,支持直接下载为图片,AI生成春联,在为用户提供个性化、创意十足的春节对联。 Ai图片处理 2025年06月05日 64 点赞 0 评论 193 浏览
Muyan Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。 AI项目与工具 2025年06月11日 94 点赞 0 评论 193 浏览
AppIcons AI Appicons AI 是一个基于AI 技术为 Android 和 iOS 平台生成移动应用程序图标的网站。为用户提供了一种简单有效的方法来创建独特且具有专业外观的图标,无需任何图像编辑软件或技术技能。 图片处理 2025年06月05日 20 点赞 0 评论 194 浏览
商汤日日新大模型 商汤日日新大模型体现了商汤科技在人工智能领域的深入研究和创新能力。通过结合大模型和大算力,商汤科技致力于提供全面的AI解决方案,推动通用人工智能技术的发展,并在多个应用... Ai平台模型 1970年01月01日 0 点赞 0 评论 194 浏览
3DV 3DV-TON是一种基于扩散模型的视频虚拟试穿框架,由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导,提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态,提供高分辨率基准数据集HR-VVT,适用于在线购物、时尚设计、影视制作等多个领域。 AI项目与工具 2025年06月11日 60 点赞 0 评论 195 浏览