谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效 DeepMind推出的V2A(Video-to-Audio)模型能够将视频内容与文本提示相结合,生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作,还能与其他视频生成模型,如Sora、可灵或Gen 3等,进行集成,从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模 AI项目与工具 2025年06月12日 21 点赞 0 评论 193 浏览
筑绘通AlphaDraw 筑绘通AlphaDraw是面向工程领域的新一代智能设计平台。 它嵌入包含行业标准数据、规范要求、工程经验及常用做法的知识库,同时搭配强大的工程设计智能生成算法,实现绘图10倍提效。 AI服务商 2025年06月05日 71 点赞 0 评论 193 浏览
GameFactory GameFactory 是由香港大学与快手科技联合研发的AI框架,专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型,结合开放域数据与高质量游戏数据,通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持,适用于游戏开发、自动驾驶模拟及具身智能研究等领域。 AI项目与工具 2025年06月12日 31 点赞 0 评论 193 浏览
AI春联 | AI Couplets 是一款免费在线的AI春联生成器,根据用户想要的描述即可生成对应的春联,支持直接下载为图片,AI生成春联,在为用户提供个性化、创意十足的春节对联。 Ai图片处理 2025年06月05日 64 点赞 0 评论 193 浏览
Muyan Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。 AI项目与工具 2025年06月11日 94 点赞 0 评论 193 浏览
Genie 2 Genie 2是一款由DeepMind开发的大规模基础世界模型,其核心功能包括基于单一图片生成可交互3D游戏世界、模拟物体交互及物理效果、支持多类型动作控制、具备长时间记忆能力以及实时生成新场景内容。该工具不仅适用于智能体训练与评估,还广泛应用于游戏开发、模拟与训练、机器人学习以及虚拟现实和增强现实等领域。 AI项目与工具 2025年06月12日 40 点赞 0 评论 192 浏览
Matryoshka Diffusion Models Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的创新扩散模型,专为生成高分辨率图像和视频而设计。通过多尺度扩散机制与NestedUNet架构,MDM实现了高效的信息共享与渐进式训练,显著提升了模型的训练效率与生成质量。该模型适用于资源受限的环境,可减少训练步骤并保持生成图像的细节与清晰度。其主要功能包括高分辨率图像生成、多分辨率处理、特征共享以及渐进式训练 AI项目与工具 2025年06月12日 18 点赞 0 评论 192 浏览
Blackshark.ai blackshark人工智能地理空间平台通过全球范围内的机器学习,从当前的卫星和航空图像中提取有关地球基础设施的见解。 创作工具 1970年01月01日 0 点赞 0 评论 192 浏览
BrickCenter 一个利用AI根据文字描述生成定制积木套装,以及根据图像生成独特的积木人像的平台。无论您是想创建特定的汽车模型、独特的艺术品还是其他任何设计,我们的人工智能积木生成器都能让它变得轻松有趣。 Ai绘画生成 2025年06月05日 75 点赞 0 评论 192 浏览