VideoAgent VideoAgent是一款基于自改进机制的视频生成系统,结合图像观察与语言指令生成机器人控制视频计划。它采用自我条件一致性方法优化视频质量,通过预训练视觉-语言模型反馈和实际执行数据的收集,持续提升生成效果,减少幻觉内容并提高任务成功率。VideoAgent在模拟环境中有优异表现,并已应用于机器人控制、模拟训练、教育研究、游戏开发以及电影制作等领域,展现出广泛的应用潜力。 AI项目与工具 2025年06月12日 66 点赞 0 评论 663 浏览
TrackGo TrackGo是一种先进的AI视频生成技术,利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中,通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色,适用于影视制作、动画制作、虚拟现实(VR)、增强现实(AR)和游戏开发等多个领域。 AI项目与工具 2025年06月12日 64 点赞 0 评论 668 浏览
混元游戏 混元游戏是腾讯混元大模型打造的工业级AIGC游戏内容生产引擎,提供AI美术管线、实时画布、AI 2D美术生成和角色多视图生成等功能。设计师可通过提示词或草图快速生成角色灵感图、三视图及动态视频,大幅缩短设计周期。平台支持多种游戏风格,具备实时调整细节能力,将角色多视图生成时间从12小时压缩至几分钟到30分钟,适用于影视制作、UGC社交创作、电商广告、工业设计与教育娱乐等多个场景。 AI项目与工具 2025年06月11日 65 点赞 0 评论 669 浏览
Promptopia Promptopia 是一款基于生成式 AI 技术的创作工具,专注于通过简单的文本提示生成游戏对象、环境和音乐等内容。它结合了多人游戏与实时 AI 资产生成功能,打破创作者与玩家之间的界限,支持用户自由构建沉浸式虚拟世界。此外,平台还提供 AI 微课程和提示库,助力用户提升创作能力。 AI项目与工具 2025年06月12日 55 点赞 0 评论 670 浏览
Sketch2Sound Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术,通过提取响度、亮度和音高概率等控制信号,结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架,同时赋予声音设计师更强的表达力与可控性,广泛适用于电影、游戏、音乐制作及教育等多个领域。 AI项目与工具 2025年06月12日 35 点赞 0 评论 671 浏览
AI Reality AI Reality 是一个网站,它提供了一个使用人工智能 (AI) 学习和创建增强现实 (AR) 的平台。 Ai编程建站 2025年06月05日 64 点赞 0 评论 672 浏览
Crypko Crypko是一款基于AI的动漫角色生成工具,利用生成对抗网络(GAN)技术实现高质量角色立绘的自动化创作。用户可通过简单操作生成并个性化定制角色,支持动画效果添加及社交分享。此外,Crypko还提供商业用途插图生成功能,并支持虚拟世界角色“旅行”体验。 AI项目与工具 2025年06月12日 24 点赞 0 评论 672 浏览
Dubbing AI DubbingAI 语音生成器作为实时变声器,可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。 Ai语音工具 2025年06月05日 19 点赞 0 评论 672 浏览
MultiFoley MultiFoley是一款基于多模态控制的音效生成系统,能够根据文本、音频或视频输入生成与视频同步的高质量Foley声音效果。它支持文本驱动和音频驱动的音效生成,同时具备音频扩展和质量控制功能,广泛应用于电影、游戏、动画及虚拟现实等领域,为用户提供灵活且高效的声音设计解决方案。 AI项目与工具 2025年06月12日 78 点赞 0 评论 673 浏览