OmniSync OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。 AI项目与工具 2025年06月11日 27 点赞 0 评论 480 浏览
深氧AI 深氧AI 提供了一个多功能的在线平台,使用户能够轻松地生成和编辑图片、视频和3D素材。其AI驱动的工具不仅提高了内容创作的效率,还通过个性化服务满足了用户的特定需求。 创作工具 1970年01月01日 0 点赞 0 评论 448 浏览
MM MM-StoryAgent是由上海交通大学X-LANCE实验室与阿里巴巴集团联合开发的开源多模态、多智能体框架,用于生成沉浸式有声故事绘本视频。它结合大型语言模型与多模态生成技术,通过多阶段写作流程和模态对齐优化,提升故事内容的质量与连贯性。支持灵活模块化设计,适用于儿童教育、数字内容创作、在线教育等多个场景,为故事创作提供高效、可定制的解决方案。 AI项目与工具 2025年06月12日 67 点赞 0 评论 423 浏览
讯飞智检 讯飞智检是科大讯飞旗下开放平台推出的一款人工智能写作、校对/合规审查的智能产品,可帮助用户进行AI智能文本纠错,支持对纯文本、Word、图片、音频、视频进行批量审查。在节省人... AI写作对话 1970年01月01日 0 点赞 0 评论 418 浏览