同步

JoyVASA

JoyVASA是一个基于扩散模型的音频驱动数字人头项目,能够生成与音频同步的面部动态和头部运动。其主要功能包括唇形同步、表情控制及动物面部动画生成,支持多语言和跨物种动画化。项目采用两阶段训练方法,结合解耦面部表示与扩散模型技术,生成高质量动画视频,广泛应用于虚拟助手、娱乐媒体、教育、广告等多个领域。

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

PackPack

PackPack是一款由AI驱动的书签管理工具,专为新闻和社交媒体等网络资源定制保存功能。它利用AI清理并保存内容。使用PackPack,彻底改变你的书签管理方式,更智能地管理你的收藏。

BodyTalk

BodyTalk是一款基于生成性AI技术的视频配音工具,支持将视频中的语音翻译成29种语言,并通过声音模仿和面部动作同步技术保持自然效果。它提供自动化处理、编辑功能以及多语言支持,适用于教育、企业培训、市场营销等多个领域,帮助企业扩大国际影响力并提升视频内容的质量。

悟空浏览器

字节跳动推出的一款手机浏览器APP,致力于为用户提供“搜你想搜,看你想看”的全新浏览器体验。支持便捷的网页访问、日常搜索、资讯浏览、视频播放、小说阅读等服务。

文小言电脑版

文小言电脑版是一款功能全面的桌面级智能助手,通过自然语言处理技术为用户提供文档解析、智能搜索、写作辅助等功能。它支持多格式文件的一键解析,提供个性化推荐和跨平台同步,能够有效提升办公、学习和生活的效率,适用于撰写报告、制作PPT、备考复习等多种场景。

Contra Pro

Contra Pro是一款面向自由职业者的专业在线作品集平台。让更多的潜在客户来发展您的自由职业者业务。

Addsubtitle

Addsubtitle 是一款基于AI的在线视频编辑工具,支持多语言视频翻译、自动字幕生成与自定义样式设置,适用于全球市场推广和内容本地化。用户可实时编辑字幕并实现精准的唇音同步,同时提供语音克隆和水印去除功能,提升视频的国际化传播能力。

QA

QA-MDT是一款基于文本生成高质量音乐的开源工具,其核心技术包括质量感知训练、掩蔽扩散变换器以及音乐与文本的同步优化。它能够根据用户提供的文本描述生成多样化的音乐作品,并通过质量控制确保输出结果的高保真度。此外,QA-MDT支持音乐与文本的一致性增强,适用于广告、影视配乐、音乐教育及智能设备等多个领域。