生成

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架,基于扩散变换器和3D面部几何先验,实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术,提升面部动态表现,同时保持身份稳定性。支持多种应用场景,如虚拟形象、内容创作和数字人交互,具备无需微调的高效生成能力。

声咔AI配音

声咔AI配音是在线配音软件平台,垂直深度音频效率工具,支持30多种个性化调音功能等,限制少对用户友好。

ClipZap AI

ClipZap AI 是一款基于人工智能的视频创作与编辑工具,提供视频剪辑、多语言翻译、AI 换脸、视频生成与增强等多种功能,帮助用户高效制作高质量视频内容,适用于社交媒体推广、产品营销、教育及多语言内容制作等多个场景。

Animate

Animate-X 是一个基于 Latent Diffusion Model 的通用动画框架,可将静态图像转化为高质量的动态视频,特别适合拟人化角色动画的生成。它通过引入隐式和显式姿势指示器,增强了对运动模式的捕捉能力,并支持多种角色类型,无需严格对齐。该工具在游戏开发、影视制作、虚拟现实及社交媒体内容创作等方面具有广泛应用价值。 ---

DistriFusion

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理,它能够在不增加额外训练负担的情况下,将推理速度提升高达六倍,同时保持图像质量。其技术原理包括Patch Parallelism(分片并行)、异步通信、位移补丁并行性等,适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

语鲸大模型

语鲸大模型是一个多功能的AI语言处理工具,它通过先进的算法和持续的学习,为用户提供高效、准确的语言服务。

文心快码

基于文心大模型,结合百度积累多年的编程现场大数据和外部优秀开源数据,打造的新一代编码辅助工具。

视界一粟YiSu

北京极佳视界科技有限公司联合清华大学自动化系共同发布的Sora级视频生成大模型。

Colormind

Colormind 是一款基于 AI 技术的颜色方案生成工具,能够根据图片或数据集自动生成协调的配色方案。用户可自定义颜色并探索不同风格,适用于平面设计、影视、游戏开发、时尚创作等多个领域。该工具支持 API 接口,便于集成到各类项目中,是设计师和创意工作者的理想助手。

Emu Video

Meta开发的文本到视频生成模型,Emu Video使用扩散模型根据文本提示创建视频,首先生成图像,然后根据文本和生成的图像创建视频。