数字 - 智狐AI导航

Baichuan

Baichuan-NPC（百川角色大模型）是一款由百川智能公司推出的智能角色模型，通过文本描述即可生成具有生动表现力的角色智能体。该模型在“角色知识”与“对话能力”方面进行了深度优化，确保角色能更准确地理解对话语境，并根据角色性格进行交流和互动。主要功能包括高效对话能力、高度定制角色创建、严格的事实性回复、高质量数据预训练及思维链对齐技术。

AI项目与工具 2024年01月01日 23 点赞 0 评论 624 浏览

FaceChain

FaceChain是一个由阿里巴巴达摩院开发的开源AI生成框架，专为创建个人数字形象而设计。用户上传个人照片后，可生成独特且个性化的数字写真。该框架采用先进的机器学习技术，支持多风格写真生成、个性化训练、姿态控制和自定义提示词等功能，满足不同用户的多样化需求。

AI项目与工具 2024年01月01日 50 点赞 0 评论 614 浏览

MusicFX

Google MusicFX是一款基于人工智能技术的音乐生成工具，支持用户通过文本描述来生成音乐，涵盖多种风格。它具备文本到音乐创作、自定义音乐参数、数字水印技术和版权安全过滤等功能，旨在降低音乐创作门槛，提升创作效率和质量。自发布以来，已有大量用户通过该工具创作出原创音乐作品。

AI项目与工具 2024年01月01日 25 点赞 0 评论 887 浏览

Make-A-Character（简称Mach）是由阿里巴巴集团智能计算研究院开发的3D数字人生成框架，通过文本描述快速生成逼真的3D角色。该系统支持灵活的定制化、高度逼真的渲染、完整的角色模型及动画支持。其工作流程包括文本解析、视觉提示生成、参考肖像图像生成、密集面部坐标检测、几何生成、纹理生成、纹理修正、头发生成、资产匹配和角色装配。Mach生成的角色模型可以无缝集成到游戏和电影行业的标准CG

AI项目与工具 2024年01月01日 39 点赞 0 评论 695 浏览

Mora

Mora是一个多智能体框架，专为视频生成任务设计，通过多个视觉智能体的协作实现高质量视频内容的生成。主要功能包括文本到视频生成、图像到视频生成、视频扩展与编辑、视频到视频编辑以及视频连接。尽管在处理大量物体运动场景时性能稍逊于Sora，Mora仍能在生成高分辨率视频方面表现出色。

AI项目与工具 2024年01月01日 75 点赞 0 评论 723 浏览

EchoMimic

EchoMimic是一款由阿里蚂蚁集团开发的AI数字人开源项目，通过深度学习模型结合音频和面部标志点，创造出高度逼真的动态肖像视频。该工具支持音频同步动画、面部特征融合、多模态学习和跨语言能力，适用于娱乐、教育和虚拟现实等领域。其独特的技术原理包括音频特征提取、面部标志点定位、面部动画生成和多模态学习，使用了卷积神经网络（CNN）、循环神经网络（RNN）和生成对抗网络（GAN）等深度学习模型，实现

AI项目与工具 2025年06月12日 79 点赞 0 评论 934 浏览

Amuse AI

Amuse 2.0是一款由AMD开发的AI图像生成工具，专为AMD硬件优化，支持在PC上生成高质量图像。它具备设计模式，可将用户的草图和文本提示转化为图像，并提供AI滤镜功能，便于个性化风格的创作。Amuse 2.0 Beta版本集成了AMD XDNA超级分辨率技术，能有效提升图像分辨率。此外，该工具还提供了平衡、快速和质量三种模式，以满足不同用户的需求和偏好。

AI项目与工具 2025年06月12日 94 点赞 0 评论 866 浏览

Tavus – AI视频生成平台，支持数字人克隆和实时对话

Tavus 是一个先进的 AI 视频生成平台，提供逼真的数字人克隆和实时对话式视频。基于 Phoenix-2 模型和对话式视频接口（CVI），Tavus 支持企业快速部署 AI 视频产品，提升用户体验并确保安全合规。主要功能包括 AI 视频生成、实时对话、开发者文档和工具，适用于客户服务、个性化营销、虚拟助手、教育和产品演示等多种应用场景。

AI项目与工具 2025年01月28日 44 点赞 0 评论 538 浏览

Glyph

Glyph-ByT5-v2是一个由多家知名学术机构合作开发的多语言视觉文本渲染工具。它支持10种不同语言的视觉文本渲染，通过构建包含大量字形-文本对和平面设计图像-文本对的数据集，结合先进的步骤感知偏好学习技术，显著提升了视觉文本的拼写准确性和审美质量。该工具适用于平面设计、广告制作、数字艺术、出版行业及品牌标识设计等多个领域。 ---

AI项目与工具 2025年06月12日 20 点赞 0 评论 806 浏览

SadTalker

SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频，通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情，PoseVAE合成不同风格的头部运动，并采用3D面部渲染技术，实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力，适用于虚拟助手、视频制作、语言学习、社交媒体和教育等

AI项目与工具 2025年06月12日 71 点赞 0 评论 706 浏览

数字

首页

数字

列表

默认

浏览次数

发布日期