Stable Audio Open Small Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型,参数量降至 3.41 亿,适配移动设备和边缘计算场景。基于深度学习与模型压缩技术,支持快速生成音效、音乐片段等音频内容,适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点,可用于音乐创作、游戏音效、视频配乐等领域。 AI项目与工具 2025年06月11日 35 点赞 0 评论 768 浏览
LHM LHM是由阿里巴巴通义实验室推出的3D人体模型重建系统,能从单张图像快速生成高质量、可动画化的3D人体模型。基于多模态Transformer架构,融合3D几何与2D图像信息,保留服装与面部细节,并采用3D高斯点云表示方式,支持实时渲染和姿态控制。适用于AR/VR、游戏开发、影视制作及教育等多个领域,具备高保真、强泛化和低延迟等优势。 AI项目与工具 2025年06月12日 93 点赞 0 评论 768 浏览
SyncAnimation SyncAnimation是一款基于音频驱动的实时动画生成框架,能够生成与音频同步的上半身姿态和面部表情,包括嘴唇动作。采用NeRF技术,结合音频到姿态和表情的同步模块,实现实时渲染与高精度动画生成。支持多种推理方式,具备高同步性和自然表现力,适用于虚拟主播、视频会议、动画制作、游戏开发及智能客服等多个领域。 AI项目与工具 2025年06月12日 41 点赞 0 评论 768 浏览
GenieArt 一个基于深度学习的AI文本到图像生成模型,GenieArt主要用于生成以文本描述为条件的详细图像和插画。在这里您可以享受低门槛地创作,所想即所得,方便快捷地展现您脑海里的画卷 Ai绘画生成 2025年06月05日 44 点赞 0 评论 767 浏览
一知智能芽势AI数字人 一知智能芽势AI数字人,打造视频运营新模式, 定制数字人专属IP,告别拍摄难题,让创意灵感快速照进现实,创造无限商业价值。 AI服务商 2025年06月05日 27 点赞 0 评论 767 浏览
STranslate STranslate是一款面向Windows用户的多功能翻译和OCR工具,支持多种语言翻译,包括划词、截图和监听剪贴板等多种方式,并集成了多家翻译服务接口。它还具备基于PaddleOCR技术的离线OCR功能,支持中文、英文、日文和韩文的识别。此外,该工具还具备快捷键操作、历史记录和在线升级等功能,是提高工作效率的理想工具。 AI项目与工具 2025年06月12日 10 点赞 0 评论 767 浏览
Alpha3D Alpha3D是一款无需3D建模经验的人工智能驱动工具,可将2D图像或文本描述快速转化为3D模型。它支持游戏开发、虚拟现实、增强现实及元宇宙等领域的应用,具备文本到3D、2D到3D模型生成等功能,并可与NVIDIA Omniverse集成,提供从免费到企业级的多种订阅方案。 AI项目与工具 2025年06月12日 48 点赞 0 评论 766 浏览
YouDub 一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。 Ai开源项目 2025年06月05日 89 点赞 0 评论 766 浏览
GPTBots AI GPTBots是一个无需编写代码就能构建AI Agent的平台。它整合了像Deepseek这类国际上主流的大语言模型,还配备了基于RAG的知识存储与检索功能、工 AI服务商 2025年06月05日 80 点赞 0 评论 766 浏览