深度学习 - 智狐AI导航

微软VASA

微软亚洲研究院开发的一种前沿人工智能技术，VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。

Ai视频生成 2025年06月05日 67 点赞 0 评论 762 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 762 浏览

GenieArt

一个基于深度学习的AI文本到图像生成模型，GenieArt主要用于生成以文本描述为条件的详细图像和插画。在这里您可以享受低门槛地创作，所想即所得，方便快捷地展现您脑海里的画卷

Ai绘画生成 2025年06月05日 44 点赞 0 评论 764 浏览

PixVerse V4

PixVerse V4 是一款基于 AI 的视频生成工具，支持通过文本或图片快速生成高质量视频，最快仅需 5 秒。具备音效生成、人声配音、视频风格转换等功能，适用于多种创作场景。其在语义理解、物理表现和特效处理方面有显著提升，适合个人创作、广告营销、教育及影视娱乐等领域使用。

AI项目与工具 2025年06月12日 97 点赞 0 评论 764 浏览

STranslate

STranslate是一款面向Windows用户的多功能翻译和OCR工具，支持多种语言翻译，包括划词、截图和监听剪贴板等多种方式，并集成了多家翻译服务接口。它还具备基于PaddleOCR技术的离线OCR功能，支持中文、英文、日文和韩文的识别。此外，该工具还具备快捷键操作、历史记录和在线升级等功能，是提高工作效率的理想工具。

AI项目与工具 2025年06月12日 10 点赞 0 评论 764 浏览

OpenBioMed

OpenBioMed是由清华大学智能产业研究院与水木分子联合开发的开源平台，专注于AI在生物医学中的应用。它支持多模态数据处理，涵盖分子、蛋白质、单细胞等多种类型，并提供20多个深度学习模型和计算工具，适用于药物研发、精准医疗、知识图谱构建等领域。平台具备统一的数据处理框架和预训练模型，支持快速迁移和智能体设计，助力科研人员提升研究效率。

AI项目与工具 2025年06月12日 45 点赞 0 评论 764 浏览

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段，生成高度可控且逼真的动画，保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异，适用于虚拟现实、游戏、人机交互等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 765 浏览

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 766 浏览

AnimePro FLUX

AnimePro FLUX是一款基于Flux模型优化的动漫风格图像生成工具，支持高质量二次元插画创作。它具备灵活的生成步数控制、高效的硬件兼容性以及出色的细节和色彩表现，广泛应用于艺术创作、游戏开发、动画制作及教育等领域。

AI项目与工具 2025年06月12日 16 点赞 0 评论 766 浏览

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法，专注于提升AI生成视频的质量，特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化，无需额外训练即可高效提升视频效果，适用于视频创作、学术研究、在线平台等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 768 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期