深度学习 - 智狐AI导航

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段，生成高度可控且逼真的动画，保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异，适用于虚拟现实、游戏、人机交互等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 765 浏览

GenieArt

一个基于深度学习的AI文本到图像生成模型，GenieArt主要用于生成以文本描述为条件的详细图像和插画。在这里您可以享受低门槛地创作，所想即所得，方便快捷地展现您脑海里的画卷

Ai绘画生成 2025年06月05日 44 点赞 0 评论 765 浏览

STranslate

STranslate是一款面向Windows用户的多功能翻译和OCR工具，支持多种语言翻译，包括划词、截图和监听剪贴板等多种方式，并集成了多家翻译服务接口。它还具备基于PaddleOCR技术的离线OCR功能，支持中文、英文、日文和韩文的识别。此外，该工具还具备快捷键操作、历史记录和在线升级等功能，是提高工作效率的理想工具。

AI项目与工具 2025年06月12日 10 点赞 0 评论 765 浏览

PixVerse V4

PixVerse V4 是一款基于 AI 的视频生成工具，支持通过文本或图片快速生成高质量视频，最快仅需 5 秒。具备音效生成、人声配音、视频风格转换等功能，适用于多种创作场景。其在语义理解、物理表现和特效处理方面有显著提升，适合个人创作、广告营销、教育及影视娱乐等领域使用。

AI项目与工具 2025年06月12日 97 点赞 0 评论 764 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 764 浏览

OpenBioMed

OpenBioMed是由清华大学智能产业研究院与水木分子联合开发的开源平台，专注于AI在生物医学中的应用。它支持多模态数据处理，涵盖分子、蛋白质、单细胞等多种类型，并提供20多个深度学习模型和计算工具，适用于药物研发、精准医疗、知识图谱构建等领域。平台具备统一的数据处理框架和预训练模型，支持快速迁移和智能体设计，助力科研人员提升研究效率。

AI项目与工具 2025年06月12日 45 点赞 0 评论 764 浏览

Graphy

Graphy 是一款利用 AI 技术实现数据可视化的平台，能够自动创建图表并提供深度洞察。其核心功能包括一键增强图表、与 Google Sheets 集成以及支持团队协作。Graphy 适用于多种场景，如业务报告、市场营销、财务分析和教育培训，帮助用户高效传达数据背后的含义。

AI项目与工具 2025年06月12日 98 点赞 0 评论 763 浏览

Jodi

Jodi是由中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架，基于联合建模图像域和多个标签域，实现视觉生成与理解的统一。它支持联合生成、可控生成和图像感知三种任务，利用线性扩散Transformer和角色切换机制，提升生成效率和跨领域一致性。Jodi使用Joint-1.6M数据集进行训练，包含20万张高质量图像和7个视觉域标签，适用于创意内容生成、多模态数据增强、图像编辑与修复等场景。

AI项目与工具 2025年06月11日 32 点赞 0 评论 762 浏览

微软VASA

微软亚洲研究院开发的一种前沿人工智能技术，VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。

Ai视频生成 2025年06月05日 67 点赞 0 评论 762 浏览

讯飞星火

科大讯飞推出的新一代GPT人工智能模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。

Ai平台模型 2025年06月05日 86 点赞 0 评论 761 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期