深度学习 - 智狐AI导航

Hi3DGen

Hi3DGen是由多所高校与企业联合开发的高保真3D几何生成框架，可从2D图像生成具有丰富细节的3D模型。其核心技术包括图像到法线估计、法线到几何学习及3D数据合成，采用两阶段生成流程并结合3D高斯散射与SDF重建技术，提升模型精度与细节表现。适用于游戏开发、影视制作、3D可视化等多个领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 712 浏览

Etna

是由七火山科技开发的一个平...

Ai视频生成 2026年06月21日 0 点赞 0 评论 713 浏览

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型，专注于将美国手语（ASL）实时翻译成英语文本。通过多模态训练方法，结合视觉和文本数据，实现高准确率和低延迟的翻译，响应时间低于0.5秒。支持端侧部署，保护用户隐私，适用于教育、医疗和公共服务等场景。

AI项目与工具 2025年06月11日 24 点赞 0 评论 713 浏览

CogVideo

目前最大的通用领域文本生成视频预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。

Ai平台模型 2025年06月05日 16 点赞 0 评论 714 浏览

九歌

九歌是清华大学研发的AI诗歌生成系统，基于深度学习技术，可生成符合古诗格律的多种体裁作品。支持关键词、文本及图片输入，操作便捷，无需登录即可使用。适用于诗词创作辅助、文化教育、艺术融合及个人娱乐等多个场景，助力中华传统文化的传承与创新。

AI项目与工具 2025年06月11日 73 点赞 0 评论 715 浏览

MT

MT-MegatronLM 是摩尔线程推出的开源混合并行训练框架，支持密集模型、多模态模型和 MoE 模型的高效训练。采用 FP8 混合精度、高性能算子库和集合通信库，提升 GPU 集群算力利用率。通过模型并行、数据并行和流水线并行技术，实现大规模语言模型的高效分布式训练，适用于科研、企业及定制化 AI 应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 717 浏览

Open Code Reasoning

Open Code Reasoning（OCR）是英伟达推出的开源代码推理AI模型，基于Nemotron架构设计，支持多种编程语言。它具备代码生成、逻辑补全、多语言处理及高效推理能力，适用于代码优化、教育、测试等多个场景。OCR提供32B、14B和7B三种参数版本，满足不同计算需求，并与主流框架兼容，具有良好的扩展性。

AI项目与工具 2025年06月11日 10 点赞 0 评论 717 浏览

I2V3D

I2V3D是一款由香港城市大学与微软GenAI合作开发的图像到视频生成工具，支持将静态图像转换为高质量动态视频。其核心在于结合传统CG管线与生成式AI技术，采用两阶段生成流程实现精准的3D动画控制，支持复杂场景编辑和灵活的视频生成，适用于动画制作、视频创作及教育等多个领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 717 浏览

Project Turntable

Project Turntable是一款由Adobe发布的AI工具，支持用户在三维空间中旋转二维矢量图像，并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率，减少了重复性劳动，适用于平面设计、插画创作、动画制作及游戏开发等领域，同时保持了图像的二维特性和平滑过渡效果。

AI项目与工具 2025年06月12日 92 点赞 0 评论 718 浏览

Desearch

Desearch是一款面向深度研究与智能分析的平台，提供普通、深度和专家三种研究模式，满足不同场景下的信息获取与分析需求。其核心功能包括智能框架生成、图表可视化、海量案例库及深度内容生成，适用于金融、科技、社会、文化等多个领域。平台能够提升研究效率，支持复杂课题的系统性分析与成果展示。

AI项目与工具 2025年06月11日 48 点赞 0 评论 718 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期