模型 - 智狐AI导航

CogVideo

目前最大的通用领域文本生成视频预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。

Ai平台模型 2025年06月05日 16 点赞 0 评论 716 浏览

Paper2Coder

Paper2Code是一款由韩国科学技术院与DeepAuto.ai联合开发的AI工具，基于多Agent大语言模型，能够将机器学习论文自动转换为可运行的代码仓库。其核心流程包括规划、分析和代码生成三个阶段，确保生成的代码结构清晰、逻辑严谨，并忠实于原始论文。该工具显著提升了研究复现效率，适用于学术研究、教学、工业应用等多个场景，是推动AI研究落地的重要工具。

AI项目与工具 2025年06月11日 91 点赞 0 评论 715 浏览

TheoremExplainAgent

TheoremExplainAgent（TEA）是一款基于多模态技术的AI工具，可生成超过5分钟的数学与科学定理解释视频，涵盖多个STEM领域。它结合文本、动画和语音，提升抽象概念的理解效果，并具备自动错误诊断功能。通过TheoremExplainBench基准评估，TEA在准确性、逻辑性和视觉表现上均表现优异，适用于在线教育、课堂教学和学术研究等多种场景。

AI项目与工具 2025年06月12日 13 点赞 0 评论 715 浏览

360gpt2

360gpt2-o1是一款专注于数学与逻辑推理的人工智能大模型，具备强大的推理能力和深度学习能力。它通过合成数据优化、分阶段训练及“慢思考”范式提升了模型的表现，尤其在数学竞赛和基础数学评测中成绩显著。此外，模型还支持编程问题解决、复杂问题分析及教育领域应用，为企业决策提供逻辑支持。

AI项目与工具 2025年06月12日 62 点赞 0 评论 715 浏览

MarDini

MarDini是一款融合掩码自回归（MAR）和扩散模型（DM）的先进视频生成工具，支持视频插值、图像到视频生成、视频扩展等多种任务。它通过优化计算资源分配，提高了视频生成的效率与灵活性，并具备从无标签数据中进行端到端训练的能力，展现出强大的可扩展性与效率。

AI项目与工具 2025年06月12日 44 点赞 0 评论 715 浏览

DiffusionGPT

DiffusionGPT是一款基于大型语言模型的开源文本到图像生成系统，由字节跳动与中山大学联合开发。它采用思维树和优势数据库技术，能够解析和处理多样化的文本提示，生成高质量图像。系统通过多模型的选择与集成、基于人类反馈的优化以及高效的图像生成执行，实现了从文本到图像的无缝转换。DiffusionGPT适用于多种应用场景，具有广泛适用性和灵活性。

AI项目与工具 2024年01月01日 93 点赞 0 评论 715 浏览

MiniRAG

MiniRAG是由香港大学开发的检索增强生成（RAG）系统，专为资源受限环境下的小型语言模型（SLMs）优化。其核心在于语义感知的异构图索引和轻量级拓扑增强检索方法，能够在降低存储需求的同时实现高性能知识检索与推理。该工具适用于即时通讯、个人内容管理、本地文档检索及隐私敏感场景，具备良好的适应性和实用性，为边缘计算和低功耗设备提供高效解决方案。

AI项目与工具 2025年06月12日 79 点赞 0 评论 715 浏览

SongGen

SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型，能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出，可分别生成人声与伴奏，便于后期编辑。SongGen通过创新的音频标记化和训练策略，显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准，适用于音乐创作、视频配乐、教育辅助等多个领域。

AI项目与工具 2025年06月12日 78 点赞 0 评论 715 浏览

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具，结合3D人体重建与扩散模型技术，支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力，适用于游戏、影视、体育及时尚等领域，具备高保真度与真实感。

AI项目与工具 2025年06月12日 36 点赞 0 评论 715 浏览

云趣AI助手

一款由羽夜科技团队推出的AIGC一站式服务平台，为用户提供丰富的包括ChatGPT、Midjourney等AI服务。

Ai办公效率 2025年06月05日 38 点赞 0 评论 714 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期