多模态 - 智狐AI导航

TheoremExplainAgent

TheoremExplainAgent（TEA）是一款基于多模态技术的AI工具，可生成超过5分钟的数学与科学定理解释视频，涵盖多个STEM领域。它结合文本、动画和语音，提升抽象概念的理解效果，并具备自动错误诊断功能。通过TheoremExplainBench基准评估，TEA在准确性、逻辑性和视觉表现上均表现优异，适用于在线教育、课堂教学和学术研究等多种场景。

AI项目与工具 2025年06月12日 13 点赞 0 评论 708 浏览

Oumi

Oumi 是一个开源 AI 平台，支持从数据准备到模型部署的全流程开发。它提供零样板代码体验，支持多种训练方法和多模态模型，适用于自动驾驶、人机交互、学术研究等多个场景。平台具备高效的分布式训练能力和灵活的部署选项，适合企业和研究机构使用。

AI项目与工具 2025年06月12日 26 点赞 0 评论 711 浏览

法大猫

法大猫，AI法律顾问服务平台，您的随身AI法律顾问。

AI服务商 2025年06月05日 77 点赞 0 评论 712 浏览

孟子大模型

孟子大模型作为澜舟科技的核心产品之一，展现了公司在认知智能领域的技术实力和创新能力。通过其强大的语言处理和多模态数据处理能力，孟子大模型为不同行业提供了灵活、高效的解...

创作工具 2026年06月22日 0 点赞 0 评论 714 浏览

CogVideo

目前最大的通用领域文本生成视频预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。

Ai平台模型 2025年06月05日 16 点赞 0 评论 714 浏览

九歌

九歌是清华大学研发的AI诗歌生成系统，基于深度学习技术，可生成符合古诗格律的多种体裁作品。支持关键词、文本及图片输入，操作便捷，无需登录即可使用。适用于诗词创作辅助、文化教育、艺术融合及个人娱乐等多个场景，助力中华传统文化的传承与创新。

AI项目与工具 2025年06月11日 73 点赞 0 评论 715 浏览

PySpur

PySpur 是一款开源的轻量级可视化 AI 工作流构建工具，支持拖拽式界面，帮助用户快速构建、测试和迭代 AI 应用，无需编写复杂代码。其功能包括循环与记忆、文件处理、结构化输出、RAG 技术、多模态数据支持及与多个平台的集成。适用于智能对话系统、自动化任务管理、多模态数据分析等场景，适合非技术人员和开发者使用。

AI项目与工具 2025年06月12日 28 点赞 0 评论 715 浏览

讯飞星火PC版

讯飞星火PC版是科大讯飞推出的一款桌面级AI工具，集成了强大的跨领域知识理解和语言处理能力。它支持自然对话方式，涵盖写作、搜索、问答、翻译、PPT生成、图像生成等功能，并新增了深度搜索与多模态交互能力，可广泛应用于办公、教育、内容创作和技术开发等领域，提供高效便捷的智能服务。

AI项目与工具 2024年10月29日 65 点赞 0 评论 716 浏览

Janus

Janus是一种由DeepSeek AI开发的自回归框架，专注于多模态理解和生成任务的统一化。它通过分离视觉编码路径并使用单一Transformer架构来提升灵活性和性能，支持多种输入模态如图像、文本等，并在某些任务中表现出色。Janus具备多模态理解、图像生成及跨模态交互能力，适用于图像创作、自动标注、视觉问答等多个领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 716 浏览

FlexRAG

FlexRAG 是一个高效的检索增强生成（RAG）框架，通过压缩编码器和选择性压缩机制优化长上下文处理，提升计算效率与生成质量。支持多模态数据、多种检索器和多数据类型，适用于开放域问答、对话系统、文档摘要等知识密集型任务，具备灵活配置和可扩展性。

AI项目与工具 2025年06月12日 69 点赞 0 评论 716 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期