多模态 - 智狐AI导航

Aria

Aria是首个开源多模态原生混合专家（MoE）模型，支持文本、代码、图像和视频的综合处理，具有强大的多模态任务处理能力和长上下文窗口，可高效应对复杂长数据。模型开源且可扩展，适用于多模态AI领域的研究与应用。

AI项目与工具 2025年06月12日 48 点赞 0 评论 599 浏览

Jina AI

一家一家专注于神经搜索技术的商业开源软件公司，Jina AI致力于通过深度学习技术简化非结构化数据的搜索，提供高效、准确的搜索解决方案。

AI搜索问答 2025年06月05日 80 点赞 0 评论 599 浏览

Augment Code

一家专注于为大型代码库提供AI编程辅助工具的公司，通过上下文感知开发、个性化代码补全、跨文件编辑等功能，帮助开发团队提升效率，特别是擅长处理复杂代码库的维护和重构。

Ai编程建站 2025年06月05日 59 点赞 0 评论 598 浏览

LangBot

LangBot 是一款开源的多平台即时通讯机器人，支持多种主流通信工具及大语言模型。具备多模态交互、多轮对话、插件扩展和安全管理等功能，适用于企业客服、个人助理、社区管理、教育辅导和内容创作等场景，提供灵活、安全的自动化服务。

AI项目与工具 2025年06月12日 18 点赞 0 评论 597 浏览

Fluig

Fluig 是一款基于 AI 的图表生成工具，可将文字、文档或代码快速转化为多种专业图表，如思维导图、流程图等。支持多模态输入和智能格式转换，操作简便，适合无设计背景的用户使用。提供实时协作功能，适用于教育、商业、研究等多个场景，提升信息可视化与团队协作效率。

AI项目与工具 2025年06月11日 35 点赞 0 评论 597 浏览

Paper2Poster是由加拿大滑铁卢大学、新加坡国立大学等机构推出的学术框架，基于多模态自动化技术从科学论文生成海报。它通过Parser、Planner和Painter–Commenter系统实现内容压缩、布局优化和视觉质量提升，支持将长篇论文转化为结构化视觉海报。Paper2Poster引入PaperQuiz评估方法，确保海报有效传达核心内容，提高生成效率，适用于学术会议、报告、科研展示及教

AI项目与工具 2025年06月11日 34 点赞 0 评论 597 浏览

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型，支持文本到视频和图像到视频的转换，生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架，适用于广告、教育、影视等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 595 浏览

万兴天幕大模型

万兴天幕大模型是万兴科技AILab的创新成果，展现了其在多媒体领域的深厚技术积累和前瞻性布局。通过自研技术和多年行业经验，天幕大模型为全球创作者提供了一个强大的工具，以实现...

创作工具 2026年06月22日 0 点赞 0 评论 595 浏览

OpenAI o1模型

OpenAI的最新推理系列AI大模型“Strawberry”，包括“o1-preview”和成本较低的“o1 mini”版本。该模型通过强化学习训练，具备复杂的推理能力和多模态理解能力。它采用了“思维链”机制，增强推理透明度，具备自我纠错功能。在国际数学奥林匹克等基准测试中表现出色，展现出强大的性能。设计时考虑了安全性、可靠性和成本效率。 ---

AI项目与工具 2025年06月12日 14 点赞 0 评论 594 浏览

MMSearch

MMSearch 是一款用于评估大型多模态模型（LMMs）搜索能力的基准测试工具，包含 MMSearch-Engine 框架和 MMSearch 测试集。其核心功能包括问题重构、网页排序和答案总结，通过多模态搜索能力评估提升 LMMs 的性能。实验结果显示 GPT-4o 在该测试中表现优异，且增加计算量比扩大模型规模更具优势。

AI项目与工具 2025年06月12日 44 点赞 0 评论 594 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期