研究

MedGemma

MedGemma是谷歌推出的开源AI模型,专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告,27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署,适用于医疗诊断、患者分诊、临床决策辅助等场景,提升医疗服务效率与准确性。

Finseo.ai

Finseo.ai是一款面向金融行业的AI内容创作与SEO优化工具,支持生成文章、图片和图表,并提供关键词分析、SEO优化及可见性监控等功能。它能理解金融领域的专业术语和法规,帮助用户提升内容质量与搜索排名,适用于金融机构、金融科技公司及金融顾问等场景。

YuLan

YuLan-OneSim是一款基于大型语言模型的社会模拟工具,支持自然语言交互构建模拟场景,无需编程即可生成代码。提供50多个社会科学领域预设场景,支持大规模智能体模拟,具备自动优化和报告生成能力,适用于经济、社会学、政治学等多个研究领域,推动AI与社会科学的融合应用。

Minion Agent

Minion Agent 是一款基于代理框架的多功能 AI 工具,支持浏览器操作、MCP 协议、自动规划和深度研究等功能。用户可通过简单 API 快速部署,实现信息检索、数据分析等任务。其动态规划机制确保任务高效执行,同时支持多种模型和灵活配置,适用于信息研究、自动化任务、智能助手开发等多个场景。

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

DeckSpeed

DeckSpeed是一款基于AI的智能演示文稿生成工具,通过自然语言交互实现个性化内容创作。用户可实时调整设计元素,无需依赖模板,提升制作效率与灵活性。适用于商业、教育、学术、产品推广等多个领域,满足多样化的演示需求。

PixelHacker

PixelHacker是一款由华中科技大学与VIVO AI Lab联合开发的图像修复模型,采用潜在类别引导机制,通过线性注意力实现结构与语义一致性的高质量修复。基于大规模数据集训练并经过多基准微调,支持多种图像类型与分辨率。适用于照片修复、对象移除、艺术创作、医学影像及文化保护等领域。

WebThinker

WebThinker是一款由多家科研机构联合开发的AI工具,旨在增强大型推理模型在复杂任务中的表现。它支持自主搜索、网页导航与实时报告生成,结合深度网页探索器和强化学习策略,提升信息获取与内容创作的效率与质量。适用于科学研究、数据分析、教育辅助等多种场景,显著增强了模型在知识密集型任务中的可靠性与实用性。

DeerFlow

DeerFlow 是字节跳动推出的开源研究框架,结合语言模型与多种工具,支持高效完成复杂研究任务。具备多Agent架构,支持自然语言交互与智能协作,适用于研究报告、播客、演示文稿等内容生成。支持多种语言模型和外部工具集成,提供灵活配置与扩展能力,广泛应用于学术、市场、教育及个人知识管理等领域。

Paper2Coder

Paper2Code是一款由韩国科学技术院与DeepAuto.ai联合开发的AI工具,基于多Agent大语言模型,能够将机器学习论文自动转换为可运行的代码仓库。其核心流程包括规划、分析和代码生成三个阶段,确保生成的代码结构清晰、逻辑严谨,并忠实于原始论文。该工具显著提升了研究复现效率,适用于学术研究、教学、工业应用等多个场景,是推动AI研究落地的重要工具。