工具 - 智狐AI导航

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型，融合视觉与听觉信息，具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练，采用动态权重调整机制，支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域，具备良好的可扩展性和灵活性。

AI项目与工具 2025年06月12日 92 点赞 0 评论 836 浏览

ViDoRAG

ViDoRAG是阿里巴巴通义实验室联合高校开发的视觉文档检索增强生成框架，采用多智能体协作与动态迭代推理技术，提升复杂文档的检索与理解能力。通过高斯混合模型优化多模态信息整合，支持精准检索与高质量生成，适用于教育、金融、医疗等多个领域，显著提升文档处理效率与准确性。

AI项目与工具 2025年06月12日 26 点赞 0 评论 771 浏览

Shandu

Shandu 是一款基于 LangChain 和 LangGraph 技术的开源 AI 研究自动化工具，支持多引擎搜索、递归探索和智能网页爬取，能自动生成结构化研究报告。用户可通过命令行输入主题并设置参数，快速输出包含引用的 Markdown 格式文档。适用于学术研究、市场分析、技术探索及教育等多个领域，具备高度灵活性和信息处理能力。

AI项目与工具 2025年06月12日 79 点赞 0 评论 566 浏览

Jobscan

Jobscan 是一款专注于简历优化的 AI 工具，主要功能包括 ATS 匹配分析、关键词优化、简历生成和 LinkedIn 优化。它帮助求职者提升简历通过招聘系统的概率，并提供实时编辑建议。适用于求职准备、简历调整及职业发展等多个场景，支持免费和付费版本，满足不同用户需求。

AI项目与工具 2025年06月12日 98 点赞 0 评论 736 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 710 浏览

Microsoft Dragon Copilot

Microsoft Dragon Copilot 是一款专为医疗行业设计的AI语音助手，结合语音识别与环境感知技术，支持多语言语音输入、自动化任务处理、信息检索等功能。旨在提升临床文档效率、减轻医护人员负担，并优化医疗服务流程。适用于医生、护士、行政人员及其他医疗团队成员，提升工作效率与患者体验。

AI项目与工具 2025年06月12日 57 点赞 0 评论 971 浏览

CogView4

CogView4是一款由智谱推出的开源文生图模型，具有60亿参数，支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异，达到当前开源模型的领先水平。模型具备强大的语义理解能力，尤其在中文文字生成方面表现突出，适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer，并采用显存优化技术提升推理效率。

AI项目与工具 2025年06月12日 83 点赞 0 评论 806 浏览

Probly

Probly 是一款集电子表格与 Python 数据分析功能于一体的 AI 工具，支持在浏览器中运行 Python 代码，实现数据处理、可视化和智能分析。用户可通过自然语言提问获取分析结果，操作简便且保障隐私安全，适用于数据分析、教育、科研及个人数据管理等场景。

AI项目与工具 2025年06月12日 61 点赞 0 评论 597 浏览

MiniMind

MiniMind 是一款轻量级开源语言模型项目，具备极低的训练成本和高效的训练流程。其最小模型仅需 25.8M 参数，可在普通 GPU 上运行，支持多模态能力，如视觉语言模型 MiniMind-V。项目提供完整的训练代码，涵盖预训练、微调、LoRA、DPO 和模型蒸馏，兼容主流框架，适合初学者和开发者快速上手并应用于多个领域。

AI项目与工具 2025年06月12日 77 点赞 0 评论 815 浏览

Sourcetable

Sourcetable 是一款基于AI的电子表格与数据分析工具，支持数据清理、公式生成、图表创建、实时同步及自然语言交互。具备超过500种公式支持，可自动生成SQL查询与数据报告，适用于财务、市场、科研等多场景，提升数据处理效率与协作能力。

AI项目与工具 2025年06月12日 46 点赞 0 评论 998 浏览

工具

首页

工具

列表

默认

浏览次数

发布日期