AI

olmOCR

olmOCR 是一款开源 PDF 文档处理工具,结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型,可高效提取结构化文本并保留原始布局。支持多种文档类型,具备大规模批量处理能力和低成本优势,适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

Wordvice AI

一款先进的线上英语语法检查,文章改写润色工具,旨在增强写作过程,可为您自动检测文本各类英文语言使用错误,完成准确高效的英文校对,高效改善英文文本可读性。

Manifest

Manifest是一款基于AI技术的心理健康应用程序,主要功能包括个性化对话、即时支持以及定制化冥想课程等。它通过转化用户语言为积极表述并提供音频冥想等方式,帮助用户管理情绪、增强心理韧性,同时适用于日常压力管理、情绪调节、睡前放松及社交技能提升等多个场景。尽管不能完全取代专业心理咨询,但它是一个便捷且经济的选择,适合希望改善心理状态的人群使用。

RemoveWaterMark

一种人工智能驱动的工具,旨在有效地去除图像和视频中的水印。它利用先进的算法来确保干净无缝的去除。

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集,包含41.25小时高质量语音,覆盖全国22个省市。数据通过家长引导式对话采集,保证自然真实。该数据集支持语音识别、说话人验证和语言研究,适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域,为儿童语音技术研究提供重要资源。

视界一粟YiSu

北京极佳视界科技有限公司联合清华大学自动化系共同发布的Sora级视频生成大模型。

AbletonMCP

AbletonMCP 是一个开源工具,通过模型上下文协议(MCP)将 Ableton Live 与 Claude AI 连接,实现音乐制作过程中的 AI 辅助。支持双向通信,允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信,适用于音乐创作、实时制作、教学及音频后期处理等多种场景。

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架,通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式,减少重复计算,支持跨应用复杂任务。基于视觉识别,无需API即可通用操作,适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异,为智能代理技术提供新思路。

Neo

Neo-1 是 VantAI 开发的全球首个整合从头分子生成与原子级结构预测的 AI 模型,支持多模态输入,提升药物设计效率与准确性。该模型基于大规模训练和定制数据集,具备精准生成分子和预测结构的能力,适用于分子胶设计、蛋白质复合物预测及抗体发现等多个领域,推动结构生物学发展。

Coral AI

Coral AI 是一款基于 AI 的文档分析平台,专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言,适用于学术研究、法律分析和商业报告等场景,特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等,并支持多种文件类型和图像分析。