工具

雁阵

一款以甘特图为核心的项目管理软件,以可视化的形式为用户提供专业的项目管理软件服务。

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

OceanDoc

OceanDoc是科大讯飞推出的AI智能办公工具,基于大语言模型和自然语言处理技术,可自动将文本转化为高质量PPT幻灯片,并提供设计建议、多语言翻译、语音控制、AI图像生成等功能。适用于办公、教育、企业等多种场景,简化演示文稿制作流程,提升效率与专业性。

UI

UI-TARS是由字节跳动开发的图形用户界面代理模型,支持通过自然语言实现桌面、移动端和网页的自动化交互。具备多模态感知、跨平台操作、视觉识别、任务规划与记忆管理等功能,适用于自动化任务执行和复杂交互场景。支持云端与本地部署,提供丰富的开发接口,便于集成与扩展。

AI Meeting Notes

AI Meeting Notes 是 Notion 提供的智能会议记录工具,支持实时转录、自动生成会议摘要、提取行动项及团队协作。用户可通过快捷键或日历集成快速启动,支持多设备同步和多语言使用,提升会议管理效率与信息整理能力。

TestSprite

TestSprite 是一款基于 AI 的自动化测试平台,支持后端 API、前端 UI、数据及 AI 模型的测试,能够自动生成测试计划、执行测试并输出详细报告。其核心优势在于提升测试效率、减少人工干预,并适用于多种测试场景,如软件发布前验证、CI/CD 集成、生产环境监控等,帮助企业提升软件质量与交付速度。

TinyWow

AI的实用工具,使你的生活更容...

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型,可在空间结构差异较大的场景下实现精准动作迁移,并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取(FAE),有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域,具有良好的应用前景。

Agent Laboratory

Agent Laboratory是由AMD与约翰·霍普金斯大学合作开发的基于大型语言模型的研究辅助工具,支持从文献综述到报告撰写的全流程科研任务。它具备实验设计、代码生成、结果分析等功能,并通过多代理协作和用户反馈机制提升研究质量。实验表明其可显著降低研究成本,适用于机器学习、生物医学等多个领域。

Rabbithole

Rabbithole 是一款基于AI的互动式知识探索工具,通过自然语言对话帮助用户深入了解历史事件和主题。平台支持对话记录保存、个性化内容推荐以及多样化的历史话题库,适用于历史爱好者、学生、教师及研究人员等多种用户群体,提升学习效率与知识获取深度。