自动化

Browser Use

Browser Use是一款基于大语言模型的智能浏览器工具,支持多标签页管理和视觉识别,可提取网页内容并记录操作步骤。它允许开发者自定义动作,如保存文件或推送至数据库,并兼容多种主流LLM模型,具备并行运行和自我修正能力,旨在提升任务执行效率与准确性。

腾讯元器

腾讯元器是一款基于腾讯混元大模型的AI智能体创作与分发平台,提供低代码或无代码的智能体开发环境,覆盖多种业务场景和功能。它通过智能体商店、工作流模式、腾讯生态集成等功能,简化了智能体的创建、部署和分发过程,支持一键分发至腾讯的多平台渠道,适用于客服、教育、金融、法律等多个行业。

Seer

Seer是一款由多家科研机构联合开发的端到端机器人操作模型,基于Transformer架构实现视觉预测与动作执行的高度协同。它能够融合多模态信息,具备强大的泛化能力和数据效率,在真实机器人任务中表现优异。Seer适用于工业自动化、服务机器人、医疗健康等多个领域,支持精准动作预测和未来状态预判,显著提升了机器人系统的智能化水平。

扣子空间

扣子空间是由字节跳动推出的AI Agent平台,支持用户通过可视化界面快速构建和管理AI应用,无需编程基础。平台集成60余款MCP插件,涵盖资讯、出行、办公等功能,提供探索与规划两种协作模式,适应不同任务需求。用户可将开发的Bot发布至微信、飞书等平台,也可自定义插件扩展功能。适用于商品推荐、播客制作、智能协作等多种场景,具备良好的扩展性与实用性。

KuaiMod

KuaiMod 是快手开发的多模态大模型内容审核系统,能高效识别和过滤有害及低质量视频。它结合视觉语言模型(VLM)和链式推理(CoT)技术,支持动态策略更新和强化学习,提升审核准确性。系统在离线测试中准确率达92.4%,有效降低用户举报率,优化推荐体验,助力平台内容生态健康发展。

GR00T N1

GR00T N1 是英伟达推出的开源人形机器人基础模型,支持多模态输入并具备复杂任务执行能力。采用双系统架构,结合视觉-语言模型与扩散变换器,实现精准动作控制。基于大规模数据训练,适应多种机器人形态和任务场景,广泛应用于物流、制造、医疗等领域,提升自动化水平与操作效率。

LangManus

LangManus 是一款基于多智能体系统的 AI 自动化框架,支持多种语言模型和 API 接口,具备高效的网络与神经搜索能力。框架内含多种智能体协同工作,可完成任务分配、规划、执行与报告生成。支持代码编写与执行、任务可视化及实时监控,适用于人力资源、房产决策、旅行规划、内容创作和教育开发等多个领域。

Computer Use OOTB

Computer Use OOTB 是一款基于开源框架的 GUI 自动化工具,支持跨平台操作与远程控制,借助 Claude 3.5 Computer Use API 实现从用户指令到桌面操作的端到端自动化。其核心技术包括实时视觉信息处理、历史上下文维护及动态反馈机制,适用于远程办公、自动化测试、教育培训、家庭自动化及游戏辅助等多种场景。

如意 AI Stick

如意AI Stick是一款基于人工智能技术的桌面助手,集成了搜索、写作、聊天等多项功能。它通过豆包大模型实现精准的信息检索和多领域知识解答,支持个性化界面定制,并提供办公辅助、生活娱乐等多种智能服务,旨在提升用户的工作效率和生活便利性。

Powerpresent AI

快速启动您的演示,让AI自动构建专业演示文稿