多模态交互

LAM

LAM是由微软开发的大型行动模型，能够理解和执行真实世界中的操作任务。它不仅能解析用户输入，还能生成具体行动指令，如启动程序或控制设备。LAM在Office等Windows应用中表现出色，任务完成率高于GPT-4。具备多模态输入理解、动态规划、环境交互和自主执行能力，适用于办公自动化、智能家居、客户服务等多个场景，显著提升任务执行效率和智能化水平。

AI项目与工具 2025年06月12日 26 点赞 0 评论 815 浏览

CreatiLayout

CreatiLayout 是一种先进的布局到图像生成技术，由复旦大学与字节跳动联合开发。它基于大规模布局数据集 LayoutSAM，结合 SiamLayout 框架和 MM-DiT 架构，实现高质量、细粒度可控的图像生成。同时，其 LayoutDesigner 工具支持多种输入方式，帮助用户优化布局设计。适用于海报制作、室内设计、视觉创作及教学等多个领域。

AI项目与工具 2025年06月12日 56 点赞 0 评论 505 浏览

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统，基于增强型视频大型语言模型，实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准，支持对象识别、关系分析、推理预测及多模态交互等功能，适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 693 浏览

星火快答

星火快答是科大讯飞推出的AI智能交互系统，集成了虚拟人、语音识别、大数据分析等功能，适用于展厅、会议、营销等场景。支持多模态交互、知识问答、数据可视化与跨屏联动，提升信息传递效率与用户体验。

AI项目与工具 2025年06月12日 86 点赞 0 评论 542 浏览

LangBot

LangBot 是一款开源的多平台即时通讯机器人，支持多种主流通信工具及大语言模型。具备多模态交互、多轮对话、插件扩展和安全管理等功能，适用于企业客服、个人助理、社区管理、教育辅导和内容创作等场景，提供灵活、安全的自动化服务。

AI项目与工具 2025年06月12日 18 点赞 0 评论 596 浏览

AnythingLLM

AnythingLLM 是一款开源、多模态的 AI 客户端工具，支持文本、图像和音频输入，可将文档转化为上下文信息供语言模型使用。支持本地和云端部署，具备多用户管理、工作区隔离、丰富的文档格式支持和强大的 API 接口。适用于企业知识管理、学术研究、个人学习、内容创作等多种场景，保障数据隐私安全。

AI项目与工具 2025年06月12日 37 点赞 0 评论 677 浏览

Data Formulator

Data Formulator是由微软研究院开发的开源AI数据可视化工具，结合图形化界面与自然语言输入，支持复杂数据转换和图表迭代设计。用户可通过拖拽或指令创建可视化，AI自动处理数据转换和代码生成。具备数据验证、样式调整和多模态交互等功能，适用于数据分析、概念扩展及可视化优化场景。

AI项目与工具 2025年06月12日 73 点赞 0 评论 1217 浏览

《Manus没有秘密》70页PPT解读AI Agent（PDF文件）

本文详细解读了AI Agent技术从L1到L3的发展历程，涵盖了定义、实现原理、用户体验及未来趋势。文章以Manus为例，探讨了Agent技术的通用性、技术实现路径及用户感知变化，强调了提升通用性、性能和用户体验的重要性。同时，文章提出了对未来发展的期望和建议。

AI项目与工具 2025年06月12日 45 点赞 0 评论 859 浏览

Claude 3.7 Sonnet

Claude 3.7 Sonnet 是由 Anthropic 推出的混合推理模型，支持标准模式与扩展思考模式，适用于复杂任务处理和日常交互。其在数学、物理、编程等领域表现卓越，尤其在代码生成与理解方面领先。模型优化了安全性，减少误拒率，并支持多平台接入。适用于软件开发、前端设计、科学计算及企业自动化等多个场景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 778 浏览

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具，适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气，通过视频和音频反馈练习非语言沟通技巧，并获得个性化反馈以提升表达能力。支持多语言使用，可无限重试，便于反复练习。具备嵌入功能，方便集成到其他平台。

AI项目与工具 2025年06月12日 61 点赞 0 评论 583 浏览

多模态交互

首页

多模态交互

列表

默认

浏览次数

发布日期

LAM