导航

韵影

韵影提供了一种高效、低成本的商业拍摄解决方案。

大同搜索

大同搜索是一个提供网页搜索和翻译服务的工具,它可以帮助用户快速找到并理解不同语言的网页内容。通过大同搜索,用户可以跨越语言障碍,获取全球信息。

ScreenAI

ScreenAI是一款专为理解和处理用户界面(UI)及信息图表而设计的AI视觉语言模型。它能够识别和理解UI元素及其相互关系,并生成与屏幕UI元素相关的文本,如问题回答、UI导航指令和内容摘要。ScreenAI通过多模态编码器结合视觉和语言信息,并采用自回归解码器生成自然语言响应。此外,ScreenAI还能适应不同屏幕格式,提供精确的UI导航和内容摘要功能。

Agent Q

Agent Q是一种自监督代理推理和搜索框架,结合了引导式蒙特卡洛树搜索(MCTS)、AI自我批评及直接偏好优化(DPO)等技术。该框架通过迭代微调和基于人类反馈的强化学习进行自我改进,在网页导航和多步任务执行中表现优异。Agent Q的主要功能包括引导式搜索、自我批评、迭代微调、多步推理任务和零样本学习。它在电子商务、在线预订服务、软件开发、客户服务、数据分析和个性化推荐等领域具有广泛应用前景。

Chatbit

Chatbit 是一款专为网站设计的 AI 聊天机器人平台,旨在增强用户互动、自动应答问题并收集潜在客户信息。该平台支持自定义数据源,允许用户上传大量文本和文件来优化机器人的响应能力。Chatbit 提供多种个性化设置选项,包括外观和交流风格,同时具备自动收集潜在客户信息的功能。用户能够快速创建并部署聊天机器人,从而显著提升网站用户体验和运营效率。

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。

olly.bot

Olly.bot 是一款基于 OpenAI 技术的多合一 AI 助手,集成于 iMessage 和 SMS 平台,支持网络搜索、文档分析、图片生成等功能。它无需注册或下载,保护用户隐私,适用于多个操作系统。其核心功能包括任务管理、信息查询、文档分析及创意辅助,广泛应用于日常信息查询、学术研究、工作效率提升及创意工作等领域。

MSQA

MSQA是一个包含251,000个问答对的大规模多模态情境推理数据集,支持文本、图像和点云等多种数据形式,旨在提升具身AI在三维场景中的理解与推理能力。通过设计MSQA和MSNN两个基准测试任务,该工具不仅能够评估模型性能,还能促进具身AI和3D场景理解领域的研究进展。同时,它为开发更强大的情境推理模型提供了丰富的预训练资源。

桐小乌

桐小乌是一款由桐乡市政府与支付宝合作开发的AI智能助手,专为2024年世界互联网大会参会者及乌镇游客设计。它集成了会议日程查询、展区导航、景点讲解、餐饮住宿推荐等功能,并支持租借服务和AI伴游体验。通过支付宝“碰一下”、首页下拉或支小宝APP访问,用户可享受个性化服务和实时信息推送,助力高效便捷的会务与旅行体验。