自然语言

AutoAgent

AutoAgent是香港大学开发的零代码LLM智能体框架,支持自然语言交互创建智能助手,适用于搜索、分析和报告生成等场景。提供三种使用模式和双交互模式,兼容多种LLM模型,具备自管理向量数据库和多代理协作能力,部署便捷,适合各类用户高效完成复杂任务。

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型,具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障,并根据自然语言指令识别和跟踪目标对象。无需提前建图,适用于多种场景,如陪伴服务、安防巡逻、物流配送等,为具身智能商业化提供支撑,推动机器人走向日常生活。

Aisou.ai

Aisou.ai是一款基于大语言模型和检索增强生成技术的智能问答平台,专注于商业信息的高效查询与分析。它支持自然语言提问,提供精准的商业数据分析、实时资讯、竞争对手研究及市场趋势对比等功能,适用于市场分析、投资决策和企业信息查询等多种应用场景。

Voila

Voila是一款开源的端到端语音大模型,支持实时语音交互与多轮对话,具备高保真、低延迟的音频处理能力。集成语音与语言建模功能,支持百万级预设声音及个性化定制,适用于语音助手、角色扮演、语音翻译等场景。采用多尺度Transformer架构,提升语音理解与生成质量,降低开发成本,提高通用性与灵活性。

Ultravox

Ultravox 是一种多模态大型语言模型(LLM),能够直接处理文本和语音输入,无需额外的语音识别步骤。其核心技术包括多模态投影器,用于将音频数据转换为高维空间表示,显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习,适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

AI Code Converter

AICodeConvert是一个强大的工具,可以让用户轻松地生成或转换代码和自然语言为他们喜欢的编程语言。该工具利用人工智能技术提供代码生成和翻译功能,从而提高生产力。

Veo 2

Veo 2 是一款由 Google DeepMind 开发的 AI 视频生成工具,支持高达 4K 分辨率,可生成高质量视频并模拟物理现象及人类表情。它具备修复、外扩、插值等功能,广泛应用于电影制作、虚拟旅游、教育视频等领域,具有高精度和安全性。

Google Bard

Google 推出的一款对话式AI工具,Bard 可以帮助您完成各种任务,例如编写、编码、调试和解释代码。您还可以与 Bard 进行有趣的对话,探索它的创造力和幽默感。

ChatMax聚言

ChatMax聚言是一个利用大模型技术为企业解锁专家级数字员工的平台。它通过垂直行业模型,提供自然语言交互和易于使用的AI服务,满足不同工作流程的需求。