导航

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。

Spatial

Spatial-RAG是一种用于增强大型语言模型空间推理能力的框架,融合了稀疏空间检索与密集语义检索技术。它通过多目标优化策略平衡空间约束与语义相关性,生成准确、连贯的自然语言回答。该工具可应用于旅游推荐、智能导航、城市规划、地理问答和物流配送等多个领域,提升了空间数据处理的智能化水平。

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型,具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障,并根据自然语言指令识别和跟踪目标对象。无需提前建图,适用于多种场景,如陪伴服务、安防巡逻、物流配送等,为具身智能商业化提供支撑,推动机器人走向日常生活。

极刻AI搜

一站式的AI聚合搜索引擎工具,囊括了互联网上比较好用的一些支持“搜索”的网站或工具,包括AI搜索、常规搜索、学术搜索、社交搜索等多种搜索类型。

Hao123影视

Hao123影视大全为您提供最近好看的电视剧、电影、动漫、综艺节目推荐和排行榜并可在线免费观看,网站分为电视剧、电影、综艺、脱口秀、网络、自制搞笑、少儿、纪录片、视频名站等内容。

AIL

发现最新的人工智能工具、服务、资源,来帮助你完成工作