VoxInstruct VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。 AI项目与工具 2025年06月12日 79 点赞 0 评论 473 浏览
Spatial Spatial-RAG是一种用于增强大型语言模型空间推理能力的框架,融合了稀疏空间检索与密集语义检索技术。它通过多目标优化策略平衡空间约束与语义相关性,生成准确、连贯的自然语言回答。该工具可应用于旅游推荐、智能导航、城市规划、地理问答和物流配送等多个领域,提升了空间数据处理的智能化水平。 AI项目与工具 2025年06月11日 34 点赞 0 评论 474 浏览
TrackVLA TrackVLA是银河通用推出的端到端导航大模型,具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障,并根据自然语言指令识别和跟踪目标对象。无需提前建图,适用于多种场景,如陪伴服务、安防巡逻、物流配送等,为具身智能商业化提供支撑,推动机器人走向日常生活。 AI项目与工具 2025年06月11日 79 点赞 0 评论 475 浏览
极刻AI搜 一站式的AI聚合搜索引擎工具,囊括了互联网上比较好用的一些支持“搜索”的网站或工具,包括AI搜索、常规搜索、学术搜索、社交搜索等多种搜索类型。 AI搜索问答 2025年06月05日 32 点赞 0 评论 483 浏览
Hao123影视 Hao123影视大全为您提供最近好看的电视剧、电影、动漫、综艺节目推荐和排行榜并可在线免费观看,网站分为电视剧、电影、综艺、脱口秀、网络、自制搞笑、少儿、纪录片、视频名站等内容。 影视资源 2025年06月05日 73 点赞 0 评论 513 浏览