应用 - 智狐AI导航

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 826 浏览

爱扒谱

爱扒谱是一款基于人工智能技术的在线音乐处理平台，提供一键扒谱、音轨分离、AI音乐生成及MP3转MIDI等功能。它适用于音乐创作者、教师、学生及爱好者，能够显著提升音乐创作效率和学习体验。其主要特点包括高效便捷、智能精准、多平台支持及用户友好性。

AI项目与工具 2025年06月12日 53 点赞 0 评论 827 浏览

Voila

Voila是一款开源的端到端语音大模型，支持实时语音交互与多轮对话，具备高保真、低延迟的音频处理能力。集成语音与语言建模功能，支持百万级预设声音及个性化定制，适用于语音助手、角色扮演、语音翻译等场景。采用多尺度Transformer架构，提升语音理解与生成质量，降低开发成本，提高通用性与灵活性。

AI项目与工具 2025年06月11日 60 点赞 0 评论 828 浏览

DeepWiki MCP是Cognition Labs推出的远程服务器，基于开放标准的Model Context Protocol（MCP），为AI应用提供访问和搜索GitHub代码库文档的能力。它包含三个主要工具：获取文档主题列表、查看文档内容以及针对仓库提问获得AI回答。支持SSE和Streamable HTTP传输协议，确保信息实时性和准确性，适用于快速查询文档、技术问题解答、代码库结构概览

AI项目与工具 2025年06月11日 90 点赞 0 评论 828 浏览

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架，通过“3D Bundle Image”结构实现多视角图像与法线图的融合，从而高效生成和编辑3D模型。它支持文本与图像输入，具备3D编辑、网格优化和纹理增强等功能，适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 828 浏览

Tanka

Tanka是一款具备长期记忆和上下文理解能力的AI通讯工具，旨在提升团队协作效率。它支持智能回复、任务提醒、多模态消息处理，并可集成多种通讯平台。适用于项目管理、客户服务、销售支持及知识管理等多个场景，助力企业实现高效、智能的沟通与信息管理。

AI项目与工具 2025年06月12日 78 点赞 0 评论 829 浏览

Animon

Animon 是日本 Animon Dream Factory 推出的全球首个专注于动漫制作的 AI 视频生成平台。它结合日本传统动漫美学与尖端 AI 技术，用户只需上传一张插画或 CG 图片并输入动作描述，即可在 3 分钟内生成 5 秒的动画视频。平台具备专业二次元质感、快速生成、无限生成与低成本等特点，适用于二次元内容创作、创意尝试、前期制作、动画资源生成和动画教学等场景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 830 浏览

Ultravox

Ultravox 是一种多模态大型语言模型（LLM），能够直接处理文本和语音输入，无需额外的语音识别步骤。其核心技术包括多模态投影器，用于将音频数据转换为高维空间表示，显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习，适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 830 浏览

MatAnyone

MatAnyone是一款由南洋理工大学S-Lab实验室与商汤科技联合开发的视频抠图框架，专注于复杂背景下人像视频的精准分割。采用一致内存传播和区域自适应内存融合技术，确保视频中目标的语义稳定性和边界细节精度。结合大规模分割数据和优化的训练策略，提升了模型在真实场景下的性能。适用于影视制作、直播、广告、游戏开发等多个领域，具备高精度、强适应性和良好的交互性。

AI项目与工具 2025年06月12日 48 点赞 0 评论 831 浏览

Sendspark

一种基于AI的个性化视频录制和分享，使企业能够与受众建立真正的联系。Sendspark帮助企业通过使用视频消息预订更多会议、达成更多交易并加快销售周期。

Ai视频生成 2025年06月05日 49 点赞 0 评论 831 浏览

应用

首页

应用

列表

默认

浏览次数

发布日期