实时 - 智狐AI导航

ChatPods

ChatPods 是一款基于 AI 技术的播客平台，提供个性化推荐、内容摘要生成、实时问答、章节导航及智能搜索等功能。用户可在收听过程中与 AI 互动，快速获取信息并精准定位内容，适用于学习、娱乐、通勤等多种场景，提升播客收听效率与体验。

AI项目与工具 2025年06月12日 40 点赞 0 评论 611 浏览

AbletonMCP

AbletonMCP 是一个开源工具，通过模型上下文协议（MCP）将 Ableton Live 与 Claude AI 连接，实现音乐制作过程中的 AI 辅助。支持双向通信，允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信，适用于音乐创作、实时制作、教学及音频后期处理等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 589 浏览

Move AI

Move AI 是一款基于AI和计算机视觉的无标记动作捕捉工具，可将普通摄像头拍摄的2D视频转换为高精度3D运动数据。支持实时追踪、多摄像头配置及多种格式导出，适用于影视、游戏、体育分析、VR/AR等领域，提供高效、低成本的解决方案。

AI项目与工具 2025年06月12日 35 点赞 0 评论 712 浏览

ChatAnyone

ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具，基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型，支持实时交互与风格化控制，适用于虚拟主播、视频会议、内容创作等多种场景，具备高度可扩展性和实用性。

AI项目与工具 2025年06月12日 72 点赞 0 评论 610 浏览

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术，基于潜在扩散模型，能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入，具备良好泛化能力，采用高斯溅射技术实现高保真表示，并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 827 浏览

RF

RF-DETR是一款由Roboflow推出的实时目标检测模型，支持多分辨率训练，具备高精度和低延迟特性，在COCO数据集上达到60+ mAP。结合Transformer架构和预训练DINOv2主干，提升领域适应性和检测效果。适用于安防、自动驾驶、工业检测等多个场景，提供预训练检查点以支持快速微调和部署。

AI项目与工具 2025年06月12日 35 点赞 0 评论 644 浏览

Oliva

Oliva 是一款基于语音驱动的 RAG 助手，结合 Langchain 和 Qdrant 向量数据库，实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成，适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力，提升信息获取与交互效率。

AI项目与工具 2025年06月12日 57 点赞 0 评论 863 浏览

TaoAvatar

TaoAvatar是阿里巴巴推出的高保真、轻量级3D全身虚拟人技术，基于3D高斯溅射（3DGS）实现照片级真实感的虚拟形象生成。支持多模态驱动，具备高帧率实时渲染能力，适用于AR、移动设备及高清显示平台。其轻量级架构结合深度学习优化，提升了运行效率与交互自然度，广泛应用于电商直播、全息通信、虚拟会议、在线教育及娱乐等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 727 浏览

Crack Coder

Crack Coder 是一款开源的 AI 编程辅助工具，专为技术面试设计。它能够在后台运行，不被检测到，并提供实时代码建议，支持多种编程语言。该工具具备精准的上下文分析能力，适用于面试准备、编程学习及算法练习等场景，同时支持本地部署以保障隐私和性能。

AI项目与工具 2025年06月12日 22 点赞 0 评论 674 浏览

Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统，支持自然、富有情感的语音生成。具备零样本语音克隆能力，无需预训练即可模仿特定语音，延迟低至 200 毫秒，适合实时应用。支持多种语音风格和情感控制，适用于有声读物、虚拟助手、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 752 浏览

实时

首页

实时

列表

默认

浏览次数

发布日期