实时 - 智狐AI导航

Loora

Loora是一款AI驱动的英语口语学习工具，通过模拟真实场景帮助用户提升英语表达能力。支持商务、面试、日常交流等多场景练习，提供实时发音、语法及流利度反馈。具备24小时可用性、个性化课程设计、语音识别与翻译功能，并支持学习进度跟踪，适用于各类英语学习者。

AI项目与工具 2025年06月12日 30 点赞 0 评论 684 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 854 浏览

Weebo

Weebo是一款基于AI技术的实时语音交互工具，支持语音识别与生成，实现自然流畅的语音对话。具备多语言支持和实时响应能力，适用于个人助理、娱乐互动和教育辅导等场景。技术上融合了Whisper Small、Llama 3.2等模型，提供便捷高效的语音交互体验。

AI项目与工具 2025年06月12日 72 点赞 0 评论 609 浏览

Seaweed APT

Seaweed APT是字节跳动研发的对抗性后训练模型，支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练，实现单步高质量输出，包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计，结合近似R1正则化技术，提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 693 浏览

万物追踪

万物追踪是一款基于生成式AI技术的信息推送工具，能从全球数据中精准捕捉用户关心的事件，如政策变化、股票动态、体育赛事等，并实时生成定制内容推送给用户。用户可自由订阅感兴趣的主题，系统自动持续追踪并推送更新。适用于财经、科技、体育、教育和娱乐等多个领域，提供高效、个性化的信息获取体验。

AI项目与工具 2025年06月12日 86 点赞 0 评论 508 浏览

Sonar

Sonar是Perplexity推出的AI搜索API，支持实时联网搜索、结构化输出及定制化数据源，适用于多种企业级应用场景。其核心优势在于高准确性和上下文处理能力，提供基础版和高级版服务，满足不同复杂度的搜索需求，广泛应用于IT、财务、客户服务等领域。

AI项目与工具 2025年06月12日 25 点赞 0 评论 476 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 848 浏览

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统，基于大量中文语音数据训练，支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能，适用于智能助手、内容创作及无障碍通信等场景，技术上融合了语音-文本联合建模与多阶段训练策略，提升语音表现力与智能化水平。

AI项目与工具 2025年06月12日 23 点赞 0 评论 617 浏览

SyncAnimation

SyncAnimation是一款基于音频驱动的实时动画生成框架，能够生成与音频同步的上半身姿态和面部表情，包括嘴唇动作。采用NeRF技术，结合音频到姿态和表情的同步模块，实现实时渲染与高精度动画生成。支持多种推理方式，具备高同步性和自然表现力，适用于虚拟主播、视频会议、动画制作、游戏开发及智能客服等多个领域。

AI项目与工具 2025年06月12日 41 点赞 0 评论 764 浏览

NewsBang

NewsBang是一款基于AI技术的新闻应用，提供无偏见、深度的新闻洞察。通过整合多源信息生成简洁摘要，并支持实时问答、语音播放及个性化推荐等功能，帮助用户高效获取关键信息。适用于忙碌人群、新闻爱好者及投资者等，满足多样化信息需求。

AI项目与工具 2025年06月12日 19 点赞 0 评论 813 浏览

实时

首页

实时

列表

默认

浏览次数

发布日期