实时

Granola

Granola是一款AI驱动的会议助手工具,支持实时转录、发言者识别、笔记记录和重点标记,自动生成会议总结并支持任务管理。它可与主流会议平台集成,根据会议类型智能调整笔记模板,具备高精度语音识别能力,适用于多种会议场景,帮助用户提升会议效率与信息整理能力。

NewsBang

NewsBang是一款基于AI技术的新闻应用,提供无偏见、深度的新闻洞察。通过整合多源信息生成简洁摘要,并支持实时问答、语音播放及个性化推荐等功能,帮助用户高效获取关键信息。适用于忙碌人群、新闻爱好者及投资者等,满足多样化信息需求。

SyncAnimation

SyncAnimation是一款基于音频驱动的实时动画生成框架,能够生成与音频同步的上半身姿态和面部表情,包括嘴唇动作。采用NeRF技术,结合音频到姿态和表情的同步模块,实现实时渲染与高精度动画生成。支持多种推理方式,具备高同步性和自然表现力,适用于虚拟主播、视频会议、动画制作、游戏开发及智能客服等多个领域。

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。

Whisper Input

Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

Sonar

Sonar是Perplexity推出的AI搜索API,支持实时联网搜索、结构化输出及定制化数据源,适用于多种企业级应用场景。其核心优势在于高准确性和上下文处理能力,提供基础版和高级版服务,满足不同复杂度的搜索需求,广泛应用于IT、财务、客户服务等领域。

万物追踪

万物追踪是一款基于生成式AI技术的信息推送工具,能从全球数据中精准捕捉用户关心的事件,如政策变化、股票动态、体育赛事等,并实时生成定制内容推送给用户。用户可自由订阅感兴趣的主题,系统自动持续追踪并推送更新。适用于财经、科技、体育、教育和娱乐等多个领域,提供高效、个性化的信息获取体验。

Seaweed APT

Seaweed APT是字节跳动研发的对抗性后训练模型,支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练,实现单步高质量输出,包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计,结合近似R1正则化技术,提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。

Weebo

Weebo是一款基于AI技术的实时语音交互工具,支持语音识别与生成,实现自然流畅的语音对话。具备多语言支持和实时响应能力,适用于个人助理、娱乐互动和教育辅导等场景。技术上融合了Whisper Small、Llama 3.2等模型,提供便捷高效的语音交互体验。

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。