实时

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统,支持低延迟交互与多模态输入输出。系统采用模块化架构,允许灵活配置语音识别、语言模型和语音合成等组件,兼容本地与云服务。支持2D/3D数字人渲染,适用于客户服务、教育、娱乐及企业应用等多个场景,为开发者提供高效、灵活的AI对话解决方案。

LiveCC

LiveCC是一款由新加坡国立大学Show Lab与字节跳动联合开发的实时视频解说模型,基于自动语音识别字幕进行训练。它能够实时生成自然流畅的视频评论和回答相关问题,适用于体育、新闻、教育等多个场景。模型采用流式训练方法,结合大规模数据集和Qwen2-VL架构,具备低延迟和高质量的生成能力。LiveCC通过LiveSports-3K基准测试评估性能,广泛应用于视频内容分析与智能交互场景。

Lemon Slice Live

Lemon Slice Live 是一款基于扩散变换器模型(DiT)的实时视频聊天工具,可将图片转化为可互动的动画角色,支持多语言和实时对话。通过优化模型提升流畅度与响应速度,适用于娱乐、教育、营销等多种场景,结合语音识别、文本生成等技术,提供完整的交互体验。

Lyria 2

Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,支持高保真音频输出与多种音乐风格生成,具备实时创作、文本驱动创作及音频编辑功能。结合扩散模型与 GAN 技术,实现风格解耦与动态调整,适用于音乐制作、影视配乐、广告音乐等场景。集成于 Music AI Sandbox,提供模块化工具链,降低创作门槛,并嵌入数字水印技术以确保内容可识别性。

妙问

妙问是腾讯广告推出的AI营销辅助工具,支持7×24小时在线服务,覆盖广告主从筹备到复盘的全流程需求。其核心功能包括快问快答、深度分析、移动办公等,能提供实时数据支持、爆款素材建议、广告审核答疑及多账户管理。适用于广告咨询、投放优化、效果分析及移动管理等场景,提升营销效率与决策质量。</p>

Spring.new

Spring.new 是一款低代码/无代码 AI 开发平台,允许用户通过自然语言创建和部署定制化应用,无需编程。支持多工具集成,具备实时调整功能,并兼容多种 AI 模型,适用于营销、反馈管理及轻量级 CRM 构建等多种场景。

Ztalk.ai

Ztalk.ai 是一款支持多语言实时语音翻译的AI桌面应用,具备低延迟、高清晰度和强兼容性,可与主流视频会议平台无缝连接。内置降噪、字幕及AI提示功能,确保沟通效率与质量。采用端到端加密,保障数据安全,适用于全球商务会议、跨境协作、客户互动及多语言培训等场景。

Kotae

Kotae是一款专为中小企业设计的智能聊天机器人平台,基于ChatGPT技术开发,支持80多种语言,可快速自然地响应客户咨询。用户无需编程即可在5分钟内完成配置和部署,通过分析网站内容、培训材料和FAQ生成准确回答。支持品牌定制和实时对话管理,适用于自动化客户服务、提升满意度及收集客户反馈等场景。

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型,支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎,能精准捕捉语音中的语调、节奏和情感,生成自然流畅的面部表情和动作。操作简单,无需专业技能,适用于多种角色形象,涵盖社交媒体、企业营销、在线教育等多个领域,是高效内容创作的理想选择。

Offer蛙

Offer蛙是一款AI驱动的面试辅助工具,支持实时语音识别与答案生成,结合高频题库和简历信息,为用户提供专业级回答。具备代码题优化、多平台适配及隐私保护功能,适用于技术面试和线上面试场景,提升面试表现与专业形象。