实时
Open Avatar Chat
Open Avatar Chat是阿里开源的模块化实时数字人对话系统,支持低延迟交互与多模态输入输出。系统采用模块化架构,允许灵活配置语音识别、语言模型和语音合成等组件,兼容本地与云服务。支持2D/3D数字人渲染,适用于客户服务、教育、娱乐及企业应用等多个场景,为开发者提供高效、灵活的AI对话解决方案。
Pika Twists
Pika Twists 是 Pika Labs 推出的 AI 视频编辑工具,支持用户精准操控视频中的主体动作和场景,实现创意效果。通过简单描述即可完成角色或物体的动作修改,同时保持画面自然。功能包括主体操控、元素调整、风格化处理、逼真渲染等,适用于短视频、广告、教学等多种场景,提高视频创作效率和表现力。
Krea Stage
Krea Stage 是一款基于 AI 技术的工具,能够将 2D 图像快速转换为可编辑的 3D 场景,并支持视频生成。用户可通过直观界面实时调整物体、光影和视角,无需专业建模知识。适用于影视、游戏、艺术、VR 和广告等多个领域,提升了 3D 内容创作的效率和灵活性。
OmniTalker
OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术,支持文本、图像、音频和视频的同步处理,并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术,实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景,具有高实时性与稳定性。