实时

SmoothCache

SmoothCache是一种针对Diffusion Transformers(DiT)模型的推理加速技术,通过分析层输出的相似性实现自适应缓存和特征重用,有效减少计算成本并提升生成效率。该技术具有模型无关性、跨模态适用性和易于集成的特点,支持图像、视频、音频及3D模型生成,并在多种应用场景中展现出卓越的性能表现。

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量,并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术,适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

Kotae

Kotae是一款专为中小企业设计的智能聊天机器人平台,基于ChatGPT技术开发,支持80多种语言,可快速自然地响应客户咨询。用户无需编程即可在5分钟内完成配置和部署,通过分析网站内容、培训材料和FAQ生成准确回答。支持品牌定制和实时对话管理,适用于自动化客户服务、提升满意度及收集客户反馈等场景。

妙问

妙问是腾讯广告推出的AI营销辅助工具,支持7×24小时在线服务,覆盖广告主从筹备到复盘的全流程需求。其核心功能包括快问快答、深度分析、移动办公等,能提供实时数据支持、爆款素材建议、广告审核答疑及多账户管理。适用于广告咨询、投放优化、效果分析及移动管理等场景,提升营销效率与决策质量。</p>

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型,具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略,使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景,适用于各类语音交互系统。

Mini

Mini-Omni 是一个开源的端到端语音对话模型,具备实时语音输入和输出的能力,能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别(ASR)或文本到语音(TTS)系统,直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法,通过批量并行策略提高性能,同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能,适用于智能助手、客户服务

Melodio

Melodio是一款由昆仑万维开发的AI流媒体音乐应用程序,能够根据用户输入的提示实时生成个性化音乐。该应用程序支持多种语言,包括中文,并提供无限流式播放功能。用户可以在音乐播放过程中随时调整提示,享受连续不断的音乐体验。此外,Melodio还具有歌词查询、音乐保存和分享功能。其主要功能包括AI音乐生成、多语言支持、无限流式播放、实时音乐定制以及歌词查询和显示。

猫狸盘搜

一个专注于阿里云盘资源的搜索引擎,猫狸盘搜每天更新大量资源,并实时删除失效链接,确保用户获取最新有效的资源。

Sloyd AI

Sloyd,一个 3D 建模平台,我们的文本转 3D 模型 AI 生成器专门用于将文本提示转换为详细的 3D 模型,可简化创建 3D 模型的过程。

creatify

Creatify是一款由人工智能驱动的视频广告制作平台,支持根据产品信息自动生成高质量营销视频。其主要功能包括自动视频生成、AI脚本创作、多样化模板选择、动态特效设计及多语言支持。Creatify适用于电商、品牌推广、教育培训等多种场景,帮助用户高效制作专业视频广告,降低时间和成本投入。