应用

TaoAvatar

TaoAvatar是阿里巴巴推出的高保真、轻量级3D全身虚拟人技术,基于3D高斯溅射(3DGS)实现照片级真实感的虚拟形象生成。支持多模态驱动,具备高帧率实时渲染能力,适用于AR、移动设备及高清显示平台。其轻量级架构结合深度学习优化,提升了运行效率与交互自然度,广泛应用于电商直播、全息通信、虚拟会议、在线教育及娱乐等领域。

Aurora

Aurora是一款由xAI推出的AI图像生成工具,主要功能包括根据文本描述生成高质量图像,尤其擅长人物肖像和风景图像的逼真再现。它具备处理公共及版权人物图像的能力,支持多种应用场景,如社交媒体内容创作、广告设计、艺术创作以及教育辅助等。尽管仍处于测试阶段,但其潜力已受到广泛关注。

星火纪要

星火纪要是科大讯飞推出的音视频处理平台,支持语音转录、内容总结、多语言翻译、数据分析等功能,适用于会议、访谈、销售、培训等场景。系统可快速生成会议纪要,角色分离准确率超95%,支持12种场景模板,提升工作效率与信息管理能力。

Generated.photos

使用完全由 AI 生成的照片增强您的创意作品。通过我们分类和标记的应用程序查找模型图像,或通过 API 集成图像。

Gatekeep

专门致力于将复杂的数学和物理问题简化为易于理解的视频讲解

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型,具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程,支持FP16和Q4_K_M量化版本,确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域,为用户提供便捷、高效的语音交互体验。

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具,可生成高质量、自然的说话人头部视频。支持多信号控制(如音频、表情),采用并行 Mamba 结构和门控机制,实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异,适用于虚拟主播、远程会议、在线教育等多种场景。

Wallhaven

Wallhaven是非常著名的一款壁纸网站,全都是高清壁纸,完全免费,壁纸绝美,特别是动漫和cosplay主题。

灵境矩阵

灵境矩阵是百度最新推出的面向各类开发者的文心插件开发平台。