音视频

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型,具备快速处理文本、音频和图像的能力,支持多语言输出和实时音视频流输入。通过Agent技术和工具调用,Gemini 2.0 能够自主理解任务并提供解决方案,已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用,计划逐步开放更多功能。

声网Agora

专注于实时音视频技术的云服务公司,全球实时互动云服务开创者和引领者。开发者只需简单调用声网API,即可在应用内构建多种实时音视频互动场景。