Project Mariner
Project Mariner是一款由谷歌DeepMind研发的浏览器助手工具,依托Gemini 2.0技术实现浏览器自动化。该工具能够解析并操作网页内容,涵盖像素、文本、图像及表单等多种形式的数据,支持复杂任务处理与自动化流程管理。此外,它强调用户体验与安全性,在执行关键操作时需获得用户授权。主要应用场景包括数据整理、在线购物、旅行规划及日常消费等领域。
WonderPlay
WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架,能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术,支持多种物理材质和动作类型,实现逼真的动态效果。用户可通过简单操作与场景互动,生成丰富的物理响应。该工具具备交互式查看器,适用于AR/VR、影视特效、教育、游戏开发等多个领域。
CosyVoice 2.0
CosyVoice 2.0是一款基于深度学习的语音生成大模型,通过有限标量量化技术和新型架构设计,在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理,延迟低至150ms,广泛应用于智能助手、有声读物、视频配音及语言学习等领域,同时具备多语言支持和情感控制等功能。
