机器人
VideoWorld
VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型,能够通过未标注视频数据学习复杂知识,包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型(LDM)和逆动态模型(IDM),支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异,且具备向自动驾驶、智能监控等场景扩展的潜力。
如意 AI Stick
如意AI Stick是一款基于人工智能技术的桌面助手,集成了搜索、写作、聊天等多项功能。它通过豆包大模型实现精准的信息检索和多领域知识解答,支持个性化界面定制,并提供办公辅助、生活娱乐等多种智能服务,旨在提升用户的工作效率和生活便利性。
SpatialVLA
SpatialVLA是一款由多机构联合研发的空间具身通用操作模型,具备强大的3D空间理解能力与跨平台泛化控制能力。通过Ego3D位置编码和自适应动作网格技术,实现精准的环境感知与动作生成。支持零样本任务执行与快速微调,适用于工业、物流、医疗等多个领域,推动机器人技术的发展与应用。