创作
Vidu主体参照功能
Vidu的主体参照功能是一项由Vidu AI首次推出的参考一致性功能,旨在保持视频中单一主体(如真人、2D或3D角色)的一致性。该功能不仅支持对角色的面容、半身、全身特征进行精确控制,还涵盖多种角色类型和画风,包括写实风格和各种艺术风格。它能有效解决视频制作中的一致性问题,提升创作效率,并降低技术门槛,适用于艺术创作、商业广告、社交媒体内容、教育和培训、游戏开发以及电影和电视剧制作等多种应用场景。
Open Voice OS
一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。
Neural4D 2o
Neural4D 2o 是一款基于多模态数据训练的 3D 大模型,支持文本、图像、3D 和运动数据输入,实现高精度的 3D 内容生成与编辑。具备上下文一致性、角色身份保持、换装和风格迁移等功能,支持自然语言指令操作。采用 Transformer 编码器与 3D DiT 解码器架构,原生兼容 MCP 协议,提升创作效率与交互体验,适用于 3D 内容创作、游戏开发、影视动画等多个领域。
Prometheus
Prometheus是一款基于潜在扩散模型的3D生成工具,能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导,确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域,显著提升了3D内容生成的效率和质量。
OLMo 2 32B
OLMo 2 32B 是由 Allen Institute for AI 推出的开源语言模型,拥有 320 亿参数,性能接近更大规模模型。它采用三阶段训练策略,结合预训练、中期训练和后训练,提升模型稳定性与任务适应性。模型支持多任务处理,涵盖自然语言处理、数学推理、编程辅助和内容创作等领域,并具备高效训练能力与低能耗优势。所有数据、代码和权重均开源,便于研究与开发。
G3D.AI {Jedi}
G3D.AI 是一家开发用于游戏创作的人工智能 (AI) 工具的公司。它旨在通过使用自然语言提示,使游戏创作者能够在很短的时间内构建出精美、新颖的游戏。
