AI建筑设计-Stable Diffusion 15课时以案例实操的方式,结合实际工作场景需求讲解包括室内设计、建筑鸟瞰、人视角,规划,景观等相关操作流程。 Ai学习资源 1970年01月01日 0 点赞 0 评论 233 浏览
MILS MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型(LLM)提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化,实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务,适用于内容生成、多模态检索、视觉问答等多个场景,具备高效、灵活和无需训练的优势。 AI项目与工具 2025年06月12日 31 点赞 0 评论 231 浏览
VideoVAE+ VideoVAE+是一种由香港科技大学研发的跨模态视频变分自编码器,具备时空分离压缩和文本指导功能。它通过分离空间与时间信息处理,有效减少运动伪影,同时利用文本嵌入增强细节重建能力。VideoVAE+在视频重建质量上超越现有模型,支持高保真与跨模态重建,适用于视频压缩、影视后期制作及在线教育等多个领域。 AI项目与工具 2025年06月12日 45 点赞 0 评论 231 浏览
AReaL AReaL-boba 是由蚂蚁技术研究院与清华大学联合推出的开源强化学习训练框架,具备高效训练、推理能力提升、低资源训练等核心功能。其 7B 模型在数学推理任务中表现突出,且支持大规模模型的低成本复现。框架集成 SGLang 推理系统,采用数据蒸馏与工程优化技术,提升训练效率。适用于教育、自然语言处理、智能体开发等领域,具有高度可复现性和开源特性。 AI项目与工具 2025年06月12日 46 点赞 0 评论 229 浏览
DrivingDojo DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。 AI项目与工具 2025年06月12日 85 点赞 0 评论 227 浏览
Promptriever Promptriever是一款基于自然语言处理的新型检索模型,融合了大型语言模型提示技术与信息检索优势。它通过双编码器架构及指令训练集优化,实现了对复杂查询的高度适应性与鲁棒性,适用于搜索引擎优化、智能助手、企业内部搜索及学术研究等多个领域。 AI项目与工具 2025年06月12日 12 点赞 0 评论 226 浏览
smoltalk Smoltalk-Chinese 是 OpenCSG 开发的中文大型语言模型专用合成数据集,包含 70 多万条高质量数据,涵盖多种任务类型,如信息查询、编程、数学、创意写作等。数据通过先进模型生成并经过严格筛选和去重,确保多样性与质量,适用于模型微调和多场景应用,提升语言理解和生成能力。 AI项目与工具 2025年06月12日 41 点赞 0 评论 226 浏览