模型 - 智狐AI导航

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集，包含18,000个视频片段，涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随（AIF）基准，用于评估世界模型的预测能力，并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 500 浏览

EXAONE 3.5

EXAONE 3.5是一款由LG AI研究院开发的开源AI模型，包含多种参数规模版本，专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理，可显著减少错误信息并提升准确性。此外，EXAONE 3.5还具备双语支持及强大的上下文理解能力，适用于聊天机器人、语言翻译、内容创作等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 621 浏览

CausVid是一种由Adobe和MIT联合开发的实时视频生成技术，基于自回归生成模型和蒸馏预训练技术，实现了低延迟、高效率的视频创作。其核心功能包括即时视频生成、快速流式生成、零样本图像到视频转换、视频风格迁移、长视频生成以及交互式剧情生成等。CausVid通过分布匹配蒸馏、非对称蒸馏策略和滑动窗口机制等技术手段，优化了视频生成的质量与稳定性，适用于内容创作、新闻报道、教育培训、游戏开发及广告营

AI项目与工具 2025年06月12日 80 点赞 0 评论 744 浏览

VISION XL

VISION XL是一款基于潜在扩散模型的视频修复与超分辨率工具，支持视频去模糊、超分辨率提升、视频修复及帧平均等功能。它采用伪批一致性采样、批量一致性反演等技术，显著提高了处理效率和视频质量。VISION XL广泛应用于电影修复、监控视频增强、体育赛事直播等领域，能够满足高质量视频需求。

AI项目与工具 2025年06月12日 84 点赞 0 评论 590 浏览

GenMAC

GenMAC是一款基于多代理协作的迭代框架，旨在解决文本到视频生成中的复杂场景生成问题。它通过任务分解为设计、生成和重新设计三阶段，结合验证、建议、修正和输出结构化子任务，利用自适应自路由机制优化视频生成效果。该工具可应用于电影制作、游戏开发、广告设计、教育培训和新闻报道等多个领域，显著提升视频生成的效率和质量。

AI项目与工具 2025年06月12日 42 点赞 0 评论 514 浏览

OOTDiffusion

OOTDiffusion是一款开源AI虚拟试衣工具，支持根据用户上传的模特和服装图片生成自然贴合的试穿效果，具有智能适配、多种试穿模式及快速生成等特点。它通过预训练扩散模型、Outfitting UNet、Outfitting Fusion等技术实现高质量服装图像生成，适用于电商、设计、定制服务等多个领域。

AI项目与工具 2025年06月12日 81 点赞 0 评论 702 浏览