模型 - 智狐AI导航

OmniEdit

OmniEdit是一款基于多专家模型监督训练的先进图像编辑工具，支持七种核心图像编辑任务，包括对象替换、移除、添加、属性修改、背景替换、环境变化和风格转换。它能够处理不同宽高比和分辨率的图像，采用EditNet架构，提升了编辑的成功率和图像保真度。OmniEdit在自动与人工评估中表现优异，适用于专业设计、社交媒体内容创作、电子商务、新闻媒体等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 885 浏览

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架，基于音频条件的潜在扩散模型，无需中间3D或2D表示，可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法，提升视频时间一致性，并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 885 浏览

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型，拥有十亿参数量，可自主完成复杂任务，如调酒和遛狗。该模型基于模仿学习，具备强大的泛化能力和操作精度，支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景，推动机器人技术发展。

AI项目与工具 2025年06月12日 83 点赞 0 评论 885 浏览

AgentSociety

AgentSociety是由清华大学开发的基于大语言模型的社会模拟平台，通过构建具有“类人心智”的智能体，模拟复杂的社会行为与现象。平台支持城市环境建模、大规模社会模拟和科研工具集成，适用于社会舆论传播、政策评估、社会极化分析及灾害响应研究。其技术特点包括异步模拟架构、分布式计算和MQTT通信，具备高度可扩展性和实时交互能力。

AI项目与工具 2025年06月12日 21 点赞 0 评论 884 浏览