模型 - 智狐AI导航

DreamO

DreamO是由字节跳动与北京大学联合开发的图像定制生成框架，基于扩散变换器（DiT）模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成，具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景，具备广泛的适用性和技术先进性。

AI项目与工具 2025年06月11日 31 点赞 0 评论 503 浏览

anime.gf

Anime.gf 是一款基于开源技术开发的本地应用程序，支持用户创建和管理个性化虚拟角色。它利用先进的自然语言处理技术和多种大型语言模型 API，提供智能化的对话体验。主要功能涵盖角色创建、编辑与删除、多 API 接入、聊天记录管理以及响应再生成等。适用于娱乐、情感陪伴、语言学习、故事创作、教育辅助以及心理治疗等多个领域。

AI项目与工具 2025年06月12日 60 点赞 0 评论 503 浏览

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 503 浏览

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架，允许用户通过文本提示生成包含多个事件的连贯视频，并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧，同时结合预训练的视频扩散变换器（DiT）和大型语言模型（LLM）的提示增强功能，进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域，为视频创作带来了创新性的解决方案。

AI项目与工具 2025年06月12日 42 点赞 0 评论 503 浏览

Flex3D

Flex3D是一款由Meta和牛津大学联合研发的两阶段3D生成框架，通过多视图扩散模型和视图筛选机制生成高质量3D模型，支持从文本、单张图片或稀疏视图生成逼真的3D内容。其核心在于基于Transformer架构的灵活重建模型（FlexRM），结合三平面表示与3D高斯绘制技术，实现高效且详细的三维重建，广泛应用于游戏开发、AR/VR、影视制作等领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 503 浏览

AingDesk

AingDesk 是一款开源的 AI 模型部署工具，支持一键安装上百款 AI 模型，降低使用门槛。具备联网搜索功能，提升回答准确性；提供模型共享与多语言支持，便于团队协作与跨语言使用。内置模型管理器，优化本地资源利用，适用于学习、办公及学术研究等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 504 浏览

SeedEdit

SeedEdit是一款基于自然语言指令的通用图像编辑工具，能够实现修图、换装、风格转换等多种编辑功能。它在图像重建与生成之间找到最佳平衡，支持零样本学习和多轮编辑操作，确保高质量输出。SeedEdit适用于社交媒体、广告、电商、艺术创作等多个领域，提供从简单调整到复杂创意的全面解决方案。

AI项目与工具 2025年06月12日 27 点赞 0 评论 504 浏览

自得语音

自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT，可生成与真人无异的语音片段，在情感、音色和语速等方面与真人一致。

Ai语音工具 2025年06月05日 15 点赞 0 评论 505 浏览

CreatiLayout

CreatiLayout 是一种先进的布局到图像生成技术，由复旦大学与字节跳动联合开发。它基于大规模布局数据集 LayoutSAM，结合 SiamLayout 框架和 MM-DiT 架构，实现高质量、细粒度可控的图像生成。同时，其 LayoutDesigner 工具支持多种输入方式，帮助用户优化布局设计。适用于海报制作、室内设计、视觉创作及教学等多个领域。

AI项目与工具 2025年06月12日 56 点赞 0 评论 505 浏览

Objaverse

Objaverse 是一个为3D领域提供巨大资源的数据库，它不仅支持 AI 模型的训练和3D内容的生成，还与流行的3D编辑软件 Blender 兼容。

创作工具 2026年06月21日 0 点赞 0 评论 505 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期