图像 - 智狐AI导航

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型，具备强大的图像与视频处理能力，涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统，支持多种视觉任务，广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 626 浏览

InstantCharacter

InstantCharacter是由腾讯混元开发的图像生成插件，基于扩散 Transformer 架构，支持角色一致性保持、高保真图像生成及文本可控性。用户可通过输入角色图片和文字描述，生成符合要求的多样化图像。其适用于连环画、影视、游戏等多个领域，具有高效、灵活和高质量的特点。

AI项目与工具 2025年06月11日 94 点赞 0 评论 626 浏览

Eluna.ai

一个由 AI 驱动的文生图平台。借助 eluna.ai，您可以利用大量功能将简单的文本转换为引人入胜的视觉设计。无论您的目标是生成详细的图像、尝试无限缩放、从图像中删除背景，还是放大现有图像，eluna.ai 都能满足您的需求。

Ai绘画生成 2025年06月05日 94 点赞 0 评论 626 浏览

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集，包含1000亿个图像与文本配对数据，是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建，保留了丰富的语言和文化多样性，支持多模态任务如图像分类、图像描述生成和视觉问答，广泛应用于人工智能研究、工程开发及教育领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 626 浏览

PNGAI

一个基于Flux 模型构建的免费在线 AI PNG生成工具，可以帮助设计师、艺术家等创作者通过文本描述生成高质量的PNG图像，并且不需要注册就可使用。

Ai图片处理 2025年06月05日 55 点赞 0 评论 625 浏览

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具，支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能，兼容U-Net和DiT架构，并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程，提升生成质量与可控性，适用于内容创作、电影制作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 30 点赞 0 评论 625 浏览