图像 - 智狐AI导航

Pippo

Pippo是由Meta Reality Labs研发的图像到视频生成模型，可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构，结合ControlMLP模块与注意力偏差技术，实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全，适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程，确保生成质量与稳定性。

AI项目与工具 2025年06月12日 38 点赞 0 评论 493 浏览

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具，结合精确语义定位策略与视觉、文本自注意力优化，提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型，支持复杂场景下的精细编辑任务，如对象替换、颜色调整等，适用于广告、影视、社交媒体等多个领域。

AI项目与工具 2025年06月12日 15 点赞 0 评论 493 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 493 浏览

通义万相

通义万相，一个不断进化的人工智能艺术创作大模型，擅长将奇思妙想转化为图画。

Ai绘画生成 2025年06月05日 10 点赞 0 评论 493 浏览

Step-1V

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

Ai平台模型 2026年06月21日 0 点赞 0 评论 493 浏览

Pika Art

Pika Art是一个使用AI技术生成和编辑视频的平台，旨在使视频制作变得简单和无障碍。该平台由北京海科互联科技有限公司开发，其背后的团队由AI研究人员、电影制作人、程序员甚至时...

Ai视频生成 2026年06月21日 0 点赞 0 评论 492 浏览

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 491 浏览

意画AI

意画AI，是基于AI框架Stable Diffusion大模型能力的AI艺术和创意辅助平台。在这里您可以生成不同风格、独一无二的创意画作，为设计提供灵感、为创作带来更多创意！

Ai绘画生成 2025年06月05日 25 点赞 0 评论 490 浏览

Luzia

Luzia是由西班牙初创公司Amperity开发的一款人工智能聊天机器人，主要服务于西语和葡语市场。它具备个性化设计和人性化交流的特点，能够模拟不同角色以适应各种对话场景。此外，Luzia还集成了数学问题解答、PDF阅读器和图像识别等多种实用工具，增强了其实用性和用户体验。

AI项目与工具 2025年06月12日 45 点赞 0 评论 490 浏览

Mistral Small 3.1

Mistral Small 3.1 是一款由 Mistral AI 开发的开源多模态 AI 模型，拥有 240 亿参数，支持文本与图像处理，具备长达 128k tokens 的上下文窗口和每秒 150 token 的推理速度。采用 Transformer 架构与 MoE 技术，提升计算效率，支持多语言和本地部署。适用于文档处理、图像分析、质量检测、虚拟助手等多种场景。

AI项目与工具 2025年06月12日 58 点赞 0 评论 490 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期