图像 - 智狐AI导航

CogView

CogView-3-Plus是智谱AI研发的AI文生图模型，采用Transformer架构替代传统的UNet，优化了扩散模型中的噪声规划。它能够根据用户指令生成高质量、高美学评分的图像，支持多种分辨率，并具有实时生成图像的能力。该模型已被集成到“智谱清言”APP中，并提供API服务，适用于艺术创作、游戏设计、广告制作等多个图像生成领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 736 浏览

Publer AI Assist

Publer AI Assist 使用最新的人工智能技术帮助您在几秒钟内生成内容、创建令人惊叹的图像并像专业人士一样回复评论。

裂变增长 2025年06月05日 66 点赞 0 评论 736 浏览

Imaiger

Imaiger 是一种可让您搜索和生成由AI创建的图像和在线工具。您还可以使用 Imaiger 通过选择不同的样式、颜色和主题来创建自己的图像。

Ai图片处理 2025年06月05日 18 点赞 0 评论 736 浏览

3D AI Studio

3D AI Studio是一款基于AI技术的3D建模工具，支持文本到3D、图像到3D转换以及纹理处理等多种功能。它能够快速生成高质量的3D模型，适用于游戏开发、建筑设计、数字艺术创作等多个领域，同时具备多格式兼容性和便捷的操作体验，为用户提供高效且灵活的解决方案。

AI项目与工具 2025年06月12日 48 点赞 0 评论 736 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 736 浏览

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型，具备强大的文本与图像理解能力，包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法，实现了从1B到30B参数规模的性能提升，并推出了视频和移动UI专用版本，为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 736 浏览

日日新融合大模型

日日新融合大模型（SenseNova）是商汤科技推出的多模态AI系统，支持文本、图像、视频等多种数据的融合处理，具备强大的深度推理与多模态分析能力。该模型在多个权威评测中表现优异，广泛应用于自动驾驶、视频交互、办公教育、金融、园区管理及工业制造等领域，提升了多场景下的智能化水平。

AI项目与工具 2025年06月12日 88 点赞 0 评论 737 浏览

Vmake

为跨境电商行业提供本地化AI模特，背景图生成等AI工具，操作简单，降本增效。

Ai绘画生成 1970年01月01日 0 点赞 0 评论 737 浏览

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 737 浏览

Direct3D-S2是由南京大学、DreamTech、复旦大学和牛津大学联合开发的高分辨率3D生成框架，基于稀疏体积表示和空间稀疏注意力（SSA）机制，提升扩散变换器（DiT）的计算效率并降低训练成本。该框架包含全端到端的稀疏SDF变分自编码器（SS-VAE），支持多分辨率训练，在1024³分辨率下仅需8个GPU即可训练。Direct3D-S2能够从图像生成高分辨率3D形状，具有精细几何细节和高

AI项目与工具 2025年06月11日 23 点赞 0 评论 738 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期