图像 - 智狐AI导航

Long

Long-VITA是一款由腾讯优图实验室、南京大学和厦门大学联合开发的多模态AI模型，支持处理超长文本（超过100万tokens）及多模态输入（图像、视频、文本）。通过分阶段训练提升上下文理解能力，结合动态分块编码器与并行推理技术，实现高效处理长文本和高分辨率图像。模型基于开源数据训练，适用于视频分析、图像识别、长文本生成等场景，性能在多个基准测试中表现突出。

AI项目与工具 2025年06月12日 65 点赞 0 评论 764 浏览

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具，支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型（LLM）技术，确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中，帮助简化本地化流程，适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

AI项目与工具 2025年06月12日 81 点赞 0 评论 765 浏览

Pixelicious

Pixelicious 是一个可让您将图像转换为像素图像的网站。

Ai图片处理 2025年06月05日 87 点赞 0 评论 765 浏览

智谱AI绘画

智谱AI绘画可根据用户的描述创作出新的艺术作品，还能够模仿不同的艺术风格，提供个性化的图像编辑和创作服务

Ai绘画生成 1970年01月01日 0 点赞 0 评论 765 浏览

DanceGRPO

DanceGRPO 是由字节跳动与香港大学联合开发的视觉生成强化学习框架，支持文本到图像、文本到视频、图像到视频等多种任务，兼容多种生成模型与奖励机制。其通过强化学习优化生成过程，提升视觉内容质量与一致性，降低显存压力，提高训练效率与稳定性，适用于视频生成和多模态内容创作。

AI项目与工具 2025年06月11日 45 点赞 0 评论 765 浏览

FLUX

FLUX-Controlnet-Inpainting是一款基于ControlNet和FLUX.1-dev技术的图像修复工具，能够通过用户指定的掩码区域对图像进行精准修复。其主要特点包括风格一致性、边缘和结构保持、高质量生成以及参数可调性。工具广泛应用于历史照片修复、艺术创作、媒体娱乐、广告营销、数据增强及医学成像等领域。

AI项目与工具 2025年06月12日 13 点赞 0 评论 765 浏览

Chromox

Chromox是一款基于AI技术的视频生成工具，可将文本和图像快速转化为高质量的视频内容。支持文本到视频、图像到视频的转换，并提供多样化的风格选项，适用于广告、教育、社交媒体等多种场景。其用户友好型界面和高清晰度输出使其成为创意表达的理想选择。

AI项目与工具 2025年06月12日 26 点赞 0 评论 765 浏览

Make-A-Character

创新的3D角色生成框架，它通过文本描述快速创建逼真的3D角色，具有高度的定制性和逼真度。它结合了最新的人工智能技术，提供了一个直观、灵活且高效的角色创建解决方案，适用于多...

Ai平台模型 1970年01月01日 0 点赞 0 评论 766 浏览

SplitShire

SplitShire是是一款国外的免费图库网站，所有的图片都是免费提供下载使用。

免商图片 2025年06月05日 56 点赞 0 评论 767 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 768 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期