图像 - 智狐AI导航

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集，涵盖大量数学和科学内容，包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化，可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---

AI项目与工具 2025年06月12日 100 点赞 0 评论 553 浏览

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架，通过高质量提示构建、偏好采样和分布加权机制，提升图像质量和与人类偏好的对齐度，减少训练崩溃风险。它具备自演化能力，降低对大规模数据的依赖，广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 553 浏览

ResAdapter

ResAdapter是一种专为扩散模型设计的分辨率适配器，允许图像生成模型生成任意分辨率和宽高比的图像，同时保持原始风格。其主要功能包括分辨率插值、分辨率外推、域一致性、即插即用设计以及广泛的兼容性。通过在扩散模型中插入ResCLoRA和引入ResENorm，ResAdapter能够在不影响模型风格的情况下扩展其分辨率范围。

AI项目与工具 2024年01月01日 70 点赞 0 评论 553 浏览

Cleanup Pictures

CleanUp.pictures 是一款开源的在线图片编辑工具，它可以通过魔术橡皮擦，快速删掉任何图片中不需要的部分，简单快捷。

图片处理 2025年06月05日 95 点赞 0 评论 552 浏览

Smart PDFs

Smart PDFs 是一款免费开源的 AI 工具，用于快速提取和总结 PDF 文档的关键信息。它支持学术论文、行业报告和技术文档等多种格式，可在数秒内生成结构清晰的章节式摘要。工具采用 Llama 3.3 模型进行智能处理，并支持图像生成和内容分享功能，适用于学术、职场和个人使用场景。

AI项目与工具 2025年06月11日 61 点赞 0 评论 552 浏览

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术，支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域，提供高效且逼真的视觉内容生成能力。

AI项目与工具 2025年06月12日 51 点赞 0 评论 551 浏览

替我做图

替我做图是一款基于AI技术的图像生成平台，提供人台图、真人图、假发图、物品图等多样化服务，支持真人换脸及产品展示图优化，广泛应用于电商、社交媒体营销、广告制作等领域，助力提升品牌形象和营销效果。

AI项目与工具 2025年06月12日 54 点赞 0 评论 551 浏览

Fluid

Fluid是一种基于连续标记和随机生成顺序的文本到图像生成模型，具有卓越的视觉表现力和全局结构捕捉能力。它通过自回归架构和Transformer模型，逐步预测序列中的下一个元素，构建与文本提示相匹配的高质量图像。Fluid在多个基准测试中取得了优异成绩，并广泛应用于艺术创作、媒体娱乐、广告营销等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 550 浏览

YOLO

腾讯AI实验室开发的一个实时目标检测工具，它能够自动识别和定位图像中的各种对象

Ai开源项目 2025年06月05日 47 点赞 0 评论 550 浏览

ScholarAI

一个AI驱动的帮助学生完成记笔记、时间管理、学习计划和学术论文写作等任务的平台。它从头开始生成笔记，总结复杂的信息，并将图像中的视觉信息转换为文本。

GPTs应用 2025年06月05日 48 点赞 0 评论 549 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期