图像生成 - 智狐AI导航

PixWizard

PixWizard是一款基于自然语言指令的多功能图像处理工具，支持图像生成、编辑、翻译、修复等任务。通过基于流的Diffusion Transformer（DiT）模型及结构感知与语义感知指导，PixWizard能够高效处理各种视觉任务，并展现出强大的生成能力和泛化性能。

AI项目与工具 2025年06月12日 78 点赞 0 评论 555 浏览

Sider

Sider是一款基于AI技术的多功能浏览器扩展程序，集成了多种先进模型（如GPT-4o、Claude 3.5等），提供智能聊天、写作辅助、阅读总结、多语言翻译、代码支持及图像生成等功能。无论是学术研究、内容创作还是日常阅读，Sider都能有效提升用户的信息处理能力和工作效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 553 浏览

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具，支持文本、语音、草图等多种输入方式，具备实时生成能力。其采用单双流DiT架构和多模态大语言模型，生成图像写实性强、细节丰富，且响应速度快，适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作，实现高效的图像创作体验。

AI项目与工具 2025年06月11日 41 点赞 0 评论 553 浏览

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架，通过高质量提示构建、偏好采样和分布加权机制，提升图像质量和与人类偏好的对齐度，减少训练崩溃风险。它具备自演化能力，降低对大规模数据的依赖，广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 553 浏览

ELLA（Efficient Large Language Model Adapter）是一种由腾讯研究人员开发的方法，旨在提升文本到图像生成模型的语义对齐能力。它通过引入时序感知语义连接器（TSC），动态提取预训练大型语言模型（LLM）中的时序依赖条件，从而提高模型对复杂文本提示的理解能力。ELLA无需重新训练，可以直接应用于预训练的LLM和U-Net模型，且能与现有模型和工具无缝集成，显著提升

AI项目与工具 2024年01月01日 74 点赞 0 评论 553 浏览

Smart PDFs

Smart PDFs 是一款免费开源的 AI 工具，用于快速提取和总结 PDF 文档的关键信息。它支持学术论文、行业报告和技术文档等多种格式，可在数秒内生成结构清晰的章节式摘要。工具采用 Llama 3.3 模型进行智能处理，并支持图像生成和内容分享功能，适用于学术、职场和个人使用场景。

AI项目与工具 2025年06月11日 61 点赞 0 评论 552 浏览

替我做图

替我做图是一款基于AI技术的图像生成平台，提供人台图、真人图、假发图、物品图等多样化服务，支持真人换脸及产品展示图优化，广泛应用于电商、社交媒体营销、广告制作等领域，助力提升品牌形象和营销效果。

AI项目与工具 2025年06月12日 54 点赞 0 评论 551 浏览

ResAdapter

ResAdapter是一种专为扩散模型设计的分辨率适配器，允许图像生成模型生成任意分辨率和宽高比的图像，同时保持原始风格。其主要功能包括分辨率插值、分辨率外推、域一致性、即插即用设计以及广泛的兼容性。通过在扩散模型中插入ResCLoRA和引入ResENorm，ResAdapter能够在不影响模型风格的情况下扩展其分辨率范围。

AI项目与工具 2024年01月01日 70 点赞 0 评论 551 浏览

AIEasyPic

利用了如Stable Diffusion、ControlNet和LoRAs等模型，根据您的文本输入生成视觉效果。

Ai绘画生成 2025年06月05日 76 点赞 0 评论 548 浏览

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架，通过 InfuseNet 注入身份特征，确保生成图像与输入图像的高度相似。结合多阶段训练策略，提升文本与图像对齐、图像质量和美学效果。支持插件化设计，兼容多种工具，适用于社交媒体、影视制作、广告营销等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 547 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期