图像

MIDI

MIDI是一种基于多实例扩散模型的3D场景生成技术,能将单张2D图像快速转化为高保真度的360度3D场景。它通过智能分割、多实例同步扩散和注意力机制,实现高效的3D建模与细节优化。具有良好的泛化能力,适用于游戏开发、虚拟现实、室内设计及文物数字化等多个领域。

Midlibrary

Midlibrary是为Midjourney用户提供提示词资源的平台,收录了5505种艺术风格、技法和关键词,涵盖风格、特征和类别三大模块,并提供绘画指南。用户可通过标签和搜索功能快速获取创作灵感,提升AI图像生成效率,适用于建筑、时尚、插画、游戏设计等多个领域。

Trace.moe

一个开源动漫场景搜索引擎,根据图像反向搜索动漫场景,帮助用户通过截图追溯原始动漫,完全免费无广告。

Fractal Generative Models

Fractal Generative Models 是一种基于分形架构的图像生成技术,通过递归调用“原子模块”实现逐像素生成高分辨率图像。该模型结合 Transformer 模块,采用分而治之策略,大幅提升计算效率。不仅适用于图像生成,还可扩展至分子结构、蛋白质等高维数据建模,具有广泛的应用潜力。

讯飞星火PC版

讯飞星火PC版是科大讯飞推出的一款桌面级AI工具,集成了强大的跨领域知识理解和语言处理能力。它支持自然对话方式,涵盖写作、搜索、问答、翻译、PPT生成、图像生成等功能,并新增了深度搜索与多模态交互能力,可广泛应用于办公、教育、内容创作和技术开发等领域,提供高效便捷的智能服务。

T2I

T2I-R1是由香港中文大学与上海AI Lab联合开发的文本到图像生成模型,采用双层推理机制(语义级和 Token 级 CoT),实现高质量图像生成与复杂场景理解。其基于 BiCoT-GRPO 强化学习框架,结合多专家奖励模型,提升生成图像的多样性和稳定性。适用于创意设计、内容制作、教育辅助等多个领域,具有广泛的应用潜力。

iA Presenter

iA Presenter 的文本界面将焦点放在故事上,节省时间和精力。

Imagen 4

Imagen 4是谷歌推出的最新图像生成AI模型,支持高达2K分辨率的图像生成,具备出色的细节呈现能力,可清晰展示复杂织物纹理、水滴折射及动物毛发质感。其文本渲染能力显著提升,适合广告、漫画等设计场景。支持多种艺术风格,包括超现实、抽象、插图和摄影,满足多样化创作需求。同时,Imagen 4拥有快速生成模式和高效的特征蒸馏技术,提升了生成速度,并已集成到Gemini应用、Google Worksp

Face26

一个免费的在线人工智能照片增强应用程序,利用人工智能提高、增强和修复图像和照片的质量。

Video Studio

一款利用先进AI技术将文本和图像转换为视频的工具,用户可以通过简单的操作,将文字或图片上传至平台,AI会自动生成高质量的视频。