图像

PIA

PIA是一款个性化图像动画生成器,可以生成具有高运动可控性和强文本和图像对齐性的视频,与条件图像对齐,通过文本实现动作控制,与各种个性化T2I模型兼容,无需特定调整。

OUTFITS AI

OUTFITS AI是一款结合人工智能技术的服装推荐平台,通过分析用户的身体特征、风格偏好及环境因素,提供个性化穿搭建议。其核心功能包括智能衣柜管理、虚拟试衣间以及风格偏好分析,旨在帮助用户高效管理衣物并优化搭配决策,适用于日常穿搭、特殊场合、节日购物及旅行准备等多种场景。

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架,通过 InfuseNet 注入身份特征,确保生成图像与输入图像的高度相似。结合多阶段训练策略,提升文本与图像对齐、图像质量和美学效果。支持插件化设计,兼容多种工具,适用于社交媒体、影视制作、广告营销等多个领域。

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。

ScholarAI

一个AI驱动的帮助学生完成记笔记、时间管理、学习计划和学术论文写作等任务的平台。它从头开始生成笔记,总结复杂的信息,并将图像中的视觉信息转换为文本。

MedGemma

MedGemma是谷歌推出的开源AI模型,专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告,27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署,适用于医疗诊断、患者分诊、临床决策辅助等场景,提升医疗服务效率与准确性。

MIP

MIP-Adapter是一种基于IP-Adapter模型开发的个性化图像生成技术,能够高效处理多参考图像并生成高质量的定制化图像。通过解耦交叉注意力机制和加权合并方法,解决了多图像输入中的对象混淆问题,提升了生成图像的质量。该技术无需测试时微调,具有高效训练的特点,广泛应用于社交媒体、广告、游戏设计等多个领域。

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具,支持文本、语音、草图等多种输入方式,具备实时生成能力。其采用单双流DiT架构和多模态大语言模型,生成图像写实性强、细节丰富,且响应速度快,适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作,实现高效的图像创作体验。

Patchwork

Patchwork是一款基于AI技术的多人协作工具,专为虚拟世界构建设计。支持无限画布上的实时协作,用户可通过文本提示生成角色、地点及事件等元素,并可保存和分享成果。其功能包括生成图像、碎片操作、工具箱使用以及权限管理等,广泛应用于小说创作、游戏开发、电影制作和教育等领域。

jpghd

利用先进的人工智能 AI 将老照片无损高清修复