图像

Maya

Maya是一款开源多语言多模态模型,基于LLaVA框架开发,支持中文、法语、西班牙语等多种语言,专注于提升低资源语言的AI内容生成能力。它结合图像和文本数据,实现跨模态对齐和指令微调,广泛应用于跨语言内容理解、图像分析、教育和电子商务等领域。

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架,通过与高级模型API交互获取数据对,结合预训练的视觉语言模型(VLMs)动态优化训练集,大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练,显著提升了生成图像的质量和多样性,广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

Hotpot.Ai

Hotpot.ai 是一个可让您在线创建和编辑图像,可以使用它来制作logo、图标、插图、漫画、模板等设计的网站。

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型,集成了图像和文本处理能力,适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构,Molmo 72B在学术基准测试中表现优异,为开源AI技术的发展做出了重要贡献。

Personalized Restoration

一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

RenderNet AI

一款功能强大的图像和视频生成器,可对角色设计、构图和风格进行广泛控制。RenderNet Al可进行视频换脸,可轻松通过照片更改视频人物面容。

麦橘超然

麦橘超然(MajicFlus)是一款基于Flux.1架构的AI图像生成模型,专注于高质量人像创作,尤其擅长表现亚洲女性的细腻特征。它支持快速生成与专业控制,具备优秀的光影处理能力和局部重绘功能,适用于人像、非人生物及场景生成。该工具广泛应用于娱乐、商业、影视、教育及科研等多个领域,为创作者提供高效、灵活的图像生成解决方案。

AnyPaint

AnyPaint是一款集成了文本到图像、图像编辑及3D模型生成等功能的AI图像生成工具,支持多种创作需求。其主要功能包括绘画生成、一键AI操作、模型库管理、IP-Adapter插件应用等,能够满足不同用户的创作需求,同时提供本地化工具提升创作效率。

汉语新解TextHuman

一个基于李继刚Prompt模板的项目,汉语新解对中文名词进行二次翻译,并生成美观的图像。TextHuman提供智能词汇解释,用户可以输入任何汉语词汇,获得AI生成的新颖解释。