图像

Hyper

Hyper-SD是由字节跳动研究人员开发的高效图像合成框架,通过轨迹分割一致性蒸馏(TSCD)、人类反馈学习(ReFL)和分数蒸馏等技术,显著降低了扩散模型在多步推理过程中的计算成本。该框架在保持高图像质量的同时,大幅减少了推理步骤,实现了快速生成高分辨率图像,推动了生成式AI技术的发展。

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术,结合扩散模型与时间注意力机制,基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块,确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸,广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域,具备高分辨率生成能力和良好的时间连贯性。

Reshot AI

Reshot AI 是一款基于人工智能的面部照片编辑工具,提供精准眼睛编辑、表情雕塑、3D姿势调整及光线背景优化等功能,适用于制作专业头像、社交媒体内容和视频缩略图,提升图像质量与视觉吸引力。

Half_illustration

Half_illustration 是一款基于 Flux.1 模型的 LoRA 图像创意工具,融合了摄影写实与插画艺术的元素,创造出独特的视觉效果。该工具支持通过 API 快速生成图像,并与 Diffusers 库兼容。用户可通过详细描述和特定提示词指导模型,实现个性化的艺术创作。其应用广泛,涵盖时尚编辑、广告设计、概念艺术等多个领域。

BAGEL

BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,采用混合变换器专家架构(MoT),通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异,生成质量接近SD3,并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

幻图AI

幻图AI是一款基于AI技术的免费图像处理工具,支持文生图、图片和视频换脸、换装、头像定制等功能。用户通过简单的操作即可生成高质量的创意图像和视频,广泛应用于社交媒体、电商、广告设计和教育培训等领域,提供高效且个性化的视觉创作体验。

LongAlign

LongAlign是一种针对文本到图像生成任务的改进方法,通过分段级编码技术和分解偏好优化,有效解决了长文本输入的对齐问题。它能够显著提升生成图像与输入文本的一致性,广泛应用于艺术创作、游戏开发、影视制作及教育等领域,具备高精度和强泛化能力。

Hunyuan3D

Hunyuan3D-1.0 是腾讯推出的一款3D生成模型,支持文本和图像输入生成高质量3D资产。该模型采用两阶段方法,包含轻量版和标准版,具有快速生成和高质量重建的特点,广泛应用于3D创作、工业设计、建筑设计等领域。

CustomGPT.ai

CustomGPT.ai 是一个基于GPT-4技术的平台,为企业提供定制化、安全且高效的AI聊天机器人解决方案。它允许用户根据具体需求定制和训练AI模型,以适应不同的应用场景和业务需求。主要功能包括定制化AI代理、安全且无需编程的平台、提高效率和客户体验以及GPT-4技术支持。应用场景广泛,包括客户服务、内容创作、医疗诊断、金融分析、教育与培训及法律研究。

千图AI设计室-AI助手

提供在线设计作品解读,AI抠图、批量AI背景擦除、A证件照制作、AI自动背景、老照片修复等功能,更有设计师彩虹屁模块,让AI每天夸夸助力设计师释放无限创意。