图像

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架,采用“下一个X预测”和“噪声上下文学习”技术,提升视觉生成的准确性和效率。其支持多种预测单元,具备高性能生成能力,在ImageNet数据集上表现优异,适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

FP Video

FP Video是一款基于人工智能技术的图像编辑工具,提供包括AI绘画、照片修复、发型变换、卡通化在内的多项创意功能。它能够帮助用户修复旧照片、调整照片风格、尝试虚拟发型,并通过智能算法实现背景替换和物体消除等操作,适用于个人美化、艺术创作及社交媒体内容制作等多个场景。

MyTimeMachine

MyTimeMachine是一款基于深度学习的面部年龄转换工具,支持高质量的年龄回退与进展效果,同时保持个体身份特征。它通过适配器网络结合个性化与全局老化特征,能够生成高分辨率、逼真的静态图像及时间一致的视频老化效果。此外,MyTimeMachine在身份保持、外推能力及视频扩展方面具有显著优势,并广泛应用于影视制作、广告、法医学、历史重现及个人娱乐等领域。

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具,用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎,支持 100 多种语言,具备图像优化、纠偏、清洁等功能,提升识别准确率。支持多核处理与批量操作,适合高效处理大量文件,且完全离线运行,保障数据安全。

BasedLabs

BasedLabs是一款基于AI技术的图像和视频创作平台,提供包括AI视频生成、图像创作、图像扩展及换脸在内的多种功能。用户可利用平台内置的AI模型生成高质量的视觉内容,适用于社交媒体、数字艺术、广告营销、影视制作、游戏开发以及教育培训等多个领域。平台操作简便,适合各类创作者使用。

M2UGen

M2UGen是由腾讯PCG ARC实验室与新加坡国立大学共同研发的一款多模态音乐理解和生成框架,支持从文本、图像、视频等多种模态输入生成相应音乐。它具有强大的音乐理解能力、灵活的音乐编辑功能以及多样化的应用场景,适用于音乐制作、影视配乐、音乐教育等多个领域。凭借其创新的技术架构和卓越的表现力,M2UGen已成为当前最优秀的多模态音乐生成工具之一。

Holara AI

一款AI动漫画卡通图片生成工具,用户只需输入他们的偏好和提示,然后Holara AI就会生成符合给定条件的动漫图像。

千图AI设计室

提供在线设计作品解读,AI抠图、批量AI背景擦除、A证件照制作、AI自动背景、老照片修复等功能,更有设计师彩虹屁模块,让AI每天夸夸助力设计师释放无限创意。

6Pen Art

支持多种模型和中文描述,不保留版权,不保留数据。6Pen为用户提供了一个强大且易于使用的AI绘画平台,适合需要进行创意绘画和视觉设计的个人或专业人士。