AI

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型,支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略,实现从低分辨率到高分辨率的逐步生成,有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异,具备强大的语义理解和视觉表达能力。此外,PixelFlow采用端到端训练方式,支持多种ODE求解器,适用于艺术设计、内容创作、教育研究等多个领域。

木目AI

木目AI的使用方式和妙鸭类似,需要用户先上传15-30张高质量的人像照片,其会训练一个专属模型,然后支持文本和图片两种方式进行生成,注册可免费白嫖生成25张写真图。

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架,通过Fast LAyered Gaussian Surfels(FLAGS)表示法与引导深度扩散技术,从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互,生成包括城市、自然、幻想等多种风格的3D环境,并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。

Mr. Poo

通过与Mr. Poo的互动和Pootique商店的购物体验,用户可以发现一个充满欢笑和创意的世界。

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器,支持视觉生成与理解任务。其采用多码本量化技术,将视觉特征分割并独立量化,显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率,图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块,广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

Midscene.js

Midscene.js 是一款基于 AI 的自动化 SDK,利用自然语言处理技术简化 UI 测试流程。它支持用户通过自然语言描述操作步骤,自动执行动作、查询数据、断言页面状态,并生成可视化报告。Midscene.js 可无缝集成到现有项目中,适用于自动化测试、数据抓取、性能监控等多种场景。

标贝悦读AI配音

标贝悦读作为一个在线文字转语音软件,以其快速、逼真的语音合成效果和丰富的发音人角色,适用于视频配音、美食教程、知识科普、生活妙招分享等多种场景。

Tersa

Tersa 是一款开源免费的 AI 工作流构建平台,提供直观的拖放界面,支持 77 个主流 AI 模型,如 GPT-4o、Claude 3.5 Sonnet、DALL-E 3 和 Whisper 等,适用于文本生成、图像视频创作、音频转录和代码优化等多种任务。用户可通过拖放文件快速构建复杂流程,无需编程基础,广泛应用于内容生成、代码审查、原型开发和多模态功能集成等领域。

幻图AI

幻图AI是一款基于AI技术的免费图像处理工具,支持文生图、图片和视频换脸、换装、头像定制等功能。用户通过简单的操作即可生成高质量的创意图像和视频,广泛应用于社交媒体、电商、广告设计和教育培训等领域,提供高效且个性化的视觉创作体验。