AI项目与工具

吐司AI换脸

吐司AI换脸是一款基于ComfyUI Workflow的图像处理工具,支持高质量人像换脸。用户只需上传目标图像和参考人脸图像,即可快速生成自然逼真的换脸效果。该工具提供精细化遮罩处理、面部修复、风格统一等功能,并兼容多种模型和版本。适用于影视、广告、艺术创作、社交媒体及游戏开发等多个领域,操作简便,效果出色。

创作星

创作星是一款基于AI技术的多功能对话工具,集成了AI聊天、AI绘画、AI视频制作及文本生成等多项功能。它能够适应多种场景需求,如工作咨询、学术讨论、日常闲聊等,并提供便捷的操作体验。无论是创意激发还是实际应用,创作星都展现出强大的实用性和创新性。 ---

ARTROOM

ARTROOM是一款集成了AI技术的图像生成与编辑平台,支持用户通过图层控制、Loras集成及ControlNets技术生成原创艺术作品或参考图片。平台具备丰富的功能,涵盖个性化定制、灵感获取等,并适用于个人艺术创作、企业营销、教育研究等多个领域,助力用户高效完成高质量视觉内容。

AndroidGen

AndroidGen 是一个基于大语言模型(LLM)的智能代理框架,专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练,结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块,增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色,适用于自动化任务处理、

Sketch2Sound

Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术,通过提取响度、亮度和音高概率等控制信号,结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架,同时赋予声音设计师更强的表达力与可控性,广泛适用于电影、游戏、音乐制作及教育等多个领域。

Agentic Object Detection

Agentic Object Detection是由吴恩达团队研发的新型目标检测技术,通过智能代理系统实现无需标注数据的目标识别。用户输入文字提示后,AI可精准定位图像中的目标及其属性,支持内在属性、上下文关系及动态状态的识别。该技术无需复杂训练流程,适用于装配验证、作物检测、医疗影像分析、危险物品识别和商品管理等多种场景,显著提升了检测效率和准确性。

AniPortrait

AniPortrait是一款由腾讯开源的AI视频生成框架,通过音频和一张参考肖像图片生成高质量的动画。该框架包含两个核心模块:Audio2Lmk模块将音频转换为2D面部标记点,而Lmk2Video模块则基于这些标记点生成连贯且逼真的视频动画。AniPortrait以其高质量的视觉效果、时间一致性和灵活的编辑能力著称,能够精确捕捉面部表情和嘴唇动作。

Textero.ai

Textero.ai是一款基于人工智能的学术写作辅助工具,能够快速生成高质量的论文草稿,提供文本摘要与大纲生成服务,支持多语言操作,确保内容原创性与学术合规性,帮助用户节省时间并提升写作质量。

MusicFX

Google MusicFX是一款基于人工智能技术的音乐生成工具,支持用户通过文本描述来生成音乐,涵盖多种风格。它具备文本到音乐创作、自定义音乐参数、数字水印技术和版权安全过滤等功能,旨在降低音乐创作门槛,提升创作效率和质量。自发布以来,已有大量用户通过该工具创作出原创音乐作品。

Poetry2Image

Poetry2Image是一个由哈尔滨工业大学提出的迭代校正框架,专门用于中文古诗词的图像生成。该工具通过自动化反馈和校正机制,提升了诗歌与图像的一致性,解决了文本到图像生成模型在处理中文古典诗歌时常见的关键元素丢失或语义混淆问题。Poetry2Image具备搜索翻译、生成初始图像、提取关键元素、图像修正及迭代优化等功能,与多种图像生成模型结合使用时,其元素完整性和语义一致性表现优异,适用于古诗词