生成 - 智狐AI导航

MultiBooth

MultiBooth是一种由多所高校和研究机构联合开发的多概念图像生成工具，能够根据文本提示生成包含多个指定概念的高质量图像。其核心技术包括单概念学习和多概念整合，采用多模态编码器、自适应归一化和区域定制化模块，实现高效、精准的图像生成。支持插件式架构，具备良好的扩展性和灵活性，适用于创意设计、广告、教育、电商及科研等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 711 浏览

OmniTalker

OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术，支持文本、图像、音频和视频的同步处理，并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术，实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景，具有高实时性与稳定性。

AI项目与工具 2025年06月12日 59 点赞 0 评论 711 浏览

Deepfake Defenders 是一个由中国科学院自动化研究所的 VisionRush 团队开发的开源 AI 模型，主要用于检测和防御 Deepfake 技术生成的伪造图像和视频。它通过分析媒体内容中的细微像素变化来识别伪造内容，并提供像素级分析、实时检测等功能。该模型采用卷积神经网络（CNN）、生成对抗网络（GAN）等技术，支持多模态分析，具备开源协作特性，广泛应用于社交媒体监控、新闻验证

AI项目与工具 2025年06月12日 20 点赞 0 评论 711 浏览

Vid.AI

一个爆款短视频生成AI工具并优化这些视频以提高在社交媒体上的传播率，提供提示生成视频、AI 脚本生成、AI 声音、短视频创作和内置的素材库。

Ai视频生成 2025年06月05日 71 点赞 0 评论 711 浏览

Decohere

Decohere是一个AI生成器，专注于利用人工智能技术快速创建高质量的图像和艺术作品。

Ai视频生成 2026年06月24日 0 点赞 0 评论 711 浏览

超能画布

百度推出的一款AI图像创意生成工具，专为人像摄影量身打造。凭借其独特的图像大模型和智能人脸融合算法，超能画布让摄影师们能够通过简单的操作，实现创意的无限延伸。

Ai图片处理 2025年06月05日 79 点赞 0 评论 711 浏览

Sekai

Sekai是一款结合AI技术的交互式内容平台，允许用户创建和自定义虚拟角色，并通过AI生成完整的故事情节。平台支持互动式叙事、沉浸式体验以及故事编辑与分享功能，适用于个人娱乐、社交互动、教育学习及品牌营销等多种场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 711 浏览

InstructMove

InstructMove是由东京大学与Adobe合作开发的图像编辑模型，基于视频帧对变化学习如何根据指令进行图像操作。它能够执行非刚性编辑、视角调整和元素重排等任务，同时支持精确的局部编辑。该模型采用真实视频数据训练，提升编辑自然性与真实性，适用于影视、广告、设计等多个领域。其技术基于多模态语言模型和扩散模型，结合掩码和ControlNet等控制机制，实现灵活高效的图像编辑。

AI项目与工具 2025年06月12日 21 点赞 0 评论 711 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 711 浏览

ConsisID

ConsisID是一款由北京大学和鹏城实验室开发的文本到视频生成工具，其核心技术在于通过频率分解保持视频中人物身份的一致性。该模型具备高质量视频生成能力、无需微调的特点以及强大的可编辑性，同时拥有优秀的泛化性能。其主要功能包括身份保持、高质量视频生成、文本驱动编辑以及跨领域人物处理，广泛应用于个性化娱乐、虚拟主播、影视制作、游戏开发及教育模拟等领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 712 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期