Diffusion

Phygital+

Phygital+ 是一个基于AI提供了多种功能和工具整合的平台,允许用户使用AI并创建、转换和增强图像、视频和 3D 模型。

PixVerse V2

PixVerse V2是一款基于Diffusion+Transformer(DiT)架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频,单个片段最长可达8秒,且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频,适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。

Tora

Tora是阿里推出的一个强大的视频生成工具,它通过集成多种条件来创造高质量的视频内容。其主要优势在于对运动轨迹的精确控制和对物理世界运动的真实模拟,这使得Tora在视频内容创...

RunDiffusion

RunDiffusion 是一个能在云服务器中运行功能强大的Stable Diffusion的网站。让您无需在计算机上编码或安装任何东西就可以创建令人惊叹的 AI 生成的图片艺术。

提示词交易站| Tipstore

提示词交易站| Tipstore,你可以在这里找到各类提示词,帮助你更好的使用AI工具,提升工作效率。如果您是一位优秀的提示词创作者,您可以在这里销售自己的提示词。

StoryMaker

StoryMaker 是一款基于 Stable Diffusion XL 模型和 LoRA 技术的文本到图像生成工具,专为保持连续图像中角色一致性而设计。其核心功能包括角色一致性维护、多角色处理、高质量图像生成及叙事创作支持。通过深度学习和面部特征识别技术,StoryMaker 能够生成细节丰富、视觉一致的图像,广泛应用于漫画、游戏、影视制作及广告创意等领域。

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型,基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列,通过掩码处理和去噪生成高质量音频,保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能,具有非自回归特性,提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

Vidu 1.5

Vidu 1.5是一款基于多模态视频大模型的AI生成工具,支持参考生视频、图生视频和文生视频生成,通过精准的语义理解能力,在30秒内完成高质量视频创作,适用于影视、动漫、广告等多行业场景,助力创作者高效产出多样化内容。