创作

MUMU

MUMU是一种多模态图像生成模型,通过结合文本提示和参考图像来生成目标图像,提高生成的准确性和质量。该模型基于SDXL的预训练卷积UNet,并融合了视觉语言模型Idefics2的隐藏状态。MUMU能够在风格转换和角色一致性方面展现强大的泛化能力,同时在生成图像时能够很好地保留细节。主要功能包括多模态输入处理、风格转换、角色一致性、细节保留以及条件图像生成。

GPT Cheat Sheet

收集最喜欢的ChatGPT提示,第三方(免费)软件产品和一般提示,以获得更多的ChatGPT作为一个企业主!定期更新,永远免费。解锁GPT使用方法!值得学习!

VoiceDub

VoiceDub 是一款AI驱动的音频处理平台,支持人声替换、声音克隆、文本转语音及音频分离等功能,提供超过10,000种AI人声音色。用户可通过平台进行音乐创作、有声内容制作及个性化音频生成,适用于多种应用场景,如语言学习、娱乐互动等。

绘蛙·多图成片

绘蛙·多图成片是一款基于AI技术的视频生成工具,通过上传2-4张连贯图片并配合文字描述,快速生成高质量视频。支持多种视频尺寸,具备智能文案生成能力,适用于创意视频、广告、电商展示等多种场景,显著降低视频制作门槛和成本。

AIVLOG

AIVLOG是一款基于AI技术的视频编辑工具,专为视频创作者设计,具备自动剪辑、智能字幕生成、特效与音乐一键添加等功能。支持多平台使用,提供丰富的模板和素材,便于快速制作高质量Vlog,并可一键分享至社交平台,提升内容传播效率。

Higgsfield

Higgsfield是一款基于AI的视频生成平台,能够将文本提示转化为高质量视频内容,支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能,适用于社交媒体、广告及电影制作领域,提升创作效率与质量。

VDraw

VDraw是一款基于AI的信息图表生成工具,可将文本、文档或视频内容快速转换为可视化图形。用户可自定义颜色、字体及品牌元素,支持多格式输入并提供便捷的分享功能。适用于教学、营销、内容创作等领域,提升信息传达效率与视觉效果。

EzAudio

EzAudio是一款基于文本到音频(Text-to-Audio, T2A)生成模型,通过优化的扩散变换器架构和高效的数据训练策略,实现了快速生成高质量音频的功能。它支持多种应用场景,如音乐创作、影视后期制作、语音合成等,并具备高保真度和低资源消耗的特点。

Vchoo.ai

一个故事转视频的AI故事短片创作AIGC工具,Vchoo.ai简化从故事创作到视频生成的过程,丰富的故事题材、多元的画面风格、稳定可控的角色和场景,轻松地将故事视觉化。

Foxify.Art

一个专门根据用户输入文本提示使用AI技术生成动漫图像的网站。用户可以输入文本提示,Foxify 会根据该提示生成图像。