R
Playground v3
Playground v3是一款基于大型语言模型(LLM)的文本到图像生成工具,具备240亿参数量的潜扩散架构(LDM),能够精准理解和生成复杂的图像内容,支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持,广泛应用于设计、内容创作、游戏开发、广告等多个领域。
ebook2audiobookXTTS
ebook2audiobookXTTS是一款开源AI工具,可将EPUB、PDF、MOBI等多种电子书格式转换为高质量的有声书(.m4b)。通过集成Calibre和Coqui XTTS技术,支持多语言处理和章节识别,同时保留电子书元数据,适用于个人学习、教育培训、企业培训以及公共图书馆等场景,帮助用户高效获取知识。
Motion Dreamer
Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。
