创作

LineArt

LineArt是一种无需训练的高质量设计绘图外观迁移框架,能将复杂外观特征准确转移到设计图纸上,同时保留结构细节。其技术基于模拟人类视觉认知过程,结合艺术经验指导扩散模型,支持工业设计、室内设计、服装设计等多个领域应用。具备高效、高保真和易用性等特点,适用于快速生成逼真效果和优化设计流程。

NovaMSS

NovaMSS是一款基于AI技术的音乐源分离工具,可精准分离人声、伴奏、贝斯、鼓点等音轨。支持多种音频格式和批量处理,操作简便,适用于音乐制作、音频修复及教学资源开发等多种场景。提供普通与专业模型,满足不同用户的音质需求,适合创作者和音乐爱好者使用。

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

Seaweed APT

Seaweed APT是字节跳动研发的对抗性后训练模型,支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练,实现单步高质量输出,包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计,结合近似R1正则化技术,提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架,支持多模态输入(如图片、文字、视频等)生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化,具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景,有效降低音乐创作门槛,提升创作效率与个性化体验。

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具,采用Reference U-Net和Denoising U-Net架构,结合补丁重排模块与点驱动控制方案,实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题,广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

Step R

Step R-mini是一款由阶跃星辰推出的推理模型,具备主动规划、尝试与反思能力,适用于数学、逻辑推理、代码开发及文学创作等多种场景。模型基于慢思考机制,支持深度推理与多步骤验证,表现优异。其技术特点包括强化学习、数据质量优化、测试时计算扩展及模型规模增长,实现文理兼修,广泛应用于教育、科研、企业办公等领域。

Luma Ray2

Luma Ray2 是 Luma AI 推出的视频生成模型,基于多模态架构,支持文本和图像输入,生成高质量、连贯的视频内容。相较前代,视频时长从 5 秒提升至 1 分钟,支持电影级运镜和逼真特效,适用于影视制作、广告、游戏动画及教育等多个领域。

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具,能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导,确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域,显著提升了3D内容生成的效率和质量。

Banger

Banger是一款基于AI技术的音乐创作工具,支持用户对现有歌曲进行翻唱创作。它提供无缝人声替换、丰富语音库、个性化设置等功能,适用于个人创作、音乐教学、社交媒体分享等多种场景。用户可选择内置模板或上传原声,生成高质量翻唱作品并进行分享。Banger简化了音乐制作流程,降低了创作门槛,适合各类音乐爱好者和创作者使用。