模型 - 智狐AI导航

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音（TTS）模型，基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练。它支持零样本语音克隆，仅需5秒参考音频即可生成高度逼真的个性化语音，并具备情感夸张控制功能，可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用于交互式应用。此外，它采用安全水印技术防止滥用，适用于内容

AI项目与工具 2025年06月11日 55 点赞 0 评论 514 浏览

GameGen

GameGen-O 是一款基于 Transformer 架构的AI工具，专注于开放世界游戏视频的生成。它具备角色生成、环境构建、动作模拟及交互式控制等功能，通过两阶段训练方法提升了生成质量和灵活性，可应用于游戏原型设计、场景生成及开发辅助等领域，有助于降低开发成本并提高创作效率。

AI项目与工具 2025年06月12日 17 点赞 0 评论 515 浏览

AI Companion App

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。

Ai开源项目 2025年06月05日 33 点赞 0 评论 515 浏览

AudioX

AudioX 是一种基于多模态输入的音频生成模型，支持文本、视频、图像等多种输入方式，能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略，提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力，适用于视频配乐、动画音效、音乐创作等多个场景。

AI项目与工具 2025年06月12日 68 点赞 0 评论 516 浏览

Half_illustration

Half_illustration 是一款基于 Flux.1 模型的 LoRA 图像创意工具，融合了摄影写实与插画艺术的元素，创造出独特的视觉效果。该工具支持通过 API 快速生成图像，并与 Diffusers 库兼容。用户可通过详细描述和特定提示词指导模型，实现个性化的艺术创作。其应用广泛，涵盖时尚编辑、广告设计、概念艺术等多个领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 516 浏览