模型 - 智狐AI导航

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音（TTS）模型，基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练。它支持零样本语音克隆，仅需5秒参考音频即可生成高度逼真的个性化语音，并具备情感夸张控制功能，可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用于交互式应用。此外，它采用安全水印技术防止滥用，适用于内容

AI项目与工具 2025年06月11日 55 点赞 0 评论 514 浏览

PP

PP-DocBee是百度飞桨推出的多模态文档理解模型，基于ViT+MLP+LLM架构，支持文字、表格、图表等多类型文档内容的精准识别与解析。具备高效的推理性能和高质量输出，适用于文档问答、信息提取等场景，支持灵活部署，为文档处理提供智能化解决方案。

AI项目与工具 2025年06月12日 56 点赞 0 评论 513 浏览

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发...

Ai语音工具 2026年06月21日 0 点赞 0 评论 513 浏览

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具，支持零样本多语言生成，提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器，实现文本与图像的高效交互。实验表明其性能优于现有方法，适用于艺术创作、广告设计、影视制作等多个领域，具备高效、灵活和高质量的生成能力。

AI项目与工具 2025年06月12日 59 点赞 0 评论 513 浏览

Glama AI

一款集成多种AI模型和智能代理服务的多功能聊天工具，Glama支持文件分析、实时搜索、图表生成和企业级安全，适用于高效信息处理和协作。

AI写作对话 2025年06月05日 99 点赞 0 评论 512 浏览

SuperCraft

SuperCraft是一款基于生成式AI技术的无限协作画布设计平台，能够将手绘草图或文本描述转化为高质量的2D图像和3D渲染。平台提供3D模型导出功能，支持团队协作，具备3D渲染和可视化能力，简化复杂项目的节点式流程设计，旨在提升设计师的工作效率和设计质量。

AI项目与工具 2025年06月12日 57 点赞 0 评论 512 浏览

OpenBMB

OpenBMB作为一个大型的中英文双语基础模型，通过在大规模语料库上的预训练，具备了优秀的语言处理能力。

Ai平台模型 2026年06月21日 0 点赞 0 评论 512 浏览

吐司TusiArt

吐司TusiArt是一个由上海必有回响智能科技开发的AI绘画模型分享社区和在线生图平台。平台提供了丰富的AI绘画模型，支持用户在线运行和下载，无需额外软件或硬件支持。用户可以轻松生成、编辑和分享自己的作品，并且平台还支持用户自定义模型的训练和定制。平台具有易于使用的在线生图工具、开放的模型分享平台、海量模型库以及社区互动分享功能。

AI项目与工具 2025年02月24日 36 点赞 0 评论 512 浏览

OpenMath

OpenMath-Nemotron是由英伟达推出的一系列开源数学推理模型，专为解决复杂数学问题设计，涵盖从基础到奥林匹克级别的题目。其基于大规模数据集OpenMathReasoning训练，具备长推理、多模式推理和工具集成推理能力。模型支持多种应用场景，包括数学教育、竞赛训练、学术研究和工业应用。项目提供GitHub、HuggingFace和arXiv等资源，适用于需要高精度数学推理的AI系统开发

AI项目与工具 2025年06月11日 56 点赞 0 评论 511 浏览

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言视觉模型，支持 23 种语言，具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术，确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景，具有广泛的实用价值。

AI项目与工具 2025年06月12日 70 点赞 0 评论 511 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期