模型 - 智狐AI导航

Audio

Audio-SDS是由NVIDIA研发的音频处理技术，基于文本提示引导音频生成，支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型，即可将预训练音频扩散模型扩展为多功能工具，具备高效推理能力，适用于游戏、音乐制作、教育及智能家居等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 660 浏览

Zamba2

Zamba2-7B是一款由Zyphra公司开发的小型语言模型，具有高效的推理速度和低内存占用的特点。它在图像描述任务中表现出色，适用于边缘设备和消费级GPU。Zamba2-7B通过创新的混合架构和技术优化，提供了卓越的语言理解和生成能力，同时支持多种应用场景，如移动应用开发、智能家居设备、在线客服系统、内容创作以及教育工具等。

AI项目与工具 2025年06月12日 46 点赞 0 评论 660 浏览

Openai

ChatGPT,美国OpenAI研发的聊天机器人程序 ,它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

Ai平台模型 2025年06月05日 81 点赞 0 评论 660 浏览

StableCode

StableCode，一个用于代码生成的大语言模型。StableCode 基于 GPT-NeoX 构建，该模型通过指令模型和具体应用示例进行改进，用于解决复杂的编程任务。

Ai编程建站 2025年06月05日 12 点赞 0 评论 659 浏览

RMBG

RMBG-2.0是一款基于先进AI技术的开源图像背景移除模型，通过深度学习和多模态数据处理实现了高达90.14%的准确率。该模型在高分辨率图像上经过大量训练，支持电子商务、广告、游戏开发等领域，具备高精度背景移除、多模态数据处理及云服务器无关架构等特点，为用户提供了高效、灵活的解决方案。

AI项目与工具 2025年06月12日 91 点赞 0 评论 659 浏览

Llama 3

Llama 3是Meta公司开发的一款最新大型语言模型，提供了8B和70B两种参数规模的模型。它通过增加参数规模、扩大训练数据集、优化模型架构和增强安全性等功能，显著提升了自然语言处理能力，适用于编程、问题解决、翻译和对话生成等多种应用场景。Llama 3在多个基准测试中表现出色，并且通过指令微调进一步增强了特定任务的表现。

AI项目与工具 2025年06月12日 40 点赞 0 评论 658 浏览

moonshot

moonshot-v1-vision-preview 是一款由月之暗面开发的多模态图像理解模型，具备精准的图像识别、OCR 文字识别和数据解析能力。支持 API 集成，适用于内容审核、文档处理、医学分析、智能交互等多个领域。模型可识别复杂图像细节、分析图表数据，并从美学角度进行图像评价，适合需要高效图像处理和智能交互的应用场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 658 浏览

EmaFusion

EmaFusion 是一种基于多模型融合的人工智能技术，可动态结合多种语言模型，智能选择最优组合以提升任务处理的准确性与效率。其自优化系统能根据任务复杂度和预算自动调整模型配置，并具备故障转移机制，确保系统稳定性。适用于合同分析、客户服务、数据分析、内容生成等多种企业级场景，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 52 点赞 0 评论 657 浏览

NVLM

NVLM是NVIDIA研发的多模态大型语言模型，涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构（NVLM-D、NVLM-X、NVLM-H），并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术，广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 657 浏览

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型，通过有限标量量化技术和新型架构设计，在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理，延迟低至150ms，广泛应用于智能助手、有声读物、视频配音及语言学习等领域，同时具备多语言支持和情感控制等功能。

AI项目与工具 2025年06月12日 10 点赞 0 评论 657 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期