模型 - 智狐AI导航

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型，支持实时语音转文本，具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术，适应不同长度的音频输入，计算需求随音频长度变化而调整，适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 689 浏览

sCM

sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型，通过简化理论框架与优化采样流程，实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像，且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进，sCM不仅提高了训练稳定性，还提升了生成质量。其应用场景广泛，包括视频生成、3D建模、音频处理及跨媒介内容创作，适用于艺术设计、游戏开发、影视制作等多个行业。

AI项目与工具 2025年06月12日 50 点赞 0 评论 874 浏览

DIAMOND

DIAMOND是一款基于扩散模型的强化学习代理，专注于模拟复杂环境以支持代理的学习与决策。它在Atari游戏和3D环境中表现出色，能够捕捉丰富的视觉信息。通过连续潜在变量和优化的去噪步骤，DIAMOND提升了模型的稳定性和效率。其应用场景涵盖游戏AI开发、机器人技术、虚拟现实、教育培训及科学研究等领域。

AI项目与工具 2025年06月12日 62 点赞 0 评论 726 浏览

钛镁AI

钛镁AI是一家专注于企业级AIGC营销解决方案的平台服务商，提供从市场洞察到舆情管理的全链路服务。其核心功能包括智能体、AI搜索、数智员工、多模态生成能力及专属大模型定制，旨在帮助企业提升营销效率和决策准确性，推动营销AI化转型。

AI项目与工具 2025年06月12日 90 点赞 0 评论 642 浏览

Janus

Janus是一种由DeepSeek AI开发的自回归框架，专注于多模态理解和生成任务的统一化。它通过分离视觉编码路径并使用单一Transformer架构来提升灵活性和性能，支持多种输入模态如图像、文本等，并在某些任务中表现出色。Janus具备多模态理解、图像生成及跨模态交互能力，适用于图像创作、自动标注、视觉问答等多个领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 715 浏览

PUMA

PUMA是一款先进的多模态大型语言模型，专注于通过整合多粒度视觉特征提升视觉生成与理解能力。它支持文本到图像生成、图像编辑、条件图像生成及多粒度视觉解码等功能，适用于艺术创作、媒体娱乐、广告营销等多个领域，凭借其强大的多模态预训练和微调技术，成为多模态AI领域的前沿探索。

AI项目与工具 2025年06月12日 72 点赞 0 评论 533 浏览

Act

Act-One是一款由Runway开发的AI生成式角色表演工具，能够基于简单视频输入生成逼真的虚拟角色动画。它简化了面部动画制作流程，无需复杂设备，仅需单一摄像头即可完成，同时支持多样化角色表现和多轮对话场景生成，广泛应用于电影、动画、角色设计及叙事内容创作等领域。

AI项目与工具 2025年06月12日 25 点赞 0 评论 634 浏览

Claude 3.5 Haiku 是 Anthropic 推出的高性能人工智能模型，具备强大的编码能力和低延迟特性，适合复杂推理与问题解决任务。它通过“Unstructured Generalization”算法优化非结构化数据处理，并引入“宪法 AI”确保行为符合道德规范。此外，该模型支持“计算机使用”功能，能够模拟人类与计算机交互，广泛应用于自动化桌面任务、虚拟助手构建、医疗决策支持、教育及客

AI项目与工具 2025年06月12日 12 点赞 0 评论 592 浏览

OmniAI

OmniAI是一款基于OCR与NLP技术的智能文档处理平台，支持多种文件格式的数据提取与分类。其核心功能包括批量处理、结构化数据输出以及自定义模型开发，适用于财务审计、客户服务、法律合规、医疗健康及保险理赔等多个领域，为企业提供高效的文档智能化解决方案。

AI项目与工具 2025年06月12日 79 点赞 0 评论 580 浏览

Granite 3.0

Granite 3.0是IBM推出的一套先进的AI模型，适用于多种应用场景，包括客户服务自动化、内容创作与审核、数据分析以及编程辅助。它通过检索增强生成技术和多语言支持提升任务效率，并具备出色的安全防护能力。该模型采用深度学习和混合专家架构，经过大规模数据训练，为企业提供高效、灵活且可靠的AI解决方案。

AI项目与工具 2025年06月12日 82 点赞 0 评论 658 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期