模型 - 智狐AI导航

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统，基于增强型视频大型语言模型，实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准，支持对象识别、关系分析、推理预测及多模态交互等功能，适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 698 浏览

琴乐大模型

琴乐大模型是一款由腾讯AI Lab与腾讯TME天琴实验室联合开发的人工智能音乐创作工具。该工具能够根据用户输入的关键词、描述性语句或音频，生成高质量的立体声音频或多轨乐谱，并支持自动编辑功能。琴乐大模型采用先进的技术框架，包括音频文本对齐、乐谱/音频表征提取、大语言模型预测以及流匹配和声码器技术，确保生成的音乐符合音乐理论和人类审美标准。

AI项目与工具 2025年06月12日 33 点赞 0 评论 698 浏览

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 698 浏览

LongWriter

LongWriter是一款由清华大学与智谱AI合作开发的长文本生成模型，能够生成超过10,000字的连贯文本。该模型基于增强的长上下文大型语言模型，采用了直接偏好优化（DPO）技术和AgentWrite方法，能够处理超过100,000个token的历史记录。LongWriter适用于多种应用场景，包括学术研究、内容创作、出版行业、教育领域和新闻媒体等。

AI项目与工具 2025年06月12日 67 点赞 0 评论 697 浏览

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型，支持实时语音转文本，具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术，适应不同长度的音频输入，计算需求随音频长度变化而调整，适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 697 浏览

Delta

Delta-CoMe是一种由清华大学NLP实验室牵头研发的增量压缩算法，它通过低秩分解与混合精度量化技术，显著减少了大型语言模型的存储和内存需求，同时保持了模型性能几乎无损。该工具支持多任务处理、推理加速，并广泛适用于云计算、边缘计算及学术研究等领域，特别擅长应对数学、代码和多模态任务。

AI项目与工具 2025年06月12日 58 点赞 0 评论 697 浏览

k1.5

k1.5 是月之暗面推出的多模态思考模型，具备强大的数学、代码、视觉推理能力。在 short-CoT 模式下，性能超越主流模型 550%，在 long-CoT 模式下达到 OpenAI o1 水平。支持文本与图像的联合处理，适用于复杂推理、跨模态分析、教育、科研等领域。通过长上下文扩展和策略优化，提升推理效率与准确性。

AI项目与工具 2025年06月12日 38 点赞 0 评论 697 浏览

孟子 GPT 大语言模型

孟子 GPT 大语言模型是澜舟科技推出的一款强大的AI工具，它具备处理复杂NLP任务的能力，支持多语言和多模态输入，并在多个领域内展现出卓越的性能。

Ai平台模型 2026年06月24日 0 点赞 0 评论 697 浏览

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架，专为长视频设计。该框架结合自回归模型和扩散渲染技术，生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本，适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

AI项目与工具 2025年06月12日 34 点赞 0 评论 696 浏览

FaceLift

FaceLift是一种由Adobe与加州大学默塞德分校联合开发的AI工具，能够从单张人脸图像中重建出高精度的3D头部模型。其核心技术包括多视图扩散模型和GS-LRM重建器，支持多视角一致性、身份保持和4D新视图合成，适用于虚拟现实、数字娱乐、远程交互等多个领域。该工具具备强大的几何与纹理细节表现能力，且可与2D面部重动画技术集成，广泛应用于内容创作与科研场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 695 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期