自然语言处理

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 813 浏览

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型，支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项，适用于不同场景。其基于开源框架开发，易于扩展，可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 582 浏览

Magma

Magma是微软研究院开发的多模态AI基础模型，具备理解与执行多模态任务的能力，覆盖数字与物理环境。它融合语言、空间与时间智能，支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练，Magma在零样本和微调设置下表现优异，适用于网页操作、机器人控制、视频理解及智能助手等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 567 浏览

LLaDA是一款基于扩散模型框架的新型大型语言模型，由中国人民大学高瓴AI学院与蚂蚁集团联合开发。它通过正向掩蔽和反向恢复机制建模文本分布，采用Transformer作为掩蔽预测器，优化似然下界提升生成效果。LLaDA在上下文学习、指令遵循和双向推理方面表现突出，尤其在反转推理任务中克服了传统自回归模型的局限。其8B参数版本在多项基准测试中表现优异，适用于多轮对话、文本生成、代码生成、数学推理和语

AI项目与工具 2025年06月12日 66 点赞 0 评论 700 浏览

LangFlow

LangFlow 是一款低代码 AI 应用开发工具，支持可视化工作流构建、多代理对话管理和 RAG 技术，适用于智能客服、文档问答和内容生成等场景。提供预置组件、API 发布、Python 自定义及云部署功能，提升开发效率与灵活性。

AI项目与工具 2025年06月12日 50 点赞 0 评论 485 浏览

Finedefics

Finedefics是由北京大学彭宇新教授团队开发的细粒度多模态大模型，专注于提升多模态大语言模型在细粒度视觉识别任务中的表现。该模型通过引入对象的细粒度属性描述，结合对比学习方法，实现视觉对象与类别名称的精准对齐。在多个权威数据集上表现出色，准确率达76.84%。其应用场景涵盖生物多样性监测、智能交通、零售管理及工业检测等领域。

AI项目与工具 2025年06月12日 10 点赞 0 评论 809 浏览

FoloUp

FoloUp 是一款开源的 AI 语音面试平台，能根据职位描述自动生成面试问题，并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成，提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘，结合语音识别、NLP 和安全数据管理技术，适用于多种招聘场景，提升招聘效率与质量。

AI项目与工具 2025年06月12日 74 点赞 0 评论 779 浏览

Perplexity Deep Research

Perplexity Deep Research 是一款基于 AI 的深度研究工具，能执行多轮搜索并整合海量信息，生成结构化研究报告，支持多种格式导出。具备强大的推理能力与高效处理速度，适用于金融、市场、技术等多个领域，也可用于个人场景。在准确性方面优于多个主流模型，提供免费与付费两种使用模式。

AI项目与工具 2025年06月12日 98 点赞 0 评论 650 浏览

Long

Long-VITA是一款由腾讯优图实验室、南京大学和厦门大学联合开发的多模态AI模型，支持处理超长文本（超过100万tokens）及多模态输入（图像、视频、文本）。通过分阶段训练提升上下文理解能力，结合动态分块编码器与并行推理技术，实现高效处理长文本和高分辨率图像。模型基于开源数据训练，适用于视频分析、图像识别、长文本生成等场景，性能在多个基准测试中表现突出。

AI项目与工具 2025年06月12日 65 点赞 0 评论 847 浏览

NPOA

NPOA是一款开源的舆情监测工具，支持实时数据采集、情感分析、话题分类及多渠道媒体分析，适用于企业品牌管理、政府舆论监控、市场研究等多个领域。系统提供预警机制、可视化报告和大屏展示功能，便于用户快速获取关键信息并做出应对。

AI项目与工具 2025年06月12日 60 点赞 0 评论 723 浏览

自然语言处理

首页

自然语言处理

列表

默认

浏览次数

发布日期