语言处理 - 智狐AI导航

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 813 浏览

AI co

AI co-scientist 是谷歌开发的多智能体 AI 系统，旨在辅助科研人员进行从选题到实验设计的全流程工作。系统基于 Gemini 2.0 构建，具备生成假设、优化方案、文献整合等功能，通过模拟科学方法提升研究效率。已在药物重定向、靶点发现等领域取得进展，展现加速科学发现的潜力。

AI项目与工具 2025年06月12日 42 点赞 0 评论 882 浏览

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型，采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理，强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本，适用于研究、开发及各类应用场景，展现卓越性能。

AI项目与工具 2025年06月12日 67 点赞 0 评论 529 浏览

SignLLM

SignLLM是一款支持多语言手语生成的AI模型，能将文本转换为自然流畅的手语视频，覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景，提升听障人群的沟通便利性与信息获取能力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 847 浏览

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型，支持 20 种印度语言和英语，提供 69 种独特语音。该模型基于深度学习架构，通过描述性文本输入实现对音调、语速、情感等参数的灵活控制，适用于多种语音合成场景。在低资源语言上表现优异，具备高自然度和清晰度的语音输出能力。

AI项目与工具 2025年06月12日 55 点赞 0 评论 495 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 836 浏览

FlashMLA

FlashMLA 是 DeepSeek 开发的开源 MLA 解码内核，针对 NVIDIA Hopper 架构 GPU 优化，提升可变长度序列处理效率。支持 BF16 精度、页式 KV 缓存及分块调度，内存带宽达 3000 GB/s，算力达 580 TFLOPS。适用于大语言模型推理和 NLP 任务，具备高性能与低延迟特性，支持快速部署与性能验证。

AI项目与工具 2025年06月12日 12 点赞 0 评论 685 浏览

Argon

Argon 是一款面向制药与生命科学行业的智能平台，利用AI技术加速药物开发流程。其核心功能包括自然语言处理、多源数据整合、自动化工作流、临床试验优化及竞争情报分析。平台可帮助用户快速获取关键洞察，提升决策效率，并实时追踪行业动态。

AI项目与工具 2025年06月12日 24 点赞 0 评论 509 浏览

AgentRefine

AgentRefine 是由北京邮电大学与美团联合开发的智能体合成框架，采用“精炼调整”方法提升基于大语言模型的智能体在多样化任务中的泛化能力。它通过轨迹中的观察实现错误纠正与自我优化，增强智能体在复杂环境中的适应性和鲁棒性。该框架支持多样化推理路径，广泛应用于自动化决策、游戏 AI、代码生成及自然语言处理等领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 732 浏览

SurveyX

SurveyX 是一款基于大型语言模型的学术综述生成工具，由多所高校联合开发。它通过用户输入的标题和关键词，自动生成高质量、结构化的学术综述，适用于多个研究领域。系统具备高效的文献检索与整合能力，结合智能大纲生成和内容优化技术，提升综述的准确性和逻辑性。同时支持动态更新和多模态展示，广泛应用于科研、教学及行业分析场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 557 浏览

语言处理

首页

语言处理

列表

默认

浏览次数

发布日期