机器翻译

MMMLU

重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。

Pangea

Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型,支持39种语言,具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等,同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构,适用于多语言客户服务、教育、跨文化交流等多个领域。

Manga Image Translator

Manga Image Translator 是一个开源的漫画图片文字翻译工具,基于 OCR 和机器翻译技术,实现对漫画和图片中文字的自动识别与翻译。它支持多语言翻译,包括日文、中文、英文和韩文,并具备图像合成能力,保持原图风格。工具提供批量处理和在线/离线翻译功能,适用于漫画爱好者、语言学习者以及出版商等用户群体。

Deepl翻译

DeepL 自德国的初创公司,官网号称全世界最准确的翻译,最初的翻译服务主要以欧洲语系为主。在中英互翻、日英互翻的表现上远胜于 Google 翻译。

Lingvanex

一个全面的翻译工具,包括文本、语音、图片和文档翻译应用。它利用神经机器翻译技术提高生产力。

Chonkie

Chonkie是一款轻量级、高性能的RAG分块库,支持多种分块方法(基于Token、单词、句子和语义),适用于自然语言处理任务。它具备高效性能、广泛tokenizer支持及灵活的安装选项,适用于RAG应用、对话系统、文本摘要和机器翻译等场景。

语鲸大模型

语鲸大模型是一个多功能的AI语言处理工具,它通过先进的算法和持续的学习,为用户提供高效、准确的语言服务。

Qwen3

Qwen3 是阿里巴巴推出的下一代大型语言模型,支持“思考模式”和“非思考模式”,适用于复杂与简单任务。具备 119 种语言支持,优化了编码与 Agent 能力,数据量达 36 万亿 token,采用四阶段训练流程。提供多种模型配置,涵盖从轻量级到企业级应用。在多项基准测试中表现优异,广泛应用于文本生成、机器翻译、法律文书、技术文档、医疗辅助等领域。

MEXMA

MEXMA是一种由Meta AI研发的预训练跨语言句子编码器,通过结合句子级和词语级目标优化句子表示质量。它支持80种语言,广泛应用于跨语言信息检索、机器翻译、多语言文本分类、语义文本相似度评估及跨语言问答系统等领域,并展现出卓越的性能。

火山翻泽

火山翻泽是字节跳动旗下火山引肇团队推出的Ai翻译工具,内置权威词典、支持多种查词方式;10+ 语种丰富音色免费开放,练听力练跟读;PDF文字格式整理、对照阅读模式、个人术语库。