多语言

ClassPoint AI

ClassPoint AI 是一种由 AI 驱动,可从 PowerPoint 幻灯片生成测验问题。它使用先进的人工智能技术来分析幻灯片内容,只需单击一下即可创建发人深省的问题。

Mistral Small 3

Mistral Small 3 是一款由 Mistral AI 推出的开源大语言模型,具备 240 亿参数,支持多语言处理,适用于低延迟场景。模型基于 Transformer 架构,支持长文本输入,具备高性能和本地部署能力。其可定制性强,适用于虚拟助手、客服系统、自动化任务及专业领域应用,如医疗和法律咨询。

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库,提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台,通过低代码开发模式简化了模型的部署和定制,广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

Hika

Hika 是一款由国内团队开发的免费 AI 知识搜索工具,通过交互式探索、可视化知识映射和多维度信息整合,帮助用户深入理解复杂主题。支持多语言、实时数据更新及个性化知识图谱,适用于学术研究、信息分析和个人知识管理等场景。

Content At Scale

一个强大的AI SEO写作工具,它通过自动化和优化的内容创作流程,帮助营销人员和企业主提高在线可见性和品牌影响力。它的深度研究功能和多语言支持使其成为全球营销人员的强大工具。

Giga视频超级工厂

Giga视频超级工厂是一款利用AI技术进行短视频批量制作的平台,主要功能包括多元短视频生成、多语言视频翻译、多语言字幕翻译、图文转视频及报纸生成视频等。平台能够自动分析原始视频内容,批量生成适合不同平台、风格和时长的短视频,并支持配音播报、原声播报和数字人播报。平台还能够自动生成标题、口播内容、分享文案和标签,简化短视频的制作流程,帮助媒体机构在社交平台上实现短视频的高效生产和国际化传播。

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。

Toucan TTS

Toucan TTS是一款由德国斯图加特大学自然语言处理研究所开发的文本到语音合成工具箱。它基于Python和PyTorch构建,支持超过7000种语言及多种方言和变体。主要功能包括多说话人语音合成、语音风格克隆、人机交互编辑、语音参数调整以及发音清晰度和性别特征调整。该工具箱适用于语音模型教学、文字朗读和多语言应用开发等场景,并提供在线交互式演示功能,方便用户快速理解和使用。

SenseVoice

一款阿里通义实验室发布的FunAudioLLM框架多语言音频基础模型,SenseVoice具有多语种、混合语言、音色和情感控制能力。

SkyCode

奇点智源发布的多语言开源编程大模型,采用GPT3模型结构,支持Java, JavaScript, C, C++, Python, Go, shell等多种主流编程语言,并能理解中文注释。模型可以对代码进行补全,进行解题等操作。