多语言

Giga视频超级工厂

Giga视频超级工厂是一款利用AI技术进行短视频批量制作的平台,主要功能包括多元短视频生成、多语言视频翻译、多语言字幕翻译、图文转视频及报纸生成视频等。平台能够自动分析原始视频内容,批量生成适合不同平台、风格和时长的短视频,并支持配音播报、原声播报和数字人播报。平台还能够自动生成标题、口播内容、分享文案和标签,简化短视频的制作流程,帮助媒体机构在社交平台上实现短视频的高效生产和国际化传播。

Prompt Perfect

一个提示词优化工具,旨在提升大型语言模型和大型模型结果的质量,PromptPerfect 是提示词工程师、内容创建者和 AI 开发人员的理想之选,是您轻松高效地进行提示开发的通行证。

Hika

Hika 是一款由国内团队开发的免费 AI 知识搜索工具,通过交互式探索、可视化知识映射和多维度信息整合,帮助用户深入理解复杂主题。支持多语言、实时数据更新及个性化知识图谱,适用于学术研究、信息分析和个人知识管理等场景。

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型,基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型,支持多种应用场景,包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异,性能超越部分商业模型,并通过链式思考技术提升多模态推理能力。

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。

FineWeb 2

FineWeb 2是一个涵盖超过1000种语言的多语言预训练数据集,通过语言识别、去重、内容过滤及PII匿名化处理生成。它支持多种NLP任务,如机器翻译和文本分类,旨在增强多语言模型的性能与普适性,并为研究者提供技术验证的工具与资源。

TopView

TopView是一款基于AI技术的在线视频制作工具,能够自动根据输入的产品信息生成视频脚本、故事板,并提供逼真的AI头像、多语言配音及自动字幕等功能。它支持多种语言和跨平台操作,适用于电商营销、产品介绍、应用推广等多种场景,帮助用户低成本高效地制作高质量视频内容。

SkyCode

奇点智源发布的多语言开源编程大模型,采用GPT3模型结构,支持Java, JavaScript, C, C++, Python, Go, shell等多种主流编程语言,并能理解中文注释。模型可以对代码进行补全,进行解题等操作。

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库,提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台,通过低代码开发模式简化了模型的部署和定制,广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。