多语言支持

Relingo

帮助你在浏览任何网页的时候自动提取生词、划词划句翻译、全文沉浸式翻译,Relingo帮助你轻松掌握语言和词汇。

Pixtral Large

Pixtral Large是一款由Mistral AI开源的超大规模多模态模型,具备1240亿参数,支持文本、图像和图表的理解与生成。它拥有128K的上下文窗口,能在多语言环境中处理复杂文档和多图像场景,广泛应用于教育、医疗、客服和内容审核等领域。

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。

Eleven Labs

Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

书译

书译是一款基于 ChatGPT API 人工智能技术的全书翻译工具,能够快速准确地将整本 EPUB、PDF 格式的书籍翻译成你想要的语言。

腾讯交互翻译TranSmart

腾讯交互翻译TranSmart是由腾讯AI Lab发布的一款AI辅助翻译产品,可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量,支持大型文件的免费翻译。

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架,能够将静态照片转化为高质量动态视频。其核心在于混合引导机制,结合隐式面部表示、3D头球和身体骨架,实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配,适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域,具备高保真、强连贯性和广泛适用性。

琅琅配音

琅琅配音是一款卓越的智能文本转语音工具,提供语音合成服务。

PageOn.ai

PageOn.ai是一个AI驱动的内容创作平台,帮助用户快速生成高质量的视觉内容。通过AI Agent理解用户需求,自动生成动态视觉元素,如互动图表、3D模型和媒体内容。用户只需描述外观和感觉,AI即可转化为视觉表达。平台具备深度搜索功能,支持拖放和斜杠命令组合内容,打造个性化视觉故事。主要功能包括AI生成幻灯片、智能演示、数据图表生成、实时语音交互和多人协作等,适用于教学演示、商务会议、项目汇报

Surya

Surya是一款开源OCR工具包,专注于文档识别,支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素,并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法,Surya在处理复杂文档时表现出色,广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---