多语言支持

Le Chat APP

Le Chat APP是一款由Mistral AI推出的AI对话工具,支持自然语言交互、实时搜索、文档分析与图像生成。提供免费基础版和付费Pro版,支持多语言及移动端使用,适用于学习、旅行规划、创意激发等多种场景。

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器,专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术,能够在不同计算预算下灵活调整模型性能。支持多语言输入,并具备开源特性,适用于创意设计、影视制作、教育等多个领域。实验表明,其生成质量接近行业领先水平,同时显著降低计算成本。

PictureThis

PictureThis是一款基于AI技术的植物识别应用,支持超过17000种植物的精准识别,具备疾病诊断、个性化护理建议、毒性警告等功能。用户可通过拍照快速获取植物信息,提升园艺管理效率。应用支持多语言,适合全球用户使用,同时提供社区互动和离线功能,方便日常使用。

播记

播记是一款基于AI技术的播客节目笔记生成工具,能够自动提取音频内容中的关键信息,生成包含主题、嘉宾介绍、观点及时间戳的详细笔记。支持多种格式导出,便于内容管理和二次创作。适用于社交媒体、邮件简报、博客文章等多种场景,具备智能分类、多语言支持及内容优化功能,提升播客内容的传播效率与质量。

Lumina

Lumina-Image 2.0 是一款开源图像生成模型,基于扩散模型与 Transformer 架构,具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像,支持中英文提示词,并具备强大的复杂提示理解能力。模型支持多种推理求解器,适用于艺术创作、摄影风格图像生成及逻辑推理场景,兼具高效性和灵活性。

BlipCut

BlipCut是一款基于AI的视频处理工具,支持130多种语言的视频翻译、自动字幕生成、AI配音和唇形同步。用户可上传视频或链接,一键生成多语言版本,并支持语音克隆、智能剪辑及批量处理,适用于内容创作、教育、营销等场景。

MUSIC.AI

MUSIC.AI 是一款基于人工智能的音频处理平台,提供音频分离、混音、母带处理、语音转换、歌词转录等功能,支持多语言翻译与本地化。平台已处理超 10 亿分钟音频,服务数千万用户,适用于音乐制作、视频剪辑及现场演出等多种场景,显著提升音频处理效率与质量。

DeepRant 鲸喷

DeepRant 鲸喷是一款专为游戏玩家设计的多语言快捷翻译工具,支持多种翻译引擎,具备自定义短语库、全局快捷键、多语言互译等功能。基于 Tauri 和 Rust 开发,性能稳定,内存占用低,适用于跨服竞技、国际社交及多人游戏等场景。完全免费开源,无需配置 API,便于玩家快速上手使用。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。