多语言

Riverside

Riverside 是一款 AI 转录工具,允许用户快速可靠地转录 100 多种语言的音频和视频文件。它具有易于使用的界面、出色的准确性、说话人识别功能,并支持多种文件类型。

Freed

Freed是一款基于AI技术的医疗文档助手,通过语音转录和自然语言处理技术,实现医患对话的自动化记录与结构化文档生成。其核心功能包括环境感知技术、个性化学习以及多语言支持,广泛适用于门诊、住院、急诊及远程医疗等多种医疗场景,旨在减轻医生文书负担,提升工作效率。

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型,支持多语言、多模态处理,具备文本、图像及短视频分析能力。提供多种模型尺寸,适配不同硬件环境,优化了单 GPU/TPU 性能,推理速度提升显著。内置图像安全分类器,增强内容安全性。支持多种开发工具和部署方式,适用于人脸识别、物体检测、智能助手、文本分析等场景。

Omakase AI

Omakase AI 是一款基于AI技术的智能购物助手,支持多平台整合与多语言界面,可根据用户输入的网址和偏好提供个性化商品推荐。具备智能筛选、实时更新、用户反馈优化等功能,适用于个人购物、电商运营及数据分析场景,提升购物体验与决策效率。

海豚配音

一款集逼真效果、丰富音色和细腻情感于一体的全能AI配音平台。拥有超过500种栩栩如生的真人音色和1000多种独具特色的二次元音色。

Maya

Maya是一款开源多语言多模态模型,基于LLaVA框架开发,支持中文、法语、西班牙语等多种语言,专注于提升低资源语言的AI内容生成能力。它结合图像和文本数据,实现跨模态对齐和指令微调,广泛应用于跨语言内容理解、图像分析、教育和电子商务等领域。

EchoMimicV2

EchoMimicV2是一款由阿里巴巴蚂蚁集团研发的AI数字人动画生成工具,能够基于参考图片、音频剪辑及手部姿势序列生成高质量的半身动画视频。它支持多语言(中英双语)输入,并通过音频-姿势动态协调、头部局部注意力及特定阶段去噪损失等技术手段显著提高了动画的真实度与细节表现力,适用于虚拟主播、在线教育、娱乐游戏等多个领域。

发现报告

国内最权威的行业研究报告数据平台之一,发现报告收录了海量的行业报告、公司研究报告和券商研报,用户可以免费阅读和下载这些报告。平台提供智能分类搜索和全文关键词匹配功能,支持PDF和Word格式下载。

知云文献翻译

一款专业文献论文阅读与论文翻译工具,用户可以通过选中PDF中的文字,右侧会显示翻译结果,知云文献翻译还支持多篇PDF的同时阅读,极大提高了文献阅读的效率。

SkipWatch AI

一款AI驱动的YouTube视频总结工具,可一键生成视频摘要,支持多语言,能提取关键信息,适用于学生、职场人士等用户群体。