ExtractPDF 一款免费的在线PDF提取器。可从PDF文件中提取图像,文本和字体。Extract,PDF无需安装和注册就可以使用。 格式转换 2025年06月05日 35 点赞 0 评论 638 浏览
星火纪要 星火纪要是科大讯飞推出的音视频处理平台,支持语音转录、内容总结、多语言翻译、数据分析等功能,适用于会议、访谈、销售、培训等场景。系统可快速生成会议纪要,角色分离准确率超95%,支持12种场景模板,提升工作效率与信息管理能力。 AI项目与工具 2025年06月12日 49 点赞 0 评论 638 浏览
FreeAskInternet FreeAskInternet是一款免费开源的本地AI搜索引擎,集成了先进的大型语言模型和元搜索引擎,支持本地化搜索聚合和智能答案生成。它确保用户数据的私密性和安全性,无需GPU支持即可运行,并提供自定义的大型语言模型选项。此外,FreeAskInternet具备友好的用户界面,可通过简单的部署流程快速搭建。 AI项目与工具 2025年06月12日 76 点赞 0 评论 638 浏览
TECHSPECS TechSpecs Ray是一款由AI驱动的媒体播放器,主要功能包括实时多语言字幕生成与翻译、智能媒体搜索及分类、主流流媒体平台集成等。它支持上千种媒体格式,可跨多平台运行,致力于消除语言壁垒,提升全球用户的媒体访问体验。 AI项目与工具 2025年06月12日 83 点赞 0 评论 638 浏览
BiRead BiRead是一款基于人工智能技术的浏览器扩展工具,支持即时双语转换、广泛的语言支持、学习模式以及社交媒体翻译等功能。它帮助用户克服语言障碍,提高阅读外文内容时的理解能力,适用于多种应用场景,如学术研究、商务交流、日常娱乐等。 AI项目与工具 2025年06月12日 95 点赞 0 评论 637 浏览
kokoroTTS 一款开源、高性能的文本转语音(TTS)模型,Kokoro TTS拥有8200万参数,基于StyleTTS 2架构,提供高质量、自然的语音合成,适用于有声书、播客等。 Ai语音工具 2025年06月05日 80 点赞 0 评论 637 浏览
MegaTTS 3 MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统,采用轻量级扩散模型,支持中英文及混合语音合成,具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模,可快速生成高质量语音,适用于教育、内容制作、语音交互等多个领域。 AI项目与工具 2025年06月12日 29 点赞 0 评论 636 浏览
OpenL.club OpenL.club是一个将市面上所有的翻译引擎聚合到一块,然后可以横向对比各家翻译引擎的结果,然后选取最佳的翻译的工具。 Ai办公效率 2025年06月05日 24 点赞 0 评论 635 浏览
SadTalker SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频,通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情,PoseVAE合成不同风格的头部运动,并采用3D面部渲染技术,实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力,适用于虚拟助手、视频制作、语言学习、社交媒体和教育等 AI项目与工具 2025年06月12日 71 点赞 0 评论 634 浏览