开源工具

YouDub

一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。

StreamRAG

一个视频搜索和流媒体代理工具,能让您在 ChatGPT 中与您的视频库聊天并观看视频流。

Video2PPT

一个开源、免费的可以将任意视频智能转换为精美PPT的工具,它支持多种视频来源,包括本地视频文件、在线视频链接(如 YouTube、Bilibili 等),还支持实时录屏。

Chalk.ist

一款由Idered打造的开源代码截图工具,帮助开发者将代码生成为美观的图片,用户只需粘贴代码,选择主题和样式,就能快速创建美观的代码截图,支持多种编程语言。

Pandoc

一款强大的跨平台文档格式转换工具,支持数十种文件格式的相互转换,涵盖常见的文本、标记语言、电子书、演示文稿等类型,被广泛应用于学术写作、技术文档、博客写作等场景。

ThinkDiffusion

一个为用户提供专业级人工智能艺术工具的平台。它提供最新的稳定扩散用户界面,用户只需几个点击即可在任何设备上通过浏览器访问。

Reactive

一款免费开源的AI简历制作工具,支持OpenAI API集成,提供智能内容优化、语法修正、多语言简历翻译等功能。

GitDiagram

GitDiagram是一款开源工具,能够将GitHub仓库自动转换为交互式系统架构图。它基于AI技术分析代码库,生成包含组件关系的图表,并支持点击跳转到源文件。该工具支持私有仓库访问、自定义图表样式,并可导出为PNG图片或Mermaid.js代码。适用于新项目上手、团队协作、文档编写等多种场景,提升代码理解和沟通效率。

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容