开源

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。

Awesome Chinese LLM

整理了开源的中文大语言模型(LLM),主要关注规模较小、可私有化部署且训练成本较低的模型,目前已收录了100多个相关资源。

n8n

n8n是一款开源的自动化工作流管理系统,采用低代码平台设计,支持拖放式工作流创建,无需编程即可实现复杂业务流程的自动化。其核心功能包括工作流自动化、多应用集成、数据转换与错误处理,同时具备强大的调试和日志记录能力。n8n基于Docker容器化部署,支持事件驱动和数据流处理,广泛应用于数据集成、报告生成、客户支持自动化及社交媒体管理等多个领域。

书生·筑梦2.0(Vchitect 2.0)

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型,支持文本到视频和图像到视频的转换,生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架,适用于广告、教育、影视等多个领域。

GOT-OCR2.0

创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。

Open Notebook

Open Notebook是一款开源、注重隐私的笔记管理工具,支持多笔记本和多AI模型(如Open AI、Anthropic)。它具备播客生成器、内容集成、AI驱动笔记、集成搜索等核心功能,适用于学术研究、教育、企业知识管理和个人知识整理等多个场景,通过自然语言处理和搜索技术提升信息处理效率。

DataRoom

一个高度集成的、开源的大屏设计与数据可视化工具,基于SpringBoot、MyBatisPlus、Vue、ElementUI、G2Plot和Echarts等技术栈构建。

MedGemma

MedGemma是谷歌推出的开源AI模型,专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告,27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署,适用于医疗诊断、患者分诊、临床决策辅助等场景,提升医疗服务效率与准确性。

万木健康

万木健康,AIGC超写实医生数字人运营商。

Blinko

Blinko是一款开源的个人笔记工具,具备AI增强的搜索功能,支持自然语言查询,便于用户快速定位笔记内容。它兼容Markdown,支持标签管理和批量操作,同时确保数据存储在用户自有的服务器中,保障隐私与安全。Blinko适用于个人知识管理、创意写作、项目规划、日常任务管理和学习复习等多个场景。