开源

StarVector

StarVector 是一个开源多模态视觉语言模型,支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构,结合图像编码与语言模型,生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练,适用于图标设计、艺术创作、数据可视化等多种场景,具备良好的性能和扩展性。

memobase

Memobase 是一个开源用户记忆系统,专为生成式 AI 应用设计,支持长期用户数据存储与管理。具备时间感知、灵活配置、高效集成与批量处理能力,适用于虚拟助手、教育工具、用户分析等场景。通过结构化用户画像和事件序列管理,提升 AI 的个性化服务能力,支持大规模用户环境下的稳定运行。

anime.gf

Anime.gf 是一款基于开源技术开发的本地应用程序,支持用户创建和管理个性化虚拟角色。它利用先进的自然语言处理技术和多种大型语言模型 API,提供智能化的对话体验。主要功能涵盖角色创建、编辑与删除、多 API 接入、聊天记录管理以及响应再生成等。适用于娱乐、情感陪伴、语言学习、故事创作、教育辅助以及心理治疗等多个领域。

PDFtoChat

PDFtoChat 是一款基于 AI 技术的开源工具,支持用户通过自然语言对话与 PDF 文件交互。它具备强大的文档解析、智能检索和即时反馈能力,广泛应用于学术研究、法律咨询、商业分析、教育培训和技术文档查询等领域,显著提升文档处理效率。

GPTsApp.io

第三方GPTs商店,由 GPT-4 Turbo 和 Pinecone 提供支持,收录了超过60万的公共GPTs, 为用户提供GPTs排名,收藏, 评测等功能。

SleepFM

SleepFM是一款由斯坦福大学开发的开源多模态睡眠分析模型,利用脑电图(EEG)、心电图(ECG)和呼吸信号等数据,实现睡眠阶段分类、睡眠呼吸障碍检测及人口统计属性预测等功能。它通过对比学习技术和自监督预训练方法提升分析精度,并支持临床诊断、药物开发、健康管理等多个应用场景,为睡眠医学研究提供重要工具。

InstantMesh

一个基于单张图片,利用先进的稀疏视图大型重建模型(LRM)架构,快速生成3D网格(Mesh)的工具

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具,用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎,支持 100 多种语言,具备图像优化、纠偏、清洁等功能,提升识别准确率。支持多核处理与批量操作,适合高效处理大量文件,且完全离线运行,保障数据安全。

OuteTTS

OuteTTS是一款基于开源技术的文本到语音(TTS)工具,利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音,具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容,适用于有声读物、智能客服、语音导航等多种应用场景。

II

II-Agent 是一个开源的 Agent 框架,通过与大型语言模型(LLM)交互,简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口,适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。