开源

dots.llm1

dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts(MoE)文本大模型,拥有 1420 亿参数,激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练,采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术,提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮

GitDiagram

GitDiagram是一款开源工具,能够将GitHub仓库自动转换为交互式系统架构图。它基于AI技术分析代码库,生成包含组件关系的图表,并支持点击跳转到源文件。该工具支持私有仓库访问、自定义图表样式,并可导出为PNG图片或Mermaid.js代码。适用于新项目上手、团队协作、文档编写等多种场景,提升代码理解和沟通效率。

MiniCPM 4.0

MiniCPM 4.0是面壁智能推出的高效端侧大模型,包含8B和0.5B两种参数规模。其采用创新稀疏架构和三值量化技术,实现模型体积缩小90%并保持高性能。自研CPM.cu推理框架在极限场景下可提升220倍速度,支持多种开源框架部署,并适配主流芯片。具备高效双频换挡机制、多平台适配和多种版本选择,适用于智能辅导、医疗辅助、客服、游戏剧情生成等场景。

Gemini Fullstack LangGraph Quickstart

Gemini Fullstack LangGraph Quickstart 是谷歌DeepMind推出的开源项目,旨在帮助开发者快速搭建基于 Google Gemini 2.5 和 LangGraph 的全栈智能研究助手。项目包含 React 前端和 LangGraph 后端,支持动态生成搜索查询、网络研究、反思推理、迭代优化搜索结果,并生成带有引用的综合答案。支持本地开发和 Docker 部署,

PandaWiki

PandaWiki 是一个开源的 AI 知识库搭建系统,基于 AI 大模型的能力,帮助用户快速构建智能化的产品文档、技术文档、FAQ 和博客系统。其核心功能包括 AI 辅助创作、AI 问答和 AI 搜索,显著提升知识管理的效率和智能化水平。支持富文本编辑,兼容 Markdown 和 HTML,可导出为多种格式,并支持与第三方应用集成。用户可通过多种方式导入内容,适用于产品文档管理、FAQ 系统、知

Jaaz

Jaaz是一款开源的AI设计Agent,提供本地免费的AI设计服务。它能智能生成设计提示,批量生成图像、海报和故事板,并支持Ollama、Stable Diffusion等本地图像和语言模型。用户可通过GPT-4o、Flux Kontext等技术在对话中编辑图像,进行对象移除和风格转换。Jaaz提供无限创意画布,适用于创意设计、快速原型、教育及个人创作等多种场景。

Circuit Tracer

Circuit Tracer 是 Anthropic 推出的开源工具,用于研究大型语言模型的内部工作机制。它通过生成归因图揭示模型在生成特定输出时的决策路径,帮助研究人员追踪模型的决策过程、可视化特征关系并测试假设。支持多种主流模型如 Gemma 和 Llama,提供交互式可视化界面,便于探索和分析模型行为。其功能包括生成归因图、可视化与交互、模型干预以及支持多种模型。

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具,集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能,支持多客户端和多场景应用。基于标准化接口和开源生态,提供高效、灵活的数字生产力解决方案,适用于内容创作、虚拟主播、在线教育等多个领域。

WebAgent

WebAgent是阿里巴巴开源的自主搜索AI Agent,具备端到端的自主信息检索与多步推理能力。它能主动搜索多个学术数据库,筛选、分析最相关的文献,整合不同文献中的观点,为用户提供全面且精准的研究报告。WebAgent基于创新的数据合成方法和高效的训练策略,实现高效的多步推理和信息检索能力,适用于学术研究、商业决策和日常生活等多种场景。

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容