开源

Moffee

Moffee是一款开源的Markdown转PPT工具,允许用户通过Markdown语法高效地创建专业的幻灯片。该工具具备自动化布局功能,能够智能处理幻灯片的布局、分页和样式,同时支持实时预览和导出为PDF或HTML格式。Moffee支持多种内置主题,使得用户可以根据需要选择合适的样式,适合普通用户和开发者使用。

MAI

MAI-DS-R1 是微软基于 DeepSeek R1 优化的 AI 模型,具备高敏感话题响应能力(99.3%),有害内容风险降低 50%,并保持与原版相同的推理水平。支持多语言输出,适用于国际组织、企业及教育机构。已开源,可用于研究与开发,适用于内容审核、多语言客服、学术研究等多种场景。

Gemini Fullstack LangGraph Quickstart

Gemini Fullstack LangGraph Quickstart 是谷歌DeepMind推出的开源项目,旨在帮助开发者快速搭建基于 Google Gemini 2.5 和 LangGraph 的全栈智能研究助手。项目包含 React 前端和 LangGraph 后端,支持动态生成搜索查询、网络研究、反思推理、迭代优化搜索结果,并生成带有引用的综合答案。支持本地开发和 Docker 部署,

MaskGCT

MaskGCT是一款基于掩码生成模型与语音表征解耦编码技术的语音合成大模型,由趣丸科技与香港中文大学(深圳)联合开发。其主要功能包括声音克隆、跨语种语音合成、语音控制及高质量语音数据集支持。该模型在多个TTS基准数据集上表现优异,可快速精准地克隆音色并灵活调整语音属性,适用于多种语言,已开源并面向全球用户开放。

VisActor

一种源自字节跳动的众多可视化场景的数据可视化解决方案。VisActor不仅涵盖了传统的可视化场景,还特别强调叙事可视化和智能可视化。

HyperChat

HyperChat 是一款开源的 AI 聊天客户端,支持多种语言模型 API 接入,如 OpenAI、Claude 等。基于 MCP 协议构建,具备插件扩展能力,支持多对话空间、Agent 自定义、WebDAV 同步等功能。适用于个人学习、团队协作、内容创作、代码开发及企业服务等多种场景,提供跨平台运行与灵活部署方式,兼顾高效性与安全性。

Pipecat

Pipecat是一款开源Python框架,用于构建语音和多模态对话系统。它整合了语音识别、文本转语音及对话处理功能,支持与主流AI平台集成,采用模块化管道架构,提升开发效率。基于帧的实时处理机制确保流畅交互,适用于语音助手、企业服务、教育、医疗及多模态应用等多种场景。

AgiBot World

AgiBot World是一个由智元机器人开发的百万真机数据集,专注于具身智能技术的研究。它涵盖了80多种日常生活技能,涉及家居、餐饮、工业、商超及办公五大场景,数据规模和质量均领先于谷歌的Open X-Embodiment。数据采集利用了智元自建的工厂和实验基地,通过8个摄像头和6自由度灵巧手等先进硬件,确保了全域真实场景下的高质量数据获取。项目还计划开源仿真数据、发布具身基座大模型及配套工具链

CogView4

CogView4是一款由智谱推出的开源文生图模型,具有60亿参数,支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异,达到当前开源模型的领先水平。模型具备强大的语义理解能力,尤其在中文文字生成方面表现突出,适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer,并采用显存优化技术提升推理效率。

快手可图

快手可图大模型(Kolors)是快手公司自主研发的一款AI图像生成工具。支持文生图和图生图两大功能并提供了20多种AI图像玩法,Kolors可用于AI创作图像以及AI形象定制。