开源

AIGCPanel

AIGCPanel是一款开源的AI数字人系统,支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法,实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能,可应用于影视制作、虚拟主播、教育培训等多个领域。

Roop

Roop是一款开源的AI视频换脸工具,支持用户通过一张图片替换视频中的面部,无需复杂的数据集或训练过程。它具有多种功能,包括一键换脸、多参数配置、面部对齐和性能加速。Roop利用生成对抗网络(GANs)生成逼真的面部图像,并能自动检测和对齐视频中的面部。其应用场景广泛,包括娱乐、社交媒体、电影制作、教育和艺术创作等领域。

IconPark图标库

字节跳动设计并开源的图标库,IconPark可以实现根据单一SVG源文件变换出多种主题, 具备丰富的分类、更轻量的代码和更灵活的使用场景

Omages

Omages是一个开源的3D模型生成项目,基于图像扩散技术将3D形状的几何和纹理信息编码到64×64像素的2D图像中。该工具不仅提高了3D对象生成的效率,还在低分辨率下保留丰富的细节。Omages支持3D对象生成、几何和纹理编码、多图谱表示以及自动材质生成等功能。它适用于3D打印与制造、虚拟现实、增强现实、游戏开发、电影和动画制作及室内设计等多种应用场景。

Gzm Design

一个免费开源的海报设计器,Gzm Design使用最新的Vue3,vite4,TypeScript等主流技术开发,开箱即用。

Yuxi

Yuxi-Know是一款基于RAG和知识图谱技术的智能问答平台,支持多种文档格式上传与向量化存储,可高效检索并生成准确答案。集成Neo4j知识图谱,支持复杂关系查询,兼容多模型平台及本地部署。提供智能体拓展、网页检索和可视化配置功能,适用于企业知识管理、教育、客服、医疗及科研等领域,提升信息处理效率与准确性。

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型,采用量化感知训练技术,在降低显存需求的同时保持高性能。它支持多模态任务,具备 128,000-token 长上下文处理能力,并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景,同时兼容多种推理框架,便于部署。

Pake Plus

一个开源免费的应用打包工具,可将网页、Vue/React 项目编译后的 dist 文件、静态 html 文件快速打包为桌面应用和手机应用。

OpenCodeInterpreter

通过结合大型语言模型和代码执行反馈,提供了一个强大的工具,可以帮助开发者在软件开发过程中提高效率和质量。

TÜLU 3

TÜLU 3是艾伦人工智能研究所发布的开源指令遵循模型,提供8B、70B及未来的405B版本。它通过后训练技术显著提升了模型在数学、编程和推理等方面的表现,同时支持多种任务处理和创新的后训练方法,适用于自然语言处理、教育、编程开发及内容创作等多个领域。