开源

SadTalker

SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频,通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情,PoseVAE合成不同风格的头部运动,并采用3D面部渲染技术,实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力,适用于虚拟助手、视频制作、语言学习、社交媒体和教育等

CrewAI

CrewAI是一个开源平台,专注于构建和部署多智能体AI解决方案,支持企业快速自动化关键工作流程。平台具备强大的API集成能力和隐私安全保障,允许用户将多智能体团队转换为API,并在隔离的虚拟私有云环境中运行。CrewAI还提供了丰富的模板和自动化工具,简化智能体的创建和部署过程,并支持多种模型定制选项。此外,CrewAI还拥有高效的监控系统,用于持续改进和优化智能体团队的性能。应用场景涵盖客户服

Jules

Jules 是 Google Labs 推出的 AI 编程智能体,通过自动化技术提升开发效率。它能根据任务描述自动生成代码,将复杂任务分解为多个步骤,并理解代码库、定位关键模块、自动运行单元测试。Jules 可根据开发者反馈调整方案,支持 GitHub 集成,适用于软件开发、敏捷团队协作、开源项目贡献及企业级应用开发等场景。

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

NPOA

NPOA是一款开源的舆情监测工具,支持实时数据采集、情感分析、话题分类及多渠道媒体分析,适用于企业品牌管理、政府舆论监控、市场研究等多个领域。系统提供预警机制、可视化报告和大屏展示功能,便于用户快速获取关键信息并做出应对。

Pollinations AI

Pollinations 是一个通过AI生成媒体内容的平台。平台可能提供多种类型的模板和工具,支持文本、图像、音频、视频等多媒体格式的创作。

Documate

Documate是一款针对站内文档问答的开源 AI 工具,旨在将 AI 聊天对话框无缝嵌入到您的网站之中。

Tesseract

Tesseract是一款开源的光学字符识别(OCR)引擎,支持多语言识别和多种图像格式。其具备高精度的文字识别能力,适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行,并提供丰富的编程接口和自定义训练功能,便于开发者集成和优化识别效果。

Agent Development Kit

Agent Development Kit(ADK)是谷歌推出的开源AI智能体开发工具,采用Python实现,支持多智能体架构和复杂任务编排。提供丰富的工具生态、灵活的工作流定义、流式交互支持及广泛的LLM兼容性,帮助开发者快速构建、测试和部署AI代理,提升系统效率与可扩展性。

PinTree

一个可以帮助用户将浏览器书签快速转换为美观的导航网站的开源项目。