AI项目与工具

Umi

Umi-OCR 是一款离线 OCR 工具,支持图片、截图和 PDF 文档的文字识别,具备数学公式与二维码识别功能,可生成可搜索 PDF。支持多语言识别与界面切换,提供命令行和 HTTP 接口调用,适用于文档数字化、数据录入、教育等多个场景。

Praison AI

Praison AI 是一款基于低代码的多智能体框架,支持AI代理的创建与管理,提供顺序、分层和工作流等多种任务执行流程。其特点包括动态路由、并行化执行、记忆功能以及高效的人机协作。适用于企业流程自动化、智能客服、数据分析等多个领域,强调灵活性和可扩展性。

HelloMeme

HelloMeme是一款基于扩散生成技术的框架,专注于表情与姿态迁移。它利用空间编织注意力机制与Stable Diffusion 1.5模型的结合,生成自然且物理合理的表情包视频,同时具备强大的泛化能力和扩展潜力。HelloMeme通过模块化设计实现了高效的表情和姿态迁移,适用于多种应用场景,如社交媒体内容创作、视频娱乐、电影制作、广告营销及教育培训等。

GeoSpy

GeoSpy是一款基于AI技术的照片地理定位工具,可准确识别照片拍摄位置并输出经纬度坐标。它支持批量处理、地图集成和API接口,适用于研究、执法、新闻核实等多种场景,帮助用户深入挖掘图像背后的地理信息。

Coral AI

Coral AI 是一款基于 AI 的文档分析平台,专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言,适用于学术研究、法律分析和商业报告等场景,特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等,并支持多种文件类型和图像分析。

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统,支持低延迟交互与多模态输入输出。系统采用模块化架构,允许灵活配置语音识别、语言模型和语音合成等组件,兼容本地与云服务。支持2D/3D数字人渲染,适用于客户服务、教育、娱乐及企业应用等多个场景,为开发者提供高效、灵活的AI对话解决方案。

text.cortex

text.cortex是一款集成了文本重写、句子扩展、长篇内容生成、文本摘要、多语言翻译及语法检查等功能的AI写作辅助工具。其核心优势在于支持超过25种语言,用户可通过高亮文本直接使用工具栏优化内容。无论是学术研究、商业报告还是日常写作,text.cortex都能显著提高创作效率与质量。

Dream Screen

Dream Screen 是一款基于生成式人工智能技术的视频背景生成工具,旨在帮助创作者通过简单文本输入快速生成高质量视频背景。它提供了多种风格选择,支持个性化定制,并显著简化了短视频制作流程,尤其适用于社交媒体、教育、商业广告及影视制作等领域。其核心优势在于无需专业技能即可生成专业级视觉效果,从而提升内容吸引力与观众体验。

Videotoword.ai

Videotoword.ai 是一款以AI驱动的在线服务,支持将音频和视频文件转化为文本,具有高精度(99.9%)和多语言支持(98种以上)。它能处理长达10小时的文件,具备自动转录、文本编辑导出及AI摘要生成功能,广泛应用于教育、媒体、法律和企业等领域。

WiS

WiS是一个基于“谁是卧底”游戏规则的在线AI竞赛平台,专为评估和分析大型语言模型(LLMs)在多智能体系统中的行为而设计。平台提供统一的模型评估接口、实时排行榜、全面的行为评估功能以及详尽的数据可视化支持,旨在为研究人员和开发者提供一个直观且高效的工具,用于测试和优化智能体在复杂交互环境中的表现。