工具

UFO²

UFO²是微软开发的多智能体操作系统,基于深度系统集成和自然语言交互技术,实现Windows桌面任务的自动化处理。系统采用HostAgent与AppAgent协同架构,结合GUI与API操作,提升任务执行效率和稳定性。支持多轮交互、非干扰式体验和安全保障机制,适用于办公自动化、企业任务处理、智能客服等多种场景,具有较强的实用性和扩展性。

Palettemaker

一款面向创意专业人士和色彩爱好者的独特工具,可让您在来自最常见创意领域(例如徽标设计、UI/UX、图案、海报等)的设计中创建调色板。

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。

Plandex

Plandex是一个基于终端的开源 AI 编程引擎,可帮助程序员完成复杂的软件编程开发任务、解决不良输出并最大限度地提高生产力。

百度AI同传助手

百度AI同传助手,轻量级音视频同传字幕工具,一键开启,实时生成同传双语字幕.

Vision Parse

Vision Parse 是一款开源工具,旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力,包括文本和表格,并能保持原有格式与结构。此外,Vision Parse 支持多种视觉语言模型,确保解析的高精度与高速度。其应用场景广泛,涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

Landing

Landing 是一款基于 AI 技术的落地页生成工具,可快速创建美观高效的页面。用户输入品牌信息后,系统自动生成文案、图像和设计布局,支持可视化编辑与多版本测试。具备多语言支持、表单集成、数据分析等功能,适用于电商、数字营销、品牌宣传及活动推广等多种场景,提升转化效率与用户体验。

Stable Diffusion-AI辅助设计

64课时带领大家系统完成SD的全流程学习,并精讲一款让SD从玩具升级到强大生产力工具的热门插件—ControlNet的使用。

FaceFusion

FaceFusion是一款开源AI工具,支持图像和视频中的人脸交换与增强。其主要功能包括高质量的人脸交换、人脸增强、整体画面优化、唇形同步、多模型人脸检测及遮挡处理。通过深度学习技术,FaceFusion能够实现精准的人脸识别与对齐,广泛应用于电影制作、虚拟主播、广告营销及教育培训等领域。