R

ScreenAgent

一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。

Depth Anything

强大的单目深度估计工具,它通过利用大规模未标注数据和先进的数据增强技术,实现了在多种复杂环境下的准确深度预测。其多任务学习和语义辅助功能使其在多个领域都有广泛的应用潜力。

PowerPaint

PowerPaint,一种多功能图像修复模型 它同时支持文本引导的对象修复、对象移除、形状引导的对象插入和外延。

Fabrie文档

帮助产品、设计、工程和市场团队实现更便利的协作,更高效的日常沟通与创意管理

GOT

创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。

有道写作

结合有道词典APP,手写英文习作拍照上传,图片转文字,快速批改

Prefind

Prefind 是一个智能的 AI 搜索引擎,由先进的语言模型 GPT-4 和 Claude-3 Opus 提供支持。这个搜索引擎旨在通过利用最新的人工智能技术,为用户提供快速、直观且内容丰富的搜索体验。