R

易飞文字识别

免费在线批量图片文字提取,支持中英文等多种语言的高效准确识别,一键复制文本导出Word。

SPRIGHT

SPRIGHT是由多所高校和机构联合开发的视觉-语言数据集,旨在提升文本到图像生成模型的空间一致性。通过重新描述约600万张图像,强化空间关系表达,如“左/右”、“上/下”等,显著提高图像生成的准确性。该数据集支持复杂场景的图像生成,并经过多维度评估验证其可靠性。SPRIGHT为视觉-语言模型的研究和应用提供了重要资源,广泛应用于图像生成、VR/AR、教育及科研等领域。

靠岸学术

Scholaread是一款专注于学术研究的多功能工具,集成了PDF阅读、学术翻译、文献管理和笔记功能。其主要特点包括支持多平台同步、一键同步Zotero论文库、重排模式优化阅读体验、逐段对照翻译支持多语言、图片及表格放大查看、引文添加至阅读列表、目录跳转以及高亮笔记标注。适用于学术研究、文献综述、跨语言研究、移动学习及团队协作等多种场景。

Cursor

一个专门为Cursor和其他代理工具设计的npm包,通过集成 Perplexity AI 和 Google Gemini 提供智能化响应,Cursor-Tools可以极大的增强 Cursor Agent 的能力。

DeepSeek百宝箱

DeepSeek百宝箱是DeepSeek官方维护的GitHub项目,集成了多种支持DeepSeek API的工具和应用,涵盖聊天、知识管理、开发等多个领域。提供开箱即用、详实文档、本地化支持及多平台兼容性,助力开发者高效使用语言模型,提升工作效率。支持模型训练、部署、监控全流程,具备低代码配置、智能上下文感知、毫秒级响应等特性,适用于办公、编程、内容创作等多种场景。

Wisdolia AI

Wisdolia一个Chrome扩展程序,它使用 AI 为任何文章/PDF 生成抽认卡,以便您可以更好地记住您阅读的内容。

Zero123

一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。

PixArt

PixArt-Σ是一款基于扩散Transformer架构(DiT)的文本生成图像模型,专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法,不仅提升了生成图像的保真度,还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品,并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

混元3D v2.5

混元3D v2.5是腾讯推出的高精度3D生成模型,具备超高清建模能力,支持4K纹理和多视图输入,生成更真实的PBR材质模型。其优化的骨骼蒙皮系统提升动画效率,适用于游戏开发、影视制作、电商展示等多个领域,提供多样化的生成模板和参数调节功能,满足专业级3D内容创作需求。

多多群岛DuoDuoLand

多多群岛DuoDuoLand是面向年轻人最有影响力的的职场平台,打造未来AI驱动、强社交基因的Z世代人才网络和项目孵化韶。