R

Powder AI

Powder AI,一款专为游戏玩家和内容创作者量身定制的专用软件工具。它可以自动从游戏直播和视频中提取精彩片段,大大简化了游戏主播的后期编辑工作。

LightPDF

LightPDF是一款基于AI的在线PDF处理工具,支持格式转换、OCR识别、文本编辑、注释标注、水印添加、页面操作、加密解密、数字签名等功能。用户可通过智能聊天功能提取文档关键信息并生成摘要,支持多语言处理。适用于文献管理、内容创作、移动扫描及文件处理等多种场景。

幕布

幕布是一款AI驱动的大纲笔记工具,支持结构化知识整理与一键生成思维导图,帮助用户更高效地理解和记忆信息。其功能涵盖任务拆解、团队协作、多平台同步及Markdown编辑等,适用于学习、工作与会议管理等多种场景,提升信息处理效率与组织能力。

VoxCraft Ai

北京生数科技有限公司开发的一款强大的AI生成3D工具,VoxCraft Ai基于底层通用多模态大模型,具备优越的多模态生成能力。

RepText

RepText是一款由Shakker Labs与Liblib AI联合开发的多语言视觉文本渲染框架,采用字形模仿技术实现高质量文本生成。支持多种语言及复杂排版,具备精准控制、高效兼容和自然融合等特点,广泛应用于平面设计、艺术创作和数字内容生产等领域。

Lobe Vidol

Lobe Vidol是一个开源的数字人创作平台,支持用户轻松创建和定制虚拟偶像。它具备流畅的对话交互、背景设定、动作库、角色编辑功能,还支持MMD舞蹈和PMX舞台加载。通过TTS与STT技术,Lobe Vidol实现了语音与文本的双向转换,提供沉浸式用户体验。 ---

SPRIGHT

SPRIGHT是由多所高校和机构联合开发的视觉-语言数据集,旨在提升文本到图像生成模型的空间一致性。通过重新描述约600万张图像,强化空间关系表达,如“左/右”、“上/下”等,显著提高图像生成的准确性。该数据集支持复杂场景的图像生成,并经过多维度评估验证其可靠性。SPRIGHT为视觉-语言模型的研究和应用提供了重要资源,广泛应用于图像生成、VR/AR、教育及科研等领域。

Happy Scribe

一个将音频转换为文字的自动化和人工转录字幕工具,以高准确度支持多种语言和格式。

AgentCPM

AgentCPM-GUI是由清华大学与面壁智能团队联合开发的开源端侧GUI代理系统,专为中文应用场景优化。基于MiniCPM-V模型,支持通过截图输入并自主执行用户指令,具备高精度GUI元素识别与OCR能力。采用强化微调和紧凑动作空间设计,提升任务执行效率与移动端适配性。适用于智能助手、自动化测试、老年人辅助及企业应用等领域。

SnapAny

万能视频图片解析下载,快速、免费、简单. 从1000+平台保存视频和图片