AR - 智狐AI导航

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 532 浏览

NoteGen

NoteGen是一款开源AI笔记工具，支持截图识别、剪贴板监听和文本输入，通过OCR和AI技术将碎片信息整理为结构化Markdown笔记。内置Markdown编辑器与AI写作助手，支持大纲生成、公式编辑、流程图绘制及翻译优化。支持多设备同步与GitHub私有仓库管理，保障数据安全，适用于知识管理、学习研究、创作写作及团队协作等场景。

AI项目与工具 2025年06月12日 93 点赞 0 评论 900 浏览

UI

UI-TARS是由字节跳动开发的图形用户界面代理模型，支持通过自然语言实现桌面、移动端和网页的自动化交互。具备多模态感知、跨平台操作、视觉识别、任务规划与记忆管理等功能，适用于自动化任务执行和复杂交互场景。支持云端与本地部署，提供丰富的开发接口，便于集成与扩展。

AI项目与工具 2025年06月12日 33 点赞 0 评论 889 浏览

DiffuEraser

DiffuEraser是一款基于稳定扩散模型的视频修复工具，具备未知像素生成、已知像素传播、时间一致性维护等功能。通过集成运动模块和优化网络架构，它能有效提升视频修复质量，减少噪声和幻觉。适用于影视后期制作、老电影修复、监控视频增强等多个领域，支持高精度和高连贯性的视频内容修复与增强。

AI项目与工具 2025年06月12日 98 点赞 0 评论 831 浏览

VARGPT

VARGPT是一款多模态大语言模型，整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制，支持文本与图像的混合输入和输出，具备高效的视觉生成能力。模型采用三阶段训练策略，提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 531 浏览

MotionCanvas

MotionCanvas是一种图像到视频生成工具，能将静态图像转化为动态视频。它提供相机与物体运动的联合控制，支持复杂轨迹设计和局部运动调整，具备3D感知能力，可生成高质量长视频。适用于电影制作、动画创作、VR/AR、游戏开发及教育等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 726 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 551 浏览

Pippo

Pippo是由Meta Reality Labs研发的图像到视频生成模型，可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构，结合ControlMLP模块与注意力偏差技术，实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全，适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程，确保生成质量与稳定性。

AI项目与工具 2025年06月12日 38 点赞 0 评论 493 浏览

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型，基于代理标记化扩散 Transformer（PT-DiT）架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度，支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性，适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 559 浏览

DynamicCity

DynamicCity是由上海AI Lab开发的大规模动态场景生成框架，支持高质量4D LiDAR场景的生成与重建，适用于自动驾驶、机器人导航、虚拟现实等多个领域。该框架基于VAE和DiT模型，实现高效的场景编码与生成，支持轨迹引导、指令驱动生成和动态修复等多种应用，展现出优异的性能和广泛的应用潜力。

AI项目与工具 2025年06月12日 63 点赞 0 评论 579 浏览

AR

首页

AR

列表

默认

浏览次数

发布日期