AR - 智狐AI导航

CodeArena

CodeArena是一个在线平台，用于实时比较多个大型语言模型（LLM）的代码生成能力。它通过实时渲染和排名机制，帮助开发者评估LLM的性能，包括代码的可读性、效率和准确性。CodeArena集成了开发者工具，支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 923 浏览

Megrez

Megrez-3B-Omni是一款具备全模态理解能力的开源模型，支持图像、音频和文本的综合处理，具备强大的推理效率和多模态交互功能。它能够在多个权威测试集中展现卓越性能，尤其擅长场景理解、OCR识别及语言生成等任务，同时通过智能WebSearch调用增强问题解答能力，适用于个人助理、智能家居、车载系统等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 959 浏览

MarkItDown

MarkItDown是一款由微软推出的开源文档转换工具，支持多种文件格式（如PDF、Office文档、图像、音频等）转换为Markdown格式。它具备OCR文字识别、语音转文字、元数据提取等功能，适用于文档归档、内容发布、数据挖掘、学术研究等多个场景，旨在简化文件处理流程，提升工作效率。通过提供简单易用的API接口，MarkItDown成为开发者友好型工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 866 浏览

Vision Parse

Vision Parse 是一款开源工具，旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力，包括文本和表格，并能保持原有格式与结构。此外，Vision Parse 支持多种视觉语言模型，确保解析的高精度与高速度。其应用场景广泛，涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 612 浏览

Large Motion Model

Large Motion Model（LMM）是一款由新加坡南洋理工大学S-Lab和商汤科技合作研发的多模态运动生成框架。它支持从文本、音乐等多种模态生成逼真运动序列，具备高度精准的身体部位控制能力和强大的泛化能力。通过整合多样化的MotionVerse数据集以及创新性的ArtAttention机制和预训练策略，LMM在多个领域展现出高效的应用潜力，包括动画、虚拟现实、影视特效及运动分析等。

AI项目与工具 2025年06月12日 47 点赞 0 评论 1012 浏览

J1 Assistant

J1 Assistant 是一款基于安卓平台的 AI 智能助手，支持语音输入与多任务处理。用户可通过语音转换为文本，发送至搜索引擎、AI 模型或创建备忘录。支持任务管理、信息查询及智能对话，适用于日常事务管理、学习研究和生活辅助。目前为 Beta 版本，仅限海外用户使用。

AI项目与工具 2025年06月12日 34 点赞 0 评论 768 浏览

SPRIGHT

SPRIGHT是由多所高校和机构联合开发的视觉-语言数据集，旨在提升文本到图像生成模型的空间一致性。通过重新描述约600万张图像，强化空间关系表达，如“左/右”、“上/下”等，显著提高图像生成的准确性。该数据集支持复杂场景的图像生成，并经过多维度评估验证其可靠性。SPRIGHT为视觉-语言模型的研究和应用提供了重要资源，广泛应用于图像生成、VR/AR、教育及科研等领域。

AI项目与工具 2025年06月12日 77 点赞 0 评论 879 浏览

UNI

UNI-CourseHelper是一款基于AI技术的学习辅助工具，支持多模态问答、长文解析、思维链推理等功能，覆盖多个学科领域。通过Markdown格式展示答案，支持图片和文档提问，适用于学生、教师及研究人员，提升学习效率与理解深度。

AI项目与工具 2025年06月12日 86 点赞 0 评论 691 浏览

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具，基于扩散变换器（DiT）架构，支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化，实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域，为视觉内容创作提供高效解决方案。

AI项目与工具 2025年06月12日 17 点赞 0 评论 874 浏览

Motion Dreamer

Motion Dreamer是由香港科技大学（广州）研发的视频生成框架，采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制，支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能，已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 885 浏览

AR

首页

AR

列表

默认

浏览次数

发布日期