R - 智狐AI导航

SAM 2.1

SAM 2.1是一款由Meta开发的先进视觉分割模型，支持图像和视频的实时分割处理。其核心功能包括用户交互式分割、多对象跟踪、数据增强以及遮挡处理等。通过引入Transformer架构和流式记忆机制，SAM 2.1显著提升了对复杂场景的理解能力。该工具具有广泛的应用场景，涵盖内容创作、医疗影像分析、自动驾驶等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 967 浏览

Qwen2vl

Qwen2VL-Flux 是一款基于多模态图像生成的模型，结合了 Qwen2VL 和 FLUX 技术。它支持多种生成模式，包括变体生成、图像到图像转换、智能修复和 ControlNet 引导生成，并具备深度估计和线条检测功能。该模型提供灵活的注意力机制和高分辨率输出，适用于艺术创作、内容营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 586 浏览

NVLM

NVLM是NVIDIA研发的多模态大型语言模型，涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构（NVLM-D、NVLM-X、NVLM-H），并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术，广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 653 浏览

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 503 浏览

CodeDPO

CodeDPO是一款由北京大学与字节跳动合作开发的代码生成优化框架，主要功能包括提升代码准确性、优化代码效率、集成偏好学习、自动生成与验证代码及测试用例、构建优化数据集以及减少对外部资源的依赖。它采用自生成与验证机制、PageRank启发式算法及Direct Preference Optimization等技术，广泛应用于自动化软件开发、代码辅助编写、编程教育、代码质量保障及优化重构等领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 503 浏览

Coral AI

Coral AI 是一款基于 AI 的文档分析平台，专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言，适用于学术研究、法律分析和商业报告等场景，特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等，并支持多种文件类型和图像分析。

AI项目与工具 2025年06月12日 54 点赞 0 评论 691 浏览

Generative Omnimatte

Generative Omnimatte 是一种基于 AI 的视频编辑技术，通过其核心模型 Casper 实现视频的多层次分解与编辑。它能够自动分离物体与背景，并支持动态背景处理及多对象场景的精细编辑。主要功能包括视频分层、对象移除、背景替换、Trimask 控制等，广泛应用于电影制作、广告设计、游戏开发及虚拟现实领域。

AI项目与工具 2025年06月12日 10 点赞 0 评论 706 浏览

Kombai

Kombai是一款基于AI的代码生成工具，主要服务于设计师和开发者，可将Figma设计自动转换为HTML、CSS及React组件代码。其核心功能包括无需手动标记、像素级精准还原、响应式设计支持等，帮助用户高效完成前端开发任务，确保设计与代码的一致性。此外，Kombai还提供多种版本供用户选择，适用于电子邮件模板设计、前端开发及品牌一致性维护等多个应用场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 555 浏览

Magic Copy

Magic Copy是一款基于开源技术的AI图像处理工具，支持Chrome浏览器扩展。它利用Meta的Segment Anything Model技术，实现图像中前景对象的自动识别与提取。用户可将提取的内容直接复制到剪贴板或下载保存，广泛应用于设计、教育、电商及办公等领域，提升工作效率。

AI项目与工具 2025年06月12日 35 点赞 0 评论 644 浏览

NSFW Detector

NSFW Detector是一款基于深度学习的开源工具，利用Google的`vit-base-patch16-224-in21k`模型，能够在CPU环境中高效检测图像、PDF、视频及压缩包内的不适宜内容。该工具支持API集成与Docker部署，具备多CPU加速特性，可实现快速且安全的本地化内容分类，广泛应用于社交媒体、内容共享平台、企业网络等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 878 浏览

R

首页

R

列表

默认

浏览次数

发布日期