场景 - 智狐AI导航

AIpai

AIpai是一款AI视频创作Agent工具，支持用户快速生成专业视频内容。其主要功能包括智能编剧、角色设计、场景构建、图像生成、视频生成、声音设置和参数调整。用户只需输入文案，AIpai即可自动生成分镜、图像和视频选项，并支持多种风格和参数定制。适用于短视频制作、品牌宣传、个人创作、教育领域和影视制作等多种场景，大幅提升创作效率，降低制作门槛。

AI项目与工具 2025年06月11日 45 点赞 0 评论 528 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 826 浏览

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架，旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间，实现从粗粒度到细粒度的信息获取，并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理，具备良好的可扩展性，适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

AI项目与工具 2025年06月11日 84 点赞 0 评论 867 浏览

Firesearch 是 Mendable AI 团队推出的 AI 驱动的深度研究工具，基于 Firecrawl 多源网络内容提取技术和 OpenAI GPT-4o 的搜索规划与内容生成能力，能够将复杂查询分解为子问题进行搜索和内容提取。它支持答案验证、自动重试、实时进度更新、完整引用和上下文记忆等功能，帮助用户高效获取准确、全面的研究结果。工具基于 Next.js 15 构建，提供现代化的开发体

AI项目与工具 2025年06月11日 100 点赞 0 评论 598 浏览

Style AI

Style AI 是一款支持图像、视频生成与编辑的 AI 工具，能够将照片转换为各种艺术风格，如古典绘画或现代数字艺术，同时保留图像核心元素。用户可通过自然语言指令轻松编辑图像，支持无缝合并多张照片，生成集体照或新场景，并能根据文字描述直接生成图像和视频。该工具提供高效、精准的解决方案，适用于艺术创作、创意设计、视频制作、照片编辑及虚拟场景合成等多种场景。

AI项目与工具 2025年06月11日 30 点赞 0 评论 792 浏览