场景 - 智狐AI导航

ChitChop

ChitChop是字节跳动旗下一款基于云雀大语言模型创建的AI集合工具产品，可以为用户提供多达200+的智能机器人服务。

AI服务商 2025年06月05日 86 点赞 0 评论 667 浏览

WeDraw

WeDraw专注于人工智能AI绘画和大模型语料数据合成领域，是一支充满激情和创意的团队。

AI服务商 2025年06月05日 77 点赞 0 评论 633 浏览

Style AI

Style AI 是一款支持图像、视频生成与编辑的 AI 工具，能够将照片转换为各种艺术风格，如古典绘画或现代数字艺术，同时保留图像核心元素。用户可通过自然语言指令轻松编辑图像，支持无缝合并多张照片，生成集体照或新场景，并能根据文字描述直接生成图像和视频。该工具提供高效、精准的解决方案，适用于艺术创作、创意设计、视频制作、照片编辑及虚拟场景合成等多种场景。

AI项目与工具 2025年06月11日 30 点赞 0 评论 792 浏览

Firesearch 是 Mendable AI 团队推出的 AI 驱动的深度研究工具，基于 Firecrawl 多源网络内容提取技术和 OpenAI GPT-4o 的搜索规划与内容生成能力，能够将复杂查询分解为子问题进行搜索和内容提取。它支持答案验证、自动重试、实时进度更新、完整引用和上下文记忆等功能，帮助用户高效获取准确、全面的研究结果。工具基于 Next.js 15 构建，提供现代化的开发体

AI项目与工具 2025年06月11日 100 点赞 0 评论 599 浏览

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架，旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间，实现从粗粒度到细粒度的信息获取，并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理，具备良好的可扩展性，适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

AI项目与工具 2025年06月11日 84 点赞 0 评论 867 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 826 浏览

AIpai

AIpai是一款AI视频创作Agent工具，支持用户快速生成专业视频内容。其主要功能包括智能编剧、角色设计、场景构建、图像生成、视频生成、声音设置和参数调整。用户只需输入文案，AIpai即可自动生成分镜、图像和视频选项，并支持多种风格和参数定制。适用于短视频制作、品牌宣传、个人创作、教育领域和影视制作等多种场景，大幅提升创作效率，降低制作门槛。

AI项目与工具 2025年06月11日 45 点赞 0 评论 529 浏览

WonderPlay

WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架，能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术，支持多种物理材质和动作类型，实现逼真的动态效果。用户可通过简单操作与场景互动，生成丰富的物理响应。该工具具备交互式查看器，适用于AR/VR、影视特效、教育、游戏开发等多个领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 654 浏览

QwenLong

QwenLong-L1-32B是阿里巴巴集团Qwen-Doc团队开源的首个长文本推理大模型，基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略，显著提升长文本场景下的推理能力。该模型在多个DocQA基准测试中表现优异，平均准确率达70.7%，超越多个现有旗舰模型。其功能包括长文本推理、稳定训练、混合奖励、广泛适用性和高性能表现，适用于法律、金融、科研等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 776 浏览

3DTown

3DTown是由哥伦比亚大学联合Cybever AI等机构开发的AI工具，能够从单张俯视图生成高精度的3D城镇场景。它采用区域化生成和空间感知3D修复技术，将输入图像分解为重叠区域，分别生成3D内容并修复缺失结构，确保几何和纹理一致性。支持多种风格的场景生成，适用于虚拟世界构建、游戏开发、机器人模拟等领域，优于现有方法。

AI项目与工具 2025年06月11日 17 点赞 0 评论 631 浏览

场景

首页

场景

列表

默认

浏览次数

发布日期