场景 - 智狐AI导航

口语精灵

口语精灵是一款基于人工智能的英语口语学习工具，提供1V1智能对话练习，涵盖生活、工作、考试等多场景，支持多种英语口音。其具备发音评估、语法纠错、语句优化等功能，帮助用户提升口语表达的准确性和自然度。同时，该工具提供个性化学习方案和考试备考支持，适用于不同学习阶段的用户。

AI项目与工具 2025年06月12日 61 点赞 0 评论 576 浏览

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准，支持3D、4D、图像到视频（I2V）和文本到视频（T2V）等多种模态。它从可控性、质量和动态性三个维度进行评估，涵盖3000个测试样本，包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能，适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用，为研究

AI项目与工具 2025年06月12日 87 点赞 0 评论 852 浏览

Baklib

Baklib是一款企业级数字内容管理平台，通过资源库、知识库和应用库三大模块，实现数字资产全生命周期管理、知识体系构建与多场景内容系统搭建。支持智能检索、AI内容生成、多语言与多渠道分发，提升企业内容管理效率与用户体验。

AI项目与工具 2025年06月12日 11 点赞 0 评论 639 浏览

Vibe Draw

Vibe Draw是一款开源AI 3D建模工具，能将2D草图自动转换为高质量3D模型，并支持文本提示优化和模型编辑。用户可一键导出为glTF格式，适用于创意设计、教育、游戏开发等多个领域。工具基于Next.js、React、Three.js、FastAPI等技术，具备高效的实时交互与异步处理能力。

AI项目与工具 2025年06月12日 68 点赞 0 评论 563 浏览

ObjectMover

ObjectMover是由香港大学与Adobe Research联合开发的图像编辑模型，专注于解决物体移动、插入和移除过程中的光影协调问题。通过视频先验迁移和序列到序列建模技术，实现对光照、阴影和遮挡关系的精准控制。支持多任务学习，提升模型在真实场景中的适应性。广泛应用于特效制作、虚拟场景编辑、游戏开发等领域，具备高效、真实的图像编辑能力。

AI项目与工具 2025年06月12日 91 点赞 0 评论 526 浏览

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术，基于潜在扩散模型，能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入，具备良好泛化能力，采用高斯溅射技术实现高保真表示，并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 827 浏览

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型，能通过分析普通手机拍摄的视频生成详细的 3D 场景布局，涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术，实现空间认知与语义标注，并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域，具备物理规则嵌入和结构化场景生成能力。

AI项目与工具 2025年06月12日 82 点赞 0 评论 458 浏览

咕噜口语SpeakGuru

SpeakGuru是一款由清华团队开发的AI口语练习工具，通过与虚拟人物对话提升英语口语能力。支持中文辅助、语法优化、发音评估等功能，涵盖100+真实场景，适配不同英语水平用户。内置错题本、词汇统计、个性化学习计划等模块，帮助用户全面掌握学习进度。已接入DeepSeek R1模型，提升智能化学习体验。

AI项目与工具 2025年03月17日 78 点赞 0 评论 748 浏览

MIDI

MIDI是一种基于多实例扩散模型的3D场景生成技术，能将单张2D图像快速转化为高保真度的360度3D场景。它通过智能分割、多实例同步扩散和注意力机制，实现高效的3D建模与细节优化。具有良好的泛化能力，适用于游戏开发、虚拟现实、室内设计及文物数字化等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 713 浏览

理想同学网页版

理想同学网页版是一款由理想汽车推出的AI智能助手，集成DeepSeek R1/V3 671B满血版模型，支持多模型切换、联网搜索、图像识别等功能。用户可通过文字、长文本或图片进行交互，支持360°视觉追踪，提升交互体验。适用于办公、学习、多设备协同等场景，支持网页与移动端同步，打造无缝智能服务生态。

AI项目与工具 2025年06月12日 44 点赞 0 评论 557 浏览

场景

首页

场景

列表

默认

浏览次数

发布日期