场景 - 智狐AI导航

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 544 浏览

PanoDreamer

PanoDreamer是一款基于单张图像生成连贯360° 3D场景的AI工具。其核心技术包括将全景图像生成与深度估计转化为优化任务，并引入交替最小化策略，确保场景的一致性和完整性。该工具支持全景图像及深度信息生成，可应用于虚拟现实、游戏开发、内容创作等多个领域，展现出卓越的性能表现。

AI项目与工具 2025年06月12日 83 点赞 0 评论 745 浏览

ILLUME

ILLUME是一款基于大型语言模型的统一多模态大模型，集成了视觉理解与生成能力，采用“连续图像输入 + 离散图像输出”架构，通过语义视觉分词器和三阶段训练流程，实现了高效的数据利用和多模态任务处理能力。模型能够无缝整合视觉理解与生成功能，广泛应用于视频分析、医疗诊断、自动驾驶及艺术创作等领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 941 浏览

Wonderland

Wonderland是一项由多伦多大学、Snap和UCLA联合开发的技术，能够基于单张图像生成高质量的3D场景，并支持精确的摄像轨迹控制。它结合了视频扩散模型和大规模3D重建模型，解决了传统3D重建技术中的视角失真问题，实现了高效的三维场景生成。Wonderland在多个基准数据集上的3D场景重建质量均优于现有方法，广泛应用于建筑设计、虚拟现实、影视特效、游戏开发等领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 921 浏览

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架，允许用户通过文本提示生成包含多个事件的连贯视频，并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧，同时结合预训练的视频扩散变换器（DiT）和大型语言模型（LLM）的提示增强功能，进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域，为视频创作带来了创新性的解决方案。

AI项目与工具 2025年06月12日 42 点赞 0 评论 503 浏览

GraphAgent

GraphAgent是一款基于人工智能的知识图谱构建与应用平台，集成了图生成、任务规划及任务执行三大模块，支持从结构化与非结构化数据中提取信息并形成知识图谱，具备自然语言交互、预测分析等功能。它通过图神经网络和大型语言模型实现高效的数据处理与语义理解，适用于学术研究、电商推荐、金融风控等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 833 浏览

AgiBot World是一个由智元机器人开发的百万真机数据集，专注于具身智能技术的研究。它涵盖了80多种日常生活技能，涉及家居、餐饮、工业、商超及办公五大场景，数据规模和质量均领先于谷歌的Open X-Embodiment。数据采集利用了智元自建的工厂和实验基地，通过8个摄像头和6自由度灵巧手等先进硬件，确保了全域真实场景下的高质量数据获取。项目还计划开源仿真数据、发布具身基座大模型及配套工具链

AI项目与工具 2025年06月12日 10 点赞 0 评论 800 浏览

VideoPhy

VideoPhy是一款由UCLA和谷歌研究院联合开发的基准测试工具，旨在评估视频生成模型的物理常识能力。它包含688条描述性字幕，通过人类和自动评估方式，衡量生成视频是否符合物理规则。VideoPhy不仅揭示了现有模型的不足，还推出了自动评估工具VideoCon-Physics，以推动模型性能的提升。其应用场景广泛，包括视频生成模型开发、计算机视觉研究、教育与培训以及娱乐产业等。

AI项目与工具 2025年06月12日 84 点赞 0 评论 695 浏览

MuseGate

MuseGate是一款依托生成式AI技术的电商营销工具，专注于服饰行业。它通过虚拟模特生成、场景定制、尺寸调整等功能，助力企业优化商品展示效果，降低运营成本，提升品牌形象。其核心功能包括虚拟模特生成、一键换装、场景定制、节点营销等，广泛应用于时尚展示、电子商务、广告宣传等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 582 浏览

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法，专注于提升AI生成视频的质量，特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化，无需额外训练即可高效提升视频效果，适用于视频创作、学术研究、在线平台等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 769 浏览

场景

首页

场景

列表

默认

浏览次数

发布日期