学习 - 智狐AI导航

Mogao

Mogao是由字节跳动开发的多模态生成基础模型，结合双视觉编码器和先进位置嵌入技术，实现高质量的图像与文本生成。支持零样本图像编辑、多模态理解与生成、高分辨率图像输出以及优化的中文文本渲染。适用于内容创作、智能交互、医疗影像分析等多个领域，具备强大的跨模态处理能力和生成稳定性。

AI项目与工具 2025年06月11日 97 点赞 0 评论 467 浏览

Scenethesis

Scenethesis是NVIDIA推出的AI框架，可通过文本生成高质量的3D场景。它结合LLM与视觉技术，经过布局规划、视觉细化、物理优化和场景验证四个阶段，确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建，广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。

AI项目与工具 2025年06月11日 13 点赞 0 评论 514 浏览

LegoGPT

LegoGPT是一款由卡内基梅隆大学开发的AI工具，可根据文本描述生成稳定、可组装的乐高积木模型。它结合自回归语言模型与大规模数据集，支持自动纹理上色、物理稳定性验证及手动或机器人组装。该工具能有效提升创意设计效率，适用于教育、玩具开发及自动化生产等多个场景。

AI项目与工具 2025年06月11日 73 点赞 0 评论 292 浏览

PixelHacker

PixelHacker是一款由华中科技大学与VIVO AI Lab联合开发的图像修复模型，采用潜在类别引导机制，通过线性注意力实现结构与语义一致性的高质量修复。基于大规模数据集训练并经过多基准微调，支持多种图像类型与分辨率。适用于照片修复、对象移除、艺术创作、医学影像及文化保护等领域。

AI项目与工具 2025年06月11日 50 点赞 0 评论 381 浏览

Seed1.5

Seed1.5-Embedding 是由字节跳动推出的高性能向量模型，基于 Seed1.5 训练优化，具有强大的语义编码和检索能力。模型采用 Siamese 双塔结构，支持多种向量维度，并通过两阶段训练提升表征能力。它适用于信息检索、文本分类、推荐系统、聚类分析等多种任务，尤其在复杂查询和推理任务中表现突出，具备良好的灵活性和可扩展性。

AI项目与工具 2025年06月11日 37 点赞 0 评论 413 浏览

PrimitiveAnything

PrimitiveAnything是由腾讯AIPD与清华大学联合开发的3D形状生成框架，通过将复杂3D形状分解为基本基元并自回归生成，实现高质量、高保真度的3D模型重建。其支持从文本或图像生成内容，具备高效存储、模块化设计及良好的泛化能力，适用于3D建模、游戏开发、UGC创作及VR/AR应用等领域。

AI项目与工具 2025年06月11日 14 点赞 0 评论 506 浏览

ViLAMP

ViLAMP是由蚂蚁集团与中国人民大学联合开发的视觉语言模型，专为高效处理长视频设计。采用混合精度策略，支持在单张A100 GPU上处理长达3小时的视频，提升处理效率并降低计算成本。具备长视频理解、关键信息提取、多任务处理等功能，适用于教育、监控、直播、影视制作及智能客服等场景。技术上通过差分关键帧选择与特征合并优化性能，实现精准且高效的视频分析。

AI项目与工具 2025年06月11日 37 点赞 0 评论 362 浏览

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架，支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略，实现长上下文处理与主动响应。项目配套发布Stream-IT数据集，包含60万样本，适用于多种视频理解任务，展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 455 浏览

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 318 浏览

Nooka

Nooka是一款基于AI技术的听书应用，提供全球非虚构类书籍的20分钟音频摘要，适合碎片化时间学习。用户可随时提问并获得AI即时回答，实现深度互动。应用支持多语言字幕、音频剪辑分享及社区交流，适用于通勤、运动、家务等多种场景，提升学习效率与趣味性。

AI项目与工具 2025年06月11日 16 点赞 0 评论 214 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期