建模 - 智狐AI导航

MAETok

MAETok是一种基于掩码建模的图像标记化方法，通过自编码器结构学习更具语义丰富性的潜在空间，提升图像生成质量与训练效率。它支持高分辨率图像生成，具备多特征预测能力和灵活的潜在空间设计，适用于娱乐、数字营销、计算机视觉等多个领域。实验表明其在ImageNet数据集上表现优异。

AI项目与工具 2025年06月12日 67 点赞 0 评论 568 浏览

MoMask

MoMask是一款基于生成式掩码建模的3D人体动作生成工具，支持文本驱动的动作创建与编辑。采用分层量化与Transformer架构，实现高精度、连贯的3D动作序列生成，在HumanML3D数据集上的FID值仅为0.045。支持动作时序控制、多平台部署及动作评估功能，适用于游戏开发、动画制作、VR及体育分析等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 566 浏览

BAG

BAG是一项由香港中文大学与腾讯联合研发的3D可穿戴资产生成技术，结合多视图图像扩散模型与控制网络，根据人体形状和姿态信息生成高质量的服装和配饰。该技术具备高效适配、多样化生成和物理模拟优化等特点，广泛应用于虚拟试衣、游戏开发、VR/AR及时尚设计等领域，有效提升用户体验与设计效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 773 浏览

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 873 浏览

ConsistentDreamer

ConsistentDreamer 是由华为慕尼黑研究中心开发的图像到 3D 资产生成技术，能通过单张图像生成多视图一致的 3D 网格。该技术采用多视图先验图像引导和分数蒸馏采样优化，结合动态权重平衡和多种损失函数，提升 3D 表面质量和纹理精度。支持复杂场景编辑、风格转换、物体修改等功能，适用于室内场景、艺术风格转换及跨视图一致性任务。

AI项目与工具 2025年06月12日 60 点赞 0 评论 577 浏览

Masterpiece X

Masterpiece X 是一款基于AI的3D建模工具，支持通过文本或图像生成高质量3D模型，具备自动纹理、骨骼绑定和动画功能，支持多格式导出并兼容主流3D软件。无需专业技能，适合艺术创作、游戏开发、影视制作等多种场景，提升创意效率与设计体验。

AI项目与工具 2025年06月12日 33 点赞 0 评论 738 浏览

AgentSociety

AgentSociety是由清华大学开发的基于大语言模型的社会模拟平台，通过构建具有“类人心智”的智能体，模拟复杂的社会行为与现象。平台支持城市环境建模、大规模社会模拟和科研工具集成，适用于社会舆论传播、政策评估、社会极化分析及灾害响应研究。其技术特点包括异步模拟架构、分布式计算和MQTT通信，具备高度可扩展性和实时交互能力。

AI项目与工具 2025年06月12日 21 点赞 0 评论 886 浏览

Evo 2

Evo 2 是一款基于 StripedHyena 2 架构的 DNA 语言模型，可处理长达 100 万个碱基对的基因序列，支持长序列建模、DNA 生成、嵌入向量提取及零样本预测等功能。其基于大规模基因组数据训练，适用于基因治疗、合成生物学和进化研究等多个领域，为基因组学研究提供强大支持。

AI项目与工具 2025年06月12日 71 点赞 0 评论 749 浏览

WorldCraft

WorldCraft是一款基于大型语言模型的3D世界创建系统，支持用户通过自然语言交互快速生成和调整虚拟场景。其核心模块包括物体定制、场景布局优化和轨迹控制，具备高精度的几何与纹理控制能力。系统兼容多种3D生成工具，适用于建筑设计、影视娱乐、教育等多个领域，为非专业人士提供高效、直观的创意设计解决方案。

AI项目与工具 2025年06月12日 80 点赞 0 评论 738 浏览

Fractal Generative Models

Fractal Generative Models 是一种基于分形架构的图像生成技术，通过递归调用“原子模块”实现逐像素生成高分辨率图像。该模型结合 Transformer 模块，采用分而治之策略，大幅提升计算效率。不仅适用于图像生成，还可扩展至分子结构、蛋白质等高维数据建模，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 688 浏览

建模

首页

建模

列表

默认

浏览次数

发布日期