PrimitiveAnything PrimitiveAnything是由腾讯AIPD与清华大学联合开发的3D形状生成框架,通过将复杂3D形状分解为基本基元并自回归生成,实现高质量、高保真度的3D模型重建。其支持从文本或图像生成内容,具备高效存储、模块化设计及良好的泛化能力,适用于3D建模、游戏开发、UGC创作及VR/AR应用等领域。 AI项目与工具 2025年06月11日 14 点赞 0 评论 692 浏览
PixVerse V4 PixVerse V4 是一款基于 AI 的视频生成工具,支持通过文本或图片快速生成高质量视频,最快仅需 5 秒。具备音效生成、人声配音、视频风格转换等功能,适用于多种创作场景。其在语义理解、物理表现和特效处理方面有显著提升,适合个人创作、广告营销、教育及影视娱乐等领域使用。 AI项目与工具 2025年06月12日 97 点赞 0 评论 689 浏览
UnZipLoRA UnZipLoRA是一种由伊利诺伊大学厄巴纳-香槟分校研发的图像处理技术,能够将图像内容与风格分离,并分别以两个LoRA模型表示。该技术通过提示分离、列分离和块分离策略,有效解决内容与风格纠缠的问题,支持高效训练和兼容性组合。可用于艺术创作、图像编辑、风格迁移及个性化图像生成等场景,提升图像处理的灵活性和可控性。 AI项目与工具 2025年06月12日 81 点赞 0 评论 689 浏览
Immersity AI Immersity AI 是一款基于先进神经深度学习技术的AI平台,可将2D图像和视频转换为沉浸式3D视觉效果。它具备实时预览、编辑功能,并支持从静态图片到动态视频的全面转换,广泛应用于社交媒体、广告营销、教育、娱乐等领域,旨在提升用户体验与内容表现力。 AI项目与工具 2025年06月12日 79 点赞 0 评论 688 浏览
Stable Audio Open Small Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型,参数量降至 3.41 亿,适配移动设备和边缘计算场景。基于深度学习与模型压缩技术,支持快速生成音效、音乐片段等音频内容,适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点,可用于音乐创作、游戏音效、视频配乐等领域。 AI项目与工具 2025年06月11日 35 点赞 0 评论 688 浏览
ViTPose ViTPose 是一种基于 Transformer 架构的人体姿态估计模型,通过图像块处理和特征提取实现关键点定位。提供多种版本,适用于不同任务需求。模型结构简洁,支持灵活扩展和参数调整,具备知识迁移能力。ViTPose+ 拓展至动物姿态估计,提升适用范围。在多个数据集上达到 SOTA 性能,广泛应用于运动分析、虚拟现实等领域。 AI项目与工具 2025年06月12日 28 点赞 0 评论 687 浏览
OpenBioMed OpenBioMed是由清华大学智能产业研究院与水木分子联合开发的开源平台,专注于AI在生物医学中的应用。它支持多模态数据处理,涵盖分子、蛋白质、单细胞等多种类型,并提供20多个深度学习模型和计算工具,适用于药物研发、精准医疗、知识图谱构建等领域。平台具备统一的数据处理框架和预训练模型,支持快速迁移和智能体设计,助力科研人员提升研究效率。 AI项目与工具 2025年06月12日 45 点赞 0 评论 686 浏览
AuraFusion360 AuraFusion360是一款面向360°无边界场景修复的AI工具,采用高斯散射表示和深度感知技术,实现高质量的物体移除与孔洞填充。其核心包括自适应引导深度扩散(AGDD)和基于SDEdit的细节增强,确保多视角一致性。适用于虚拟现实、建筑可视化、影视特效及文物修复等多个领域,提供高效、精确的场景修复解决方案。 AI项目与工具 2025年06月12日 57 点赞 0 评论 684 浏览
DualPipe DualPipe是由DeepSeek开发的开源双向流水线并行技术,通过将前向和反向计算分离为独立管道并行执行,显著提升大规模深度学习模型的训练效率。该技术优化了计算与通信的重叠,降低内存峰值,提高资源利用率,并支持多模态处理、多任务学习等应用场景。适用于需要高效训练和推理的AI系统。 AI项目与工具 2025年06月12日 92 点赞 0 评论 683 浏览