生成 - 智狐AI导航

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具，集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能，支持多客户端和多场景应用。基于标准化接口和开源生态，提供高效、灵活的数字生产力解决方案，适用于内容创作、虚拟主播、在线教育等多个领域。

AI项目与工具 2025年06月11日 82 点赞 0 评论 534 浏览

MiniMax MCP Server

MiniMax MCP Server 是一款基于 MCP 协议的多模态生成服务器，支持视频、图像、语音及声音克隆等功能。其具备高分辨率输出、自然语音生成与声音克隆能力，兼容多种主流客户端。平台采用客户端-服务器架构，结合 RAG 技术提升响应准确性，适用于教学、游戏开发、内容创作等多个领域。

AI项目与工具 2025年06月11日 14 点赞 0 评论 892 浏览

See3D

See3D是一款基于视觉条件技术的3D生成模型，能够通过大规模无标注的互联网视频学习3D先验知识，实现从文本、单视图或稀疏视图到3D内容的高效转化。其核心功能包括3D编辑、高斯渲染及基于稀疏图片的3D重建，支持在物体级与场景级复杂相机轨迹下生成长序列视图。此外，See3D还适用于游戏开发、建筑设计、电商展示、AR/VR等多个领域的创新应用。

AI项目与工具 2025年06月12日 25 点赞 0 评论 519 浏览

CAVIA

CAVIA是一款由苹果、得克萨斯大学奥斯汀分校和谷歌联合研发的多视角视频生成框架。它通过单一输入图像生成多个时空一致的视频序列，并采用视角集成注意力模块增强视频的一致性和连贯性，支持用户精准控制相机运动。此外，CAVIA利用多种数据源进行联合训练，优化生成视频的质量和真实感，在虚拟现实、增强现实以及电影制作等领域具有重要价值。

AI项目与工具 2025年06月12日 76 点赞 0 评论 815 浏览

FabricDiffusion

FabricDiffusion是一项由谷歌与卡内基梅隆大学联合开发的高保真3D服装生成技术，可将2D服装图像的纹理和印花高质量地转移到3D服装模型上。其核心技术基于去噪扩散模型和大规模合成数据集，生成多种纹理贴图并支持跨光照条件的精准渲染，具备优秀的泛化能力和实际应用潜力，适用于虚拟试衣、游戏开发、影视制作及时尚设计等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 771 浏览

VideoCrafter2

VideoCrafter2 是一款由腾讯AI实验室开发的视频生成模型，通过将视频生成过程分解为运动和外观两个部分，能够在缺乏高质量视频数据的情况下，利用低质量视频保持运动的一致性，同时使用高质量图像提升视觉质量。该工具支持文本到视频的转换，生成高质量、具有美学效果的视频，能够理解和组合复杂的概念，并模拟不同的艺术风格。

AI项目与工具 2024年01月01日 49 点赞 0 评论 533 浏览