生成 - 智狐AI导航

INFP

INFP是一款基于音频驱动的头部生成框架，专为双人对话设计，具备自动角色转换功能。它通过两个阶段实现头部生成：基于动作的头部模仿和音频引导的动作生成。同时，INFP提出了大规模双人对话数据集DyConv，推动了相关领域的研究进展。该工具适用于视频会议、虚拟助手、教育培训、客户服务等多个场景，支持实时互动并可调节生成风格。

AI项目与工具 2025年06月12日 62 点赞 0 评论 725 浏览

Janus

Janus是一种由DeepSeek AI开发的自回归框架，专注于多模态理解和生成任务的统一化。它通过分离视觉编码路径并使用单一Transformer架构来提升灵活性和性能，支持多种输入模态如图像、文本等，并在某些任务中表现出色。Janus具备多模态理解、图像生成及跨模态交互能力，适用于图像创作、自动标注、视觉问答等多个领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 725 浏览

AI拥抱生成器

一款可以将您的静态图像轻松生成两人拥抱的的动态视频AI工具。只需点击几次，您就可以自定义拥抱视频的风格、动作和氛围。

Ai视频生成 2025年06月05日 86 点赞 0 评论 725 浏览

Gemini 2.0 Pro

Gemini 2.0 Pro是Google推出的高性能AI模型，具备200万tokens的上下文窗口，支持复杂任务处理、多语言理解和代码生成。它能调用外部工具如Google搜索和代码执行环境，提升信息获取与问题解决能力。适用于编程辅助、数据分析、学术研究、教育及创意内容生成等多个领域，是当前Google系列模型中的佼佼者。

AI项目与工具 2025年06月12日 94 点赞 0 评论 725 浏览

LATTE3D

LATTE3D 是由英伟达多伦多AI实验室开发的一种高效生成高质量3D对象的模型。它基于文本描述，能在约400毫秒内生成逼真的3D内容。LATTE3D采用摊销优化方法，增强了对新提示的适应能力。该模型支持文本到3D合成、快速生成、高质量渲染及3D风格化功能，适用于多种应用场景。

AI项目与工具 2024年01月01日 41 点赞 0 评论 725 浏览

AutoDev

AutoDev是一款由微软研发的AI编程辅助工具，专注于自动化软件工程任务，如代码编写、调试、测试和版本控制等。它通过目标定义与任务分配、代码生成、测试执行、代码维护、文件编辑、信息检索、构建与执行、多智能体协作、对话管理和安全隐私保护等功能，提高软件开发效率和质量。AutoDev的架构设计确保了其高效、安全和可控性，支持在无干预情况下自主完成任务。

AI项目与工具 2025年06月12日 33 点赞 0 评论 725 浏览

Open Code Reasoning

Open Code Reasoning（OCR）是英伟达推出的开源代码推理AI模型，基于Nemotron架构设计，支持多种编程语言。它具备代码生成、逻辑补全、多语言处理及高效推理能力，适用于代码优化、教育、测试等多个场景。OCR提供32B、14B和7B三种参数版本，满足不同计算需求，并与主流框架兼容，具有良好的扩展性。

AI项目与工具 2025年06月11日 10 点赞 0 评论 725 浏览

Scenario AI

Scenario AI是一家专门为游戏开发者和游戏艺术家创建生成式AI引擎的软件开发公司。借助 Scenario，您可以使用自己的数据和样式为游戏生成一致且高质量的 2D 素材。

3D&游戏 2025年06月05日 63 点赞 0 评论 726 浏览

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 726 浏览

HoloTime 是由北京大学深圳研究生院与鹏城实验室联合开发的全景 4D 场景生成框架，可将单张全景图像转化为动态视频，并进一步重建为沉浸式 4D 场景。其核心技术包括全景动画生成器（Panoramic Animator）和时空重建技术，结合 360World 数据集进行训练，实现高质量的视频生成与场景重建。该工具支持 VR/AR 应用，适用于虚拟旅游、影视制作、游戏开发等多个领域，提供高效的沉

AI项目与工具 2025年06月11日 20 点赞 0 评论 727 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期