生成 - 智狐AI导航

Heygem

Heygem是一款由硅基智能推出的开源数字人模型，支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音，30秒内完成克隆，60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势，适用于内容创作、教育、直播、影视及客服等多个领域，提供高效、低成本的数字人解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 778 浏览

IMAGPose

IMAGPose是由南京理工大学开发的统一条件框架，用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块，解决了传统方法在生成多样姿态图像时的局限性，适用于虚拟现实、影视制作、电商展示等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 617 浏览

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型，通过文本与图像间的双向循环一致性学习，实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应，支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性，适用于广告、教育等多个应用场景。

AI项目与工具 2025年06月12日 19 点赞 0 评论 496 浏览

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具，支持图像、文本和音频输入，生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能，适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术，提升视频自然度与连贯性，提高内容创作效率。

AI项目与工具 2025年06月12日 66 点赞 0 评论 445 浏览

Wan

Wan是阿里推出的AI创意平台，支持AI绘画与视频生成，能根据文字或图片生成高质量艺术图像和动态视频。提供多种风格选择与创意探索功能，用户可保存作品并分享。适用于艺术设计、内容创作、教育学习及商业营销等多个领域，助力提升创作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 484 浏览

LaWGPT

LaWGPT 是南京大学研发的中文法律大语言模型，基于 LLaMA 进行二次预训练，融合大量法律知识，支持法律咨询、文书生成、司法考试辅助等功能。模型通过法律词表扩展、大规模语料训练及指令微调提升专业性，适用于法律研究、案件分析及政策研究等场景，助力法律行业智能化发展。

AI项目与工具 2025年06月12日 38 点赞 0 评论 734 浏览

GCDance

GCDance是一款由英国萨里大学与江南大学联合开发的3D舞蹈生成框架，可根据音乐和文本提示生成风格可控的全身舞蹈序列。它结合多粒度音乐特征融合与CLIP模型文本嵌入技术，实现舞蹈动作与音乐节奏的高度同步。支持多种舞蹈风格生成、局部编辑及高质量全身动作输出，适用于VR、游戏开发、舞蹈教学等场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 716 浏览

Mercury Coder

Mercury Coder 是 Inception Labs 推出的扩散型大语言模型，专为代码生成设计。它采用“从粗到细”机制，支持并行生成，每秒可处理超过 1000 个 token，效率显著高于传统模型。具备代码生成、补全、优化、多语言支持及可控生成等功能，适用于开发效率提升、教育辅助、代码优化及低代码平台集成等场景。

AI项目与工具 2025年06月12日 24 点赞 0 评论 703 浏览

GEN3C

GEN3C是由NVIDIA、多伦多大学和向量研究所联合开发的生成式视频模型，基于点云构建3D缓存，结合精确的相机控制和时空一致性技术，实现高质量视频生成。支持从单视角到多视角的视频创作，具备3D编辑能力，适用于动态场景和长视频生成。在新型视图合成、驾驶模拟、影视制作等领域有广泛应用前景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 570 浏览

tellers.ai

Tellers.ai 是一款AI驱动的视频生成工具，能够将文本快速转化为高质量视频。它通过智能分析文本内容并匹配真实视频素材，支持多种自定义选项，包括风格设置、剪辑编辑和多语言字幕。用户可将视频直接发布至主流社交平台，适用于内容创作、教育、企业营销和新闻媒体等多种场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 698 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期