生成 - 智狐AI导航

ChatAnyone

ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具，基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型，支持实时交互与风格化控制，适用于虚拟主播、视频会议、内容创作等多种场景，具备高度可扩展性和实用性。

AI项目与工具 2025年06月12日 72 点赞 0 评论 617 浏览

Vidu Q1

Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型，支持1080p高清视频生成，具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异，包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构，融合文本、图像和视频信息，适用于影视制作、广告宣传及动画创作等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 641 浏览

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术，支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域，提供高效且逼真的视觉内容生成能力。

AI项目与工具 2025年06月12日 51 点赞 0 评论 559 浏览

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统，支持中英文及2000+音色，能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能，提供Web界面和API接口，适用于有声读物、智能助手、教育、客服等场景，技术上支持高效部署与模型微调。

AI项目与工具 2025年06月12日 30 点赞 0 评论 756 浏览

Vibe Draw

Vibe Draw是一款开源AI 3D建模工具，能将2D草图自动转换为高质量3D模型，并支持文本提示优化和模型编辑。用户可一键导出为glTF格式，适用于创意设计、教育、游戏开发等多个领域。工具基于Next.js、React、Three.js、FastAPI等技术，具备高效的实时交互与异步处理能力。

AI项目与工具 2025年06月12日 68 点赞 0 评论 574 浏览

OmniSQL

OmniSQL 是一款开源的文本到 SQL 转换工具，能将自然语言问题精准转化为 SQL 查询语句。它基于大规模数据集 SynSQL-2.5M 进行训练，涵盖 250 万条样本，覆盖 16,000 余个跨领域数据库。支持多种复杂查询类型，提供思维链推理过程，并提供 7B、14B 和 32B 三种模型版本。适用于企业数据分析、教育及跨领域应用，提升数据访问效率与学习体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 728 浏览

MegaTTS 3

MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统，采用轻量级扩散模型，支持中英文及混合语音合成，具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模，可快速生成高质量语音，适用于教育、内容制作、语音交互等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 716 浏览

Hi3DGen

Hi3DGen是由多所高校与企业联合开发的高保真3D几何生成框架，可从2D图像生成具有丰富细节的3D模型。其核心技术包括图像到法线估计、法线到几何学习及3D数据合成，采用两阶段生成流程并结合3D高斯散射与SDF重建技术，提升模型精度与细节表现。适用于游戏开发、影视制作、3D可视化等多个领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 718 浏览

Style3D Ai

Style3D AI 是一款面向时尚行业的AI设计与生产工具，支持通过草图、文字或参考图生成可生产的服装款式，具备3D设计、面料替换、自动缝合、BOM生成及智能商拍等功能。平台提供丰富的流行轮廓和资源库，助力企业提高设计效率、缩短生产周期，实现从设计到生产的全流程数字化管理。

AI项目与工具 2025年06月12日 58 点赞 0 评论 539 浏览

Runway Gen

Runway Gen-4 是一款由 Runway 公司推出的高保真 AI 视频生成模型，能够跨场景保持人物、物体和环境的一致性，无需额外训练。用户仅需提供一张参考图和文字指令，即可生成具有真实物理效果和高质量视觉风格的视频内容。支持多种应用场景，如影视制作、动画创作、音乐视频、游戏开发和广告营销，有效提升创作效率并降低成本。

AI项目与工具 2025年06月12日 61 点赞 0 评论 709 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期