生成 - 智狐AI导航

SongGen

SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型，能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出，可分别生成人声与伴奏，便于后期编辑。SongGen通过创新的音频标记化和训练策略，显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准，适用于音乐创作、视频配乐、教育辅助等多个领域。

AI项目与工具 2025年06月12日 78 点赞 0 评论 718 浏览

Ideogram 2a

Ideogram 2a 是 AI 图像生成平台 Ideogram 推出的文生图模型，基于 Ideogram 2.0 优化升级，具备高效生成、成本降低、高质量文本渲染等特点。支持多种艺术风格和中文提示，适用于平面设计、数字营销、摄影及艺术创作等多个领域，是提升图像创作效率和质量的实用工具。

AI项目与工具 2025年06月12日 78 点赞 0 评论 706 浏览

Pika 2.2

Pika 2.2 是一款基于深度学习的AI视频生成工具，支持文本和图片输入，可生成最高10秒、1080p分辨率的高质量视频。其核心功能包括关键帧过渡技术（Pikaframes）和电影画幅比例支持，提升视频连贯性与专业感。适用于内容创作、广告制作、影视及教育等多个领域，操作简便，适合各类用户快速生成创意视频。

AI项目与工具 2025年06月12日 34 点赞 0 评论 524 浏览

FLORA

FLORA是一款面向创意工作者的AI工具平台，通过节点式画布整合文本、图像和视频生成功能，支持故事分析、角色设计、分镜脚本生成及团队协作，提升创意流程效率，适用于视频创作、游戏开发、设计及教育等领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 538 浏览

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 696 浏览

VidSketch

VidSketch是由浙江大学研发的视频生成框架，支持通过手绘草图和文本提示生成高质量动画。它采用层级草图控制策略和时空注意力机制，提升视频连贯性和质量，适用于不同技能水平的用户。具备多样化风格支持和低门槛创作特点，广泛应用于创意设计、教学、广告及内容创作等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 699 浏览

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具，支持零样本多语言生成，提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器，实现文本与图像的高效交互。实验表明其性能优于现有方法，适用于艺术创作、广告设计、影视制作等多个领域，具备高效、灵活和高质量的生成能力。

AI项目与工具 2025年06月12日 59 点赞 0 评论 519 浏览

Evryface

Evryface 是一款基于AI技术的照片生成工具，用户上传照片后可生成多种风格的数字孪生形象，支持超过100种风格选择，输出高清图像，适用于社交媒体、职业形象、艺术创作及宠物摄影等场景。平台注重隐私保护，操作便捷，支持批量生成，满足多样化需求。

AI项目与工具 2025年06月12日 23 点赞 0 评论 634 浏览

WorldCraft

WorldCraft是一款基于大型语言模型的3D世界创建系统，支持用户通过自然语言交互快速生成和调整虚拟场景。其核心模块包括物体定制、场景布局优化和轨迹控制，具备高精度的几何与纹理控制能力。系统兼容多种3D生成工具，适用于建筑设计、影视娱乐、教育等多个领域，为非专业人士提供高效、直观的创意设计解决方案。

AI项目与工具 2025年06月12日 80 点赞 0 评论 744 浏览

Mobius

Mobius 是一款基于人工智能的视频生成工具，能根据文本描述自动生成无缝循环的视频内容。其核心技术包括潜在循环技术和时间一致性优化，确保视频流畅自然。支持多场景应用，如社交媒体、广告、艺术创作和教育领域，简化视频制作流程，提升创作效率与质量。

AI项目与工具 2025年06月12日 90 点赞 0 评论 522 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期