生成

CogVideoX

CogVideoX是由智谱AI开发的开源AI视频生成模型,支持英文提示词生成6秒长、每秒8帧、分辨率为720x480的视频。它具备低显存需求、视频参数定制、3D Causal VAE技术和推理与微调功能。该模型采用基于Transformer的架构和3D Causal Variational Autoencoder技术,支持多阶段训练和自动及人工评估,适用于创意视频制作、教育材料、广告、游戏、电影编

ViewCrafter

ViewCrafter是一种由北京大学、香港中文大学和腾讯合作开发的先进视频扩散模型。它能够从单一或少量图像中合成高质量的新视图,结合视频扩散模型和基于点的3D表示,通过迭代视图合成策略和相机轨迹规划生成多样化的视图。该模型在多个数据集上展示了强大的泛化能力和性能,适用于实时渲染、沉浸式体验及场景级文本到3D生成等多种应用场景。

Tersa

Tersa 是一款开源免费的 AI 工作流构建平台,提供直观的拖放界面,支持 77 个主流 AI 模型,如 GPT-4o、Claude 3.5 Sonnet、DALL-E 3 和 Whisper 等,适用于文本生成、图像视频创作、音频转录和代码优化等多种任务。用户可通过拖放文件快速构建复杂流程,无需编程基础,广泛应用于内容生成、代码审查、原型开发和多模态功能集成等领域。

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术,通过自动生成数据集并微调模型,支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集,实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架,支持多模态输入(如图片、文字、视频等)生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化,具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景,有效降低音乐创作门槛,提升创作效率与个性化体验。

PearAI

PearAI是一款开源的AI辅助代码编辑器,基于VSCode开发。它集成了自然语言处理、机器学习模型以及代码分析技术,能够帮助开发者快速生成代码、理解现有代码逻辑并进行有效维护。PearAI不仅支持本地代码存储以保障数据安全,还提供了友好的用户界面与高效的开发流程。其应用场景广泛,包括但不限于快速原型开发、团队协作、代码审查以及编程教育等。

DaVinciFace

DaVinciFace是一款使用深度学习技术将任何人脸照片生成达芬奇风格肖像的软件。

TenereTeam AI工具集

TenereTeam为用户提供了一个广泛的目录,其中包含35个类别的1000 +多个创新AI工具。这些工具涵盖了人工智能的各个方面,包括文案、图像生成和 ChatGPT。

问小白PPT生成

问小白PPT生成是一款基于AI技术的智能PPT制作工具,用户只需输入主题或大纲,即可快速生成完整的PPT内容,支持文本、布局和设计的一键生成。工具具备高效便捷、自定义性强、多格式导出等功能,适用于工作汇报、学术演讲、商业演示、教育培训及个人分享等多种场景,目前提供完全免费的使用服务。

即梦AI

剪映旗下的一款AI视频生成工具,能够根据用户提供的文本内容生成由AI制作的创意视频!