视频

DressPlay

DressPlay是一款基于AI技术的虚拟试衣应用,支持用户通过上传照片或视频实现服装的虚拟试穿。其核心功能包括虚拟试衣、服装选择、视频换装及个性化调整等。凭借强大的AI算法,DressPlay能精准分析用户身形并生成逼真效果,广泛应用于个人购物、电商平台、内容创作及设计等领域,提升用户体验与商家效率。

腾讯广告妙思

一站式AI广告创意平台,基于腾讯自研的混元大模型开发,并集成了AIGC技术。它能够快速生成广告图片和其他创意内容,相比传统人工制作,不仅效率更高,创意视角也更丰富。

ShortMake AI

一款能够将想法转化为爆款视频的AI视频生成工具。不需要视频编辑技术,通过ShortMake AI可快速生成视频脚本、配音、图像和字幕,并将这些元素组合成视频。

ObjectMover

ObjectMover是由香港大学与Adobe Research联合开发的图像编辑模型,专注于解决物体移动、插入和移除过程中的光影协调问题。通过视频先验迁移和序列到序列建模技术,实现对光照、阴影和遮挡关系的精准控制。支持多任务学习,提升模型在真实场景中的适应性。广泛应用于特效制作、虚拟场景编辑、游戏开发等领域,具备高效、真实的图像编辑能力。

MAGI

MAGI-1是一款由Sand AI开发的开源视频生成大模型,采用自回归架构,支持高效、高质量的视频生成,具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域,技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法,提升生成效率与稳定性。

Pika 2.2

Pika 2.2 是一款基于深度学习的AI视频生成工具,支持文本和图片输入,可生成最高10秒、1080p分辨率的高质量视频。其核心功能包括关键帧过渡技术(Pikaframes)和电影画幅比例支持,提升视频连贯性与专业感。适用于内容创作、广告制作、影视及教育等多个领域,操作简便,适合各类用户快速生成创意视频。

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具,集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能,支持多客户端和多场景应用。基于标准化接口和开源生态,提供高效、灵活的数字生产力解决方案,适用于内容创作、虚拟主播、在线教育等多个领域。

VideoCrafter2

VideoCrafter2 是一款由腾讯AI实验室开发的视频生成模型,通过将视频生成过程分解为运动和外观两个部分,能够在缺乏高质量视频数据的情况下,利用低质量视频保持运动的一致性,同时使用高质量图像提升视觉质量。该工具支持文本到视频的转换,生成高质量、具有美学效果的视频,能够理解和组合复杂的概念,并模拟不同的艺术风格。

M2UGen

M2UGen是由腾讯PCG ARC实验室与新加坡国立大学共同研发的一款多模态音乐理解和生成框架,支持从文本、图像、视频等多种模态输入生成相应音乐。它具有强大的音乐理解能力、灵活的音乐编辑功能以及多样化的应用场景,适用于音乐制作、影视配乐、音乐教育等多个领域。凭借其创新的技术架构和卓越的表现力,M2UGen已成为当前最优秀的多模态音乐生成工具之一。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。