生成

HelloMeme

HelloMeme是一款基于扩散生成技术的框架,专注于表情与姿态迁移。它利用空间编织注意力机制与Stable Diffusion 1.5模型的结合,生成自然且物理合理的表情包视频,同时具备强大的泛化能力和扩展潜力。HelloMeme通过模块化设计实现了高效的表情和姿态迁移,适用于多种应用场景,如社交媒体内容创作、视频娱乐、电影制作、广告营销及教育培训等。

Pinegraph

Pinegraph 是一个神奇的画板,通过你在画板上绘制和描述您想要的草图,然后Pinecasso AI 将您的草图转换为令人惊叹的图像。

Openart

Openart是一个在线AI绘画艺术图片生成器工具,让用户可以利用人工智能(AI)来创造和编辑图像。无论用户是艺术家、设计师、作家、游戏开发者还是市场营销人员,都可以在Openart上...

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。

Airpost

Airpost是一款基于AI的视频广告生成工具,专为电商营销设计。用户只需提供产品链接和素材,即可在短时间内生成多个高质量的UGC风格广告视频。平台内置大量真实用户生成内容,确保广告自然且具吸引力。支持脚本编写、镜头选择、音乐匹配等功能,同时允许品牌自定义。适用于新品推广、广告优化及中小团队低成本制作视频广告。

MetaMorph

MetaMorph是一款基于多模态大模型的工具,通过Visual-Predictive Instruction Tuning(VPiT)技术实现文本和视觉token的生成。它在视觉理解和生成领域表现优异,能够克服其他生成模型的常见失败模式,同时有效处理专业术语和复杂语义问题。MetaMorph展示了统一建模方法的优势,支持多模态数据的高效处理,并在视觉生成与理解基准测试中取得竞争力表现。

琴乐大模型

琴乐大模型是一款由腾讯AI Lab与腾讯TME天琴实验室联合开发的人工智能音乐创作工具。该工具能够根据用户输入的关键词、描述性语句或音频,生成高质量的立体声音频或多轨乐谱,并支持自动编辑功能。琴乐大模型采用先进的技术框架,包括音频文本对齐、乐谱/音频表征提取、大语言模型预测以及流匹配和声码器技术,确保生成的音乐符合音乐理论和人类审美标准。

出门问问

出门问问,一家以生成式AI与语音交互为核心的人工智能公司。

豆包PixelDance

豆包PixelDance是一款由字节跳动开发的AI视频生成工具,基于DiT架构,支持文生视频和图生视频功能。它具备强大的语义理解能力,可生成长达10秒的连贯视频片段,并拥有丰富的运镜效果。该工具支持多种艺术风格和视频比例,适用于影视、广告、短视频等多种场景,极大简化了视频创作流程。

PixVerse V3.5

PixVerse V3.5是一款基于AI技术的视频生成工具,具备超高速视频生成、动漫效果自定义、高清画质输出及首尾帧平滑过渡等功能。它通过优化运动控制和细节表现,为用户提供流畅且精准的视频制作体验,适用于社交媒体内容创作及各类节日主题视频设计。