视频

PiliPala

一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。

田建通

曾服务众多知名单位,参与项目超千个

Arctime

简单、强大、高效的跨平台字幕制作软件

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型,具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法,提升语言与视觉理解效率,并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署,适用于智能交互、图像识别、视频分析及客服系统等多种场景。

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件,Memo都能轻松将其转换为文本并提炼精华。

Muku AI

AI驱动的爆款视频传播创作工具,可将您的想法转化为可在 TikTok、Instagram 和 YouTube 等社交媒体平台上传播的视频。

MarketingBlocks AI

基于云的 AI 工具,可帮助营销人员生成文案、登录页面、促销视频、艺术、徽标、博客文章、广告以及横幅等。

Meta Movie Gen

Meta公司推出的能够通过简单的文本输入生成视频和声音的AI工具。MetaMovieGen可以创建长达16秒的逼真视频片段,并支持将图像转化为视频,添加音乐和音效。

Pika 2.0

Pika 2.0是一款由Pika Labs开发的AI视频生成工具,具备强大的文本对齐、动作渲染及场景元素整合功能。它能将详细提示转化为连贯且富有想象力的视频剪辑,同时提供自然的动作效果和可信的奇幻物理表现。此外,Pika 2.0支持用户上传和定制化场景元素,通过先进的图像识别技术实现无缝集成,为创作者提供更精细的控制权。这款工具适用于媒体娱乐、电商、教育、工业、医疗和个人创作等多个领域。

Open

Open-Sora是一个开源视频生成模型,基于DiT架构,通过三个阶段的训练(大规模图像预训练、大规模视频预训练和高质量视频数据微调),生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT(Spatial-Temporal Diffusion Transformer)核心组件,利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程,供