视频

VAS视频加字幕

VAS视频加字幕,一键生成视频字幕,使用AI提取音频对话内容后翻译、生成字幕文件。

Any Summary

Any Summary 是一款基于人工智能的文档总结工具,支持多种文件格式(如 PDF、Word、图片、音频、视频)的快速分析与总结,帮助用户从长篇内容中提取关键信息。其功能涵盖文件总结、URL 内容抓取、多语言支持、自定义摘要格式、AI 自动摘要生成及大文件处理,适用于学术研究、新闻采访、商务报告、法律文件分析、教育学习及产品评测等多个领域。

QuickVid

QuickVid是一款利用AI技术的视频编辑工具,可将长视频自动剪辑为适配社交媒体的短视频片段。其核心功能包括一键剪辑、AI驱动的精彩瞬间识别、自动化字幕生成、病毒式传播潜力评估及智能布局调整。适用于社交媒体内容创作、品牌营销、教育培训等多个领域,显著提升视频制作效率与传播效果。

Faceplay秀脸

FacePlay是一款基于AI技术的多功能应用程序,提供视频换脸、照片动画、AI滤镜、写真生成、对口型模拟及证件照制作等功能。凭借其丰富的模板库和直观的操作界面,用户可以高效生成高质量的内容,适用于社交媒体创作、娱乐、个性化尝试及艺术设计等多个领域。

即构数智人

即构数智人是由音视频通讯公司即构科技推出的一个AI虚拟数字人视频创作平台,通过音视频云服务与大语言模型,为用户提供定制化的数字人分身。该AI数智人工具结合了面部表情传递、...

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型,主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构,集成了视觉和语言信息,通过Siglip视觉编码器和Qwen-2语言模型,实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

TemPolor

一款人工智能音乐生成器,TemPolor可以将您的文本转化为个性化音乐,创造属于您自己的音乐交响曲。用户使用文字、敲击或哼唱来提供旋律灵感,然后帮助将其生成一首歌。

TrajectoryCrafter

TrajectoryCrafter是一种基于双流条件视频扩散模型的单目视频相机轨迹重定向工具,支持用户自定义相机运动路径并生成高质量、4D一致的视频内容。其核心技术包括解耦视图变换与内容生成、动态点云渲染以及混合数据集训练策略,具备强大的场景泛化能力。适用于沉浸式娱乐、视频创作、智能会议、自动驾驶及教育等多个领域。

MarsAi

MarsX是一个改变软件开发游戏的平台,结合了AI、NoCode和代码,以及微应用。