视频

HourVideo

HourVideo是一项由斯坦福大学研发的长视频理解基准数据集,包含500个第一人称视角视频,涵盖77种日常活动,支持多模态模型的评估。数据集通过总结、感知、视觉推理和导航等任务,测试模型对长时间视频内容的信息识别与综合能力,推动长视频理解技术的发展。其高质量的问题生成流程和多阶段优化机制,使其成为学术研究的重要工具。

I2V3D

I2V3D是一款由香港城市大学与微软GenAI合作开发的图像到视频生成工具,支持将静态图像转换为高质量动态视频。其核心在于结合传统CG管线与生成式AI技术,采用两阶段生成流程实现精准的3D动画控制,支持复杂场景编辑和灵活的视频生成,适用于动画制作、视频创作及教育等多个领域。

Byrdhouse

Byrdhouse 是一个创新的视频会议平台,它通过集成人工智能技术,为用户提供实时翻译服务,从而消除语言障碍,让不同语言的使用者能够无缝沟通和协作。

腾讯智绘设计

智绘设计,多场景智能设计服务商,是腾讯推出的面向创作者以及企业的素材智能化设计生产平台,其聚焦于泛内容领域,提供用户在线工具以创作各种形态的素材,可用于传统行业和新媒体等运营工作。

WowTo

WowTo提供了一个全面的平台,使用户能够轻松创建、定制和集成视频知识库。无论是创建教学视频、支持视频还是逐步视频,WowTo都能帮助提高客户满意度并提供全天候的视频支持。

硅基智能

硅基智能,是一家以服务智能化和知识智能化为核心的人工智能创新企业。

FunClip

FunClip是一款由阿里巴巴达摩院通义实验室开发的开源、本地部署的视频剪辑工具。它主要通过自动化语音识别技术,帮助用户基于语音转文字的结果,选择特定文本片段或说话人进行视频剪辑。其特点包括高精度的中文ASR模型、热词定制化、说话人识别功能、Gradio交互界面,以及支持多段剪辑和自动生成SRT字幕文件。

Videvo

免费提供超过7万部高清4K和HD无水印视频下载

I2VEdit

I2VEdit是一款基于图像到视频扩散模型的先进视频编辑框架,通过首帧编辑实现全视频效果传播。它能够保持视频的时间和运动一致性,支持局部与全局编辑任务,包括更换对象、风格转换等,并广泛应用于社交媒体内容创作、视频后期制作、虚拟试穿等领域。