长视频 - 智狐AI导航

Apollo

Apollo是一个由Meta和斯坦福大学合作研发的大型多模态模型，专注于视频内容的理解。其核心特性包括“Scaling Consistency”现象的应用、高效的视频理解评估基准ApolloBench、以及在处理长视频方面的卓越性能。Apollo模型家族涵盖多种规模，广泛应用于视频内容分析、搜索推荐、智能监控、自动驾驶及教育等领域。

AI项目与工具 2025年06月12日 16 点赞 0 评论 685 浏览

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架，专为长视频设计。该框架结合自回归模型和扩散渲染技术，生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本，适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

AI项目与工具 2025年06月12日 34 点赞 0 评论 687 浏览

HourVideo

HourVideo是一项由斯坦福大学研发的长视频理解基准数据集，包含500个第一人称视角视频，涵盖77种日常活动，支持多模态模型的评估。数据集通过总结、感知、视觉推理和导航等任务，测试模型对长时间视频内容的信息识别与综合能力，推动长视频理解技术的发展。其高质量的问题生成流程和多阶段优化机制，使其成为学术研究的重要工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 718 浏览

VERBALATE

VERBALATE是一款基于AI的视频翻译与配音工具，支持多语言翻译及口型同步，适用于教育、娱乐、企业培训等场景。其主要功能包括视频翻译、声音克隆、口型同步、多语言支持及长视频处理，界面友好且操作简便，为企业和个人用户提供高效的多语言内容解决方案。

AI项目与工具 2025年06月12日 97 点赞 0 评论 721 浏览

phenaki

phenaki一种从文本生成视频的模型，提示可以随时间变化，视频可以长达数分钟。

Ai视频生成 2026年06月21日 0 点赞 0 评论 724 浏览

MotionCanvas

MotionCanvas是一种图像到视频生成工具，能将静态图像转化为动态视频。它提供相机与物体运动的联合控制，支持复杂轨迹设计和局部运动调整，具备3D感知能力，可生成高质量长视频。适用于电影制作、动画创作、VR/AR、游戏开发及教育等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 726 浏览

ExVideo

ExVideo是一种视频合成模型后调优技术，能够生成长达128帧的连贯视频，同时保持原始模型的生成能力。该技术通过优化3D卷积、时间注意力和位置嵌入等模块，使模型能够处理更长时间跨度的内容。ExVideo的核心优势在于其高效的后调优策略，减少计算资源需求，保持视频质量，适用于计算资源有限的情况。

AI项目与工具 2025年06月12日 57 点赞 0 评论 779 浏览

LVCD

LVCD是一款基于视频扩散模型的AI工具，专门用于动画视频线稿的自动上色。它通过参考注意力机制和创新的采样方法，确保视频颜色的一致性和时间连贯性，支持生成长时间序列动画。LVCD广泛应用于动漫制作、游戏开发、影视行业以及艺术创作等领域，显著提升动画制作效率。

AI项目与工具 2025年06月12日 98 点赞 0 评论 794 浏览

VideoLLaMB

VideoLLaMB 是一个创新的长视频理解框架，通过引入记忆桥接层和递归记忆令牌来处理视频数据，确保在分析过程中不会丢失关键的视觉信息。该模型专为理解长时间视频内容而设计，能够保持语义上的连续性，并在多种任务中表现出色，例如视频问答、自我中心规划和流式字幕生成。VideoLLaMB 能够有效处理视频长度的增加，同时保持高性能和成本效益，适用于学术研究和实际应用。 ---

AI项目与工具 2025年06月12日 39 点赞 0 评论 798 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 810 浏览

长视频

首页

长视频

列表

默认

浏览次数

发布日期