BEN2 BEN2是一款由Prama LLC开发的深度学习图像和视频处理工具,专注于高效、精准的背景移除与前景分割。采用置信度引导抠图技术,可处理复杂细节,如头发和边缘,确保高精度分割。支持4K图像处理,具备GPU加速功能,适用于图像编辑、视频剪辑及批量处理等多种应用场景。 AI项目与工具 2025年06月12日 60 点赞 0 评论 736 浏览
FILM Frame Interpolation是一个开源的神经网络模型,能够在两个视频帧之间生成高质量的中间帧,特别适合需要处理大范围场景运动的应用。 Ai视频生成 1970年01月01日 0 点赞 0 评论 736 浏览
NVILA NVILA是一款由NVIDIA开发的视觉语言模型,通过“扩展-压缩”策略优化处理高分辨率图像和长视频,兼具效率与准确性。它在图像和视频基准测试中表现优异,支持时间定位、机器人导航和医疗成像等应用场景,并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。 AI项目与工具 2025年06月12日 68 点赞 0 评论 736 浏览
MM1.5 MM1.5是苹果公司研发的多模态大型语言模型,具备强大的文本与图像理解能力,包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法,实现了从1B到30B参数规模的性能提升,并推出了视频和移动UI专用版本,为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。 AI项目与工具 2025年06月12日 64 点赞 0 评论 736 浏览
淘宝星辰 淘宝星辰是阿里妈妈推出的电商视频生成大模型,支持图片或文本指令生成高质量视频。具备智能商品展示、多语种语义理解、物理动作逻辑遵循及元素稳定性保障等功能,适用于商品主图、卖点展示、种草内容及虚拟试穿等场景,有效提升商品吸引力和转化效率。 AI项目与工具 2025年06月12日 73 点赞 0 评论 736 浏览
CAVIA CAVIA是一款由苹果、得克萨斯大学奥斯汀分校和谷歌联合研发的多视角视频生成框架。它通过单一输入图像生成多个时空一致的视频序列,并采用视角集成注意力模块增强视频的一致性和连贯性,支持用户精准控制相机运动。此外,CAVIA利用多种数据源进行联合训练,优化生成视频的质量和真实感,在虚拟现实、增强现实以及电影制作等领域具有重要价值。 AI项目与工具 2025年06月12日 76 点赞 0 评论 735 浏览
万兴播爆Virbo 万兴播爆Virbo是一款AIGC"真人"短视频出海营销神器,为您提供各类跨境营销短视频解决方案。 Ai视频生成 2025年06月05日 79 点赞 0 评论 734 浏览
Veo 3 Veo 3是谷歌推出的新一代视频生成模型,在I/O开发者大会上发布。它是首个能生成视频背景音效的模型,可合成画面并匹配人物对话和口型,支持1080P高质量视频生成,具备物理模拟与口型同步能力,可生成超过60秒的视频片段,并支持多种视觉风格。Veo 3整合了多项先进技术,适用于影视制作、广告营销及教育领域。 AI项目与工具 2025年06月11日 90 点赞 0 评论 734 浏览
Addsubtitle Addsubtitle 是一款基于AI的在线视频编辑工具,支持多语言视频翻译、自动字幕生成与自定义样式设置,适用于全球市场推广和内容本地化。用户可实时编辑字幕并实现精准的唇音同步,同时提供语音克隆和水印去除功能,提升视频的国际化传播能力。 AI项目与工具 2025年05月26日 41 点赞 0 评论 734 浏览