视频

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型,通过“扩展-压缩”策略优化处理高分辨率图像和长视频,兼具效率与准确性。它在图像和视频基准测试中表现优异,支持时间定位、机器人导航和医疗成像等应用场景,并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

Future Baby Generator

Future Baby Generator是一款利用人工智能技术的图片处理应用,能够生成未来孩子的面部图像。该应用除了预测宝宝长相外,还提供AI换脸、AI视频生成、人脸和风景合一效果、卡通化效果以及动漫滤镜等功能。它适用于准父母、家庭娱乐、社交媒体用户、婚礼庆典、教育工作者以及创意专业人士等多种场景。

Fineshare FineVoice

Fineshare FineVoice 是一款多功能 AI 配音生成工具,支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项,适用于视频制作、播客、教育、营销等多种场景,助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作,适合个人与企业用户使用。

Spirit Me

SpiritMe允许用户使用数字化身制作视频,这些化身可以用自己的声音和情感表达说出他们输入的任何文本。它提供订阅、预付费计划和免费试用。它可以作为一种工具来进行交流,生成个...

FILM

Frame Interpolation是一个开源的神经网络模型,能够在两个视频帧之间生成高质量的中间帧,特别适合需要处理大范围场景运动的应用。

BodyTalk

BodyTalk是一款基于生成性AI技术的视频配音工具,支持将视频中的语音翻译成29种语言,并通过声音模仿和面部动作同步技术保持自然效果。它提供自动化处理、编辑功能以及多语言支持,适用于教育、企业培训、市场营销等多个领域,帮助企业扩大国际影响力并提升视频内容的质量。

DNA-RENDERING数字人库

DNA-Rendering是一个具有高多样性和高保真度的神经演员渲染库,它为广泛的研究任务提供了丰富的数据和高质量的注释。

CloneAI

一款AI驱动的视频转换应用程序,可以将两张不同时空中拍摄的照片丝滑地拥抱在一起的视频,也可可以通过上传一段视频,将视频中的人物换成一个现实生活中不存在的人物,同时保证动作的完美同步。

CAVIA

CAVIA是一款由苹果、得克萨斯大学奥斯汀分校和谷歌联合研发的多视角视频生成框架。它通过单一输入图像生成多个时空一致的视频序列,并采用视角集成注意力模块增强视频的一致性和连贯性,支持用户精准控制相机运动。此外,CAVIA利用多种数据源进行联合训练,优化生成视频的质量和真实感,在虚拟现实、增强现实以及电影制作等领域具有重要价值。

AutoShorts

AutoShorts是一个开源的AI视频创作和发布平台,它通过AI技术自动生成并定制视频内容,支持用户自定义脚本、配音和视觉效果。该平台可实现每日自动发布新视频到YouTube和TikTok,适用于内容创作者、社交媒体管理者、营销代理及教育机构。AutoShorts简化视频制作流程,提升工作效率,同时确保内容的独特性和创新性。