视频

NSFW Detector

NSFW Detector是一款基于深度学习的开源工具,利用Google的`vit-base-patch16-224-in21k`模型,能够在CPU环境中高效检测图像、PDF、视频及压缩包内的不适宜内容。该工具支持API集成与Docker部署,具备多CPU加速特性,可实现快速且安全的本地化内容分类,广泛应用于社交媒体、内容共享平台、企业网络等多个领域。

AniPortrait

AniPortrait是一款由腾讯开源的AI视频生成框架,通过音频和一张参考肖像图片生成高质量的动画。该框架包含两个核心模块:Audio2Lmk模块将音频转换为2D面部标记点,而Lmk2Video模块则基于这些标记点生成连贯且逼真的视频动画。AniPortrait以其高质量的视觉效果、时间一致性和灵活的编辑能力著称,能够精确捕捉面部表情和嘴唇动作。

DemoGet

一键出成片的录屏Demo软件,支持4K导出,用户可以在录屏后直接生成成片,省去繁琐的手动编辑过程。

创作星

创作星是一款基于AI技术的多功能对话工具,集成了AI聊天、AI绘画、AI视频制作及文本生成等多项功能。它能够适应多种场景需求,如工作咨询、学术讨论、日常闲聊等,并提供便捷的操作体验。无论是创意激发还是实际应用,创作星都展现出强大的实用性和创新性。 ---

MiniMax MCP Server

MiniMax MCP Server 是一款基于 MCP 协议的多模态生成服务器,支持视频、图像、语音及声音克隆等功能。其具备高分辨率输出、自然语音生成与声音克隆能力,兼容多种主流客户端。平台采用客户端-服务器架构,结合 RAG 技术提升响应准确性,适用于教学、游戏开发、内容创作等多个领域。

TikTok Voice

TikTok Voice 是一款基于人工智能的文字转语音工具,提供多种声音选项,支持多种语言和口音。它能将文本转换成清晰自然的语音,适用于视频编辑、文本朗读、有声电子书制作等多个场景。该工具界面简洁,操作便捷,且完全免费,适合全球用户使用。

知作zizo

知作zizo,借助最新AI技术,针对影视频行业创作的全流程,全面数字化、智能化,实现效率倍增。

sCM

sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型,通过简化理论框架与优化采样流程,实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像,且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进,sCM不仅提高了训练稳定性,还提升了生成质量。其应用场景广泛,包括视频生成、3D建模、音频处理及跨媒介内容创作,适用于艺术设计、游戏开发、影视制作等多个行业。

悦灵犀AI

悦灵犀AI是一款基于先进AI技术的创作平台,支持文生图、文生视频、背景替换、证件照生成及照片修复等多种功能。其智能助手和丰富工具使用户能够高效创作艺术作品,并广泛应用于艺术设计、广告营销、教育等领域。

gling

Gling是一款集成了先进AI技术的视频编辑工具,主要功能涵盖自动去除不良拍摄片段、消除沉默及填充词、生成AI字幕、自动缩放画面、降低背景噪音等。它还能够为视频生成优化标题与章节,适用于个人视频博主、播客制作人、在线教育者及企业培训等多个领域,助力提升视频质量和效率。