视频 - 智狐AI导航

BAGEL

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 491 浏览

剧分钱

短剧CPS分发与推广伙伴，剧分钱专注于为抖音、快手、视频号上的剪辑创作者提供高效转化的短剧分销小程序挂载工具和丰富的变现机会。

流量变现 2025年06月05日 100 点赞 0 评论 491 浏览

Vidu Studio

一款先进的能将文字描述或图片转化为高质量视频。无论是文字描述还是图片，Vidu Studio都能轻松转化为专业级视频作品，适用于营销、教育、娱乐等多个行业,满足多样化需求。

Ai视频生成 2025年06月05日 15 点赞 0 评论 491 浏览

Faster Whisper

Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具，利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理，可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测（VAD）及模型优化，同时提供灵活的 API 接口供开发者集成。

AI项目与工具 2025年06月12日 30 点赞 0 评论 488 浏览