跨语言

首页

跨语言

列表

默认

浏览次数

发布日期

VLOGGER

VLOGGER

VLOGGER AI是一款由谷歌研究团队开发的多模态扩散模型，主要用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该工具能够根据音频控制人物动作，包括面部表情、唇部动作、头部运动、眼神、眨眼及上身和手部动作，实现音频驱动的视频合成。VLOGGER生成的视频具有高度的真实性和多样性，能够展示原始主体的不同动作和表情。此外，VLOGGER还可以用于编辑现有视频和跨语言视频内容适配。

AI项目与工具 2024年01月01日 12 点赞 0 评论 767 浏览

VoiceCraft

VoiceCraft

VoiceCraft是一款开源的神经编解码器语言模型，专攻零样本语音编辑和文本到语音（TTS）任务。它采用Transformer架构，通过token重排过程结合因果掩蔽和延迟叠加技术，实现在现有音频序列内高效生成自然的语音。VoiceCraft在多种口音、风格和噪声条件下表现出色，适用于有声读物制作、视频内容创作、播客音频编辑及多语言内容生产等场景。

AI项目与工具 2024年01月01日 31 点赞 0 评论 717 浏览

GPT-SoVITS

GPT-SoVITS

一个强大的语音合成工具，特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换，支持多种语言，并提供了易于使用的WebUI工具。

Ai平台模型 2026年06月21日 0 点赞 0 评论 849 浏览

Synthesizer V

Synthesizer V

Synthesizer V是一款革命性的音乐制作工具，它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成，无限音轨，无核心限制，VST3/AU插件支...

Ai语音工具 2026年06月21日 0 点赞 0 评论 611 浏览

网易见外

网易见外

网易见外是由网易人工智能事业部研发的AI智能语音转写听翻平台，提供视频听翻、直播听翻、语音转写、文档直翻等功能。

Ai语音工具 2026年06月21日 0 点赞 0 评论 849 浏览

吱意

吱意是一款可以适用于图片翻译、文档翻译，视频翻译等场景的在线工具。同时，吱意还提供多模态翻译和智能配音，AI写作，AI成画等AIGC人工智能创作等服务。

Ai语音工具 2026年06月21日 0 点赞 0 评论 505 浏览

Voicebox

Voicebox

Voicebox 是由 Meta AI 研究团队开发的一款领先的语音生成模型。Voicebox 能够在六种语言中合成语音，消除瞬态噪声，编辑内容，在语言之间转移音频风格，并生成多样的语音样本。此...

创作工具 2026年06月21日 0 点赞 0 评论 759 浏览

百度AI同传

百度AI同传

强大的实时同传工具，它通过百度的AI技术，为用户提供实时的语音识别和多语言翻译服务。这款工具不仅提高了跨语言交流的效率，还极大地方便了国际会议、商务洽谈等多语言环境中的...

创作工具 2026年06月21日 0 点赞 0 评论 604 浏览

讯飞同传

讯飞同传

无论是教育、体育还是商务领域，讯飞同传都能帮助用户跨越语言障碍，实现无障碍沟通。同时，它还注重用户的信息安全，提供了高标准的信息安全保障。

创作工具 2026年06月21日 0 点赞 0 评论 593 浏览

EMO

EMO

EMO通过其先进的音频驱动视频生成技术，为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情，还能根据音频内容自然地驱动头部动作，为...

Ai平台模型 2026年06月21日 0 点赞 0 评论 358 浏览

微信公众账号

微信扫一扫加关注