QuickRecorder 一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。 Ai开源项目 2025年06月05日 59 点赞 0 评论 489 浏览
Covers AI 一款功能强大的AI声音和歌曲生成器工具,允许用户使用来自著名主播、政治家、歌手、卡通人物等的数千种声音生成 AI 翻唱。 Ai语音工具 2025年06月05日 82 点赞 0 评论 490 浏览
智能翻译官 AI智能翻译引擎,涵盖文本、文档、图片、视频、音频等多种在线翻译模式,更有强大的文档格式转换处理功能,为您节约80%的时间。 Ai办公效率 2025年06月05日 55 点赞 0 评论 491 浏览
ChatAnyone ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具,基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型,支持实时交互与风格化控制,适用于虚拟主播、视频会议、内容创作等多种场景,具备高度可扩展性和实用性。 AI项目与工具 2025年06月12日 72 点赞 0 评论 492 浏览
VideoPoet VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应 AI项目与工具 2024年01月01日 98 点赞 0 评论 492 浏览
MMAudio MMAudio是一款基于多模态联合训练的音频合成工具,通过深度学习技术实现视频到音频、文本到音频的精准转换。它具备强大的同步模块,确保生成的音频与视频帧或文本描述时间轴完全对应,适用于影视制作、游戏开发、虚拟现实等多种场景,极大提升了跨模态数据处理的能力和应用效率。 AI项目与工具 2025年06月12日 68 点赞 0 评论 494 浏览
MimicTalk MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具,其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术,实现了高效的数据样本利用和训练效率提升,适用于虚拟主播、远程协作、VR/AR等领域。 AI项目与工具 2025年06月12日 59 点赞 0 评论 495 浏览
Jukebox OpenAI开发的AI音乐生成器,Jukebox能够根据提供的歌词、艺术家和流派信息生成多种流派和艺术家风格的完整音乐和人声歌曲。 Ai语音工具 2025年06月05日 17 点赞 0 评论 496 浏览