ChildMandarin ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集,包含41.25小时高质量语音,覆盖全国22个省市。数据通过家长引导式对话采集,保证自然真实。该数据集支持语音识别、说话人验证和语言研究,适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域,为儿童语音技术研究提供重要资源。 AI项目与工具 2025年06月12日 28 点赞 0 评论 251 浏览
PersonaCraft PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术,能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状,并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域,为个性化定制提供了强大的技术支持。 AI项目与工具 2025年06月12日 23 点赞 0 评论 251 浏览
ZEBRACAT ZEBRACAT是一款基于AI技术的视频创作平台,支持多语言文本转视频、AI配音和头像生成等功能。其核心特性包括视频分辨率优化、色彩校正、噪声消除等,同时具备个性化内容定制能力。ZEBRACAT适用于社交媒体营销、内容创作、教育培训、电商展示及企业宣传等多种场景,可有效提升视频制作效率并减少成本。 AI项目与工具 2025年06月12日 19 点赞 0 评论 251 浏览
Coral AI Coral AI 是一款基于 AI 的文档分析平台,专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言,适用于学术研究、法律分析和商业报告等场景,特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等,并支持多种文件类型和图像分析。 AI项目与工具 2025年06月12日 54 点赞 0 评论 251 浏览
Synthesizer V Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支... Ai语音工具 1970年01月01日 0 点赞 0 评论 251 浏览
Vidu Q1 Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型,支持1080p高清视频生成,具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异,包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构,融合文本、图像和视频信息,适用于影视制作、广告宣传及动画创作等领域。 AI项目与工具 2025年06月12日 96 点赞 0 评论 251 浏览
听脑AI 听脑AI是一款AI智能语音助手,专注于语音转文本和实时录音总结,提供音视频转文字、实时录音转文本、AI总结、章节速览等功能。用户可以通过自由拖动文本查看音视频进度,享受便捷... 创作工具 1970年01月01日 0 点赞 0 评论 251 浏览
加利福尼亚大学洛杉矶分校 加利福尼亚大学洛杉矶分校(University of California, Los Angeles,简称:UCLA) ,是位于美国洛杉矶的公立研究型大学 ,是环太平洋大学联盟和国际公立大学论坛成员 ,被誉为“公... 教育学习 1970年01月01日 0 点赞 0 评论 251 浏览