Dolphin Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型,支持40种语言及22种中文方言,具备高精度语音转文字能力。采用CTC-Attention架构,结合E-Branchformer和Transformer技术,提升识别效率与准确性。模型开源,支持自定义语言与地区设置,适用于会议记录、语音输入、智能助手等多种场景。 AI项目与工具 2025年06月12日 20 点赞 0 评论 497 浏览
UniRig UniRig是由清华大学计算机系与VAST联合开发的自动骨骼绑定框架,基于自回归模型和交叉注意力机制,可高效生成高质量骨骼结构和蒙皮权重。其支持多种3D模型类型,涵盖动漫角色、有机与无机结构等,广泛应用于动画制作、游戏开发、虚拟角色设计等领域。项目提供开源代码和详细文档,助力提升3D动画制作效率与质量。 AI项目与工具 2025年06月11日 81 点赞 0 评论 200 浏览
灵动音DeepMusic 灵动音DeepMusic致力于通过AI词曲编录混技术,全方位降低音乐创作制作门槛并提升效率,为音乐行业提供新的产品体验和解决方案。 AI服务商 2025年06月05日 87 点赞 0 评论 363 浏览
深言达意 深言达意是一款可根据模糊描述,找词找句的Ai写作工具。核心功能包括据意查词、据意查句。根据模糊的描述,找到贴切的词语和名言佳句,支持汉英双语。深言达意基于先进的人工智能算法实现。 剧本文案 2025年06月05日 81 点赞 0 评论 127 浏览
Wisemodel Wisemodel,始智AI团队打造的中立开放AI开源社区平台,旨在打造中国版 “HuggingFace”。 Ai学习资源 2025年06月05日 68 点赞 0 评论 272 浏览
DreamTalk 一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。 Ai开源项目 2025年06月05日 98 点赞 0 评论 290 浏览
CogVideo 目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。 Ai平台模型 2025年06月05日 16 点赞 0 评论 366 浏览