学习

MusicMint

MusicMint 是一款基于人工智能的音乐创作工具,支持多种音乐风格并提供高度自定义选项,如乐器、情绪、主题和结构等。用户可通过简单描述或选择参数快速生成原创音乐,并支持下载与分享。适用于个人创作、视频配乐、MV 制作及艺术项目等多种场景,是音乐爱好者和创作者的理想工具。

SepLLM

SepLLM是由香港大学与华为诺亚方舟实验室等机构联合开发的高效大语言模型框架,通过压缩段落信息和优化注意力机制,显著提升推理速度与计算效率。其支持处理超长序列(达400万标记),具备低KV缓存占用、高推理速度及多节点分布式训练能力。适用于长文本处理、流式应用、资源受限环境及多语言研究等多个场景,具有良好的部署灵活性和扩展性。

Knowt

Knowt 是一款人工智能学习工具,可将笔记、PDF 和视频内容转化为抽认卡,支持多种学习模式如练习测试和间隔重复。具备实时讲座笔记、PPT/PDF 摘要、拍照解题等功能,适合备考复习、课堂笔记和自主学习,提供丰富的学习资源和多设备同步支持。

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术,通过自动生成数据集并微调模型,支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集,实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

加利福尼亚大学圣迭戈分校

加利福尼亚大学圣迭戈分校(University of California, San Diego,简称:UCSD或UC San Diego),常译为加州大学圣地亚哥分校、圣迭戈加州大学,位于美国圣迭戈的海滨城镇拉荷亚(L...

DL4J

DL4J开源的使用JVM部署和训练...

汉王语音王

汉王语音王是一款由汉王科技开发的智能语音应用程序,集成了AI语音记录、翻译和同声传译等功能。基于自主研发的多模态大模型,它支持高精度的语音转写、拍摄与录音同步、智能总结和实时翻译,适用于多语言环境。通过集成OCR技术,它能够生成图文并茂的多媒体记录,显著提高工作效率。