学习

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。

Conbrie

Conbrie 是一款基于 AI 的知识整理与学习工具,支持文档解析、知识卡片生成、思维导图创建等功能,帮助用户高效整理和复习知识。具备多平台兼容性和多种文件导出格式,适用于个性化学习、在线教学等多种场景,提升学习效率与知识系统化程度。

口语精灵

口语精灵是一款基于人工智能的英语口语学习工具,提供1V1智能对话练习,涵盖生活、工作、考试等多场景,支持多种英语口音。其具备发音评估、语法纠错、语句优化等功能,帮助用户提升口语表达的准确性和自然度。同时,该工具提供个性化学习方案和考试备考支持,适用于不同学习阶段的用户。

Autoblocks AI

Autoblocks AI 是一款面向 AI 团队的开发与测试平台,提供模块化开发、大规模场景模拟、自动缺陷检测与修复、性能评估及实时监控等功能。支持多场景测试与智能优化,提升 AI 代理的可靠性与稳定性,适用于医疗、法律、金融、客服等多个领域。

音疯

昆仑万维推出的一个集音乐创作、分享、学习和销售于一体的AI音乐生成平台,用户可以在平台上输入歌词,一键生成专属的歌曲,还可以通过参考其他音乐来生成相似风格的作品。

智能答人

一款基于AI大语言模型、自然语言处理、深度学习等技术的AI客服机器人。它可以通过对企业上传的私有化数据进行自主化训练学习,生成企业专属的、定制化的智能客服,能够精准理解用户诉求,并以更接近人类对话方式交互问答。

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。

Magma

Magma是微软研究院开发的多模态AI基础模型,具备理解与执行多模态任务的能力,覆盖数字与物理环境。它融合语言、空间与时间智能,支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练,Magma在零样本和微调设置下表现优异,适用于网页操作、机器人控制、视频理解及智能助手等多个领域。