应用

CogAgent

CogAgent是一款由清华大学与智谱AI联合开发的多模态视觉大模型,专注于图形用户界面(GUI)的理解与导航。它具备视觉问答、视觉定位、GUI Agent、高分辨率图像处理及多模态能力,可应用于自动化测试、智能交互、多模态人工智能应用开发、企业级AI Agent平台等多个领域。CogAgent在多个基准测试中表现出色,尤其在GUI操作数据集上显著超越现有模型。

善利AI高考备考系统

善利AI高考备考系统的独特之处在于其智能化教学模式,系统通过运用先进的人工智能算法,能够根据学生的学习进度和能力水平进行个性化的学习指导,当学生在解答数学题目时遇到困难...

k1.5

k1.5 是月之暗面推出的多模态思考模型,具备强大的数学、代码、视觉推理能力。在 short-CoT 模式下,性能超越主流模型 550%,在 long-CoT 模式下达到 OpenAI o1 水平。支持文本与图像的联合处理,适用于复杂推理、跨模态分析、教育、科研等领域。通过长上下文扩展和策略优化,提升推理效率与准确性。

SongCreator

SongCreator是一款基于AI技术的音乐生成工具,由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型(DSLM)和注意力掩码策略,支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务,并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域,为用户提供高效便捷的音乐解决方案。

蜜巢政务大模型

蜜巢为蜜度自主研发的政务大模型,在研发工作中,构建了Token数超1万亿、中文内容占比超75%的高质量语料数据集用于预训练工作。

OpenAI Academy

OpenAI Academy是OpenAI推出的免费AI学习平台,提供多样化的课程和直播活动,涵盖从基础到高级的AI技能。课程内容包括AI教学、科研应用、开发者进阶等,适合教育工作者、学生、技术人员及普通学习者。平台还注重AI在公益和社会服务中的实际应用,致力于推动AI技术的普及与落地。

Promptim

Promptim是一款实验性的AI提示优化工具,旨在通过自动化优化循环提升AI系统在特定任务中的表现。其主要功能包括自动化提示优化、自定义评估器集成、人工反馈循环及多轮优化。Promptim支持文本生成、对话系统、机器翻译、情感分析和教育等多个应用场景,通过数据驱动的优化方法和元提示策略,帮助用户快速生成更高效的提示,显著提升AI系统的性能。

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架,能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动,创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频,具有低延迟的特点,并且能够处理多种类型的输入,如艺术照片、歌唱音频和非英语语音。此外,通过灵活的生成控制,用户可以调整输出的多样性和适应性。

绘创

绘创是一款基于AI技术的在线摄影创作平台,提供AI写真、主题照、风格照及换背景等功能,帮助用户高效创作个性化与艺术化的照片。其低使用门槛和一站式服务特性,使用户无需专业技能即可快速完成照片编辑与风格转换,广泛适用于个人、摄影师、设计师及企业等多个领域。