生成

Lyra

Lyra是一款由香港中文大学、SmartMore和香港科技大学联合研发的高效多模态大型语言模型(MLLM)。它通过整合视觉、语音和文本三种模态的信息,实现了强大的跨模态理解和推理能力。Lyra不仅擅长处理长语音数据,还支持流式文本-语音生成及跨模态信息交互,适用于智能助手、客户服务、教育培训、医疗健康等多个领域。

nijijourney

Nijijourney是一款由Spellbrush和Midjourney合作开发的AI工具,主要功能包括基于文本指令生成二次元风格图像、支持图像风格转换、细节微调以及多语言兼容性。它广泛应用于艺术创作、游戏开发、动画制作、漫画绘制及小说插图等领域,帮助用户高效完成高质量的二次元风格视觉内容。

VMB

VMB是一个由多机构合作研发的多模态音乐生成框架,可从文本、图像和视频等多样化输入生成音乐。它通过文本桥接和音乐桥接优化跨模态对齐与可控性,显著提高了音乐生成的质量和定制化程度。VMB具有增强模态对齐、提升可控性、显式条件生成等特点,适用于电影、游戏、虚拟现实等多个领域。

MV

MV-Adapter是一款基于文本到图像扩散模型的多视图一致图像生成工具,通过创新的注意力机制和条件编码器,实现了高分辨率多视角图像生成。其核心功能包括多视图图像生成、适配定制模型、3D模型重建以及高质量3D贴图生成,适用于2D/3D内容创作、虚拟现实、自动驾驶等多个领域。

WeaveFox

WeaveFox 是一款基于 AI 技术的前端开发平台,通过百灵多模态大模型实现从设计图到前端源代码的自动化生成,支持多端适配及多种技术栈。它不仅提高了开发效率和代码质量,还提供了灵活的二次调整功能,确保设计意图的精准还原。未来,WeaveFox 将开放更多应用场景,如快速原型开发、中后台页面构建以及移动端界面生成等。

星语科研助手

星语科研助手是一款面向科研、教育及科普领域的智能写作辅助工具,具备自动生成高质量论文、语言润色与翻译以及专业评审等功能。它支持多种语言,能够帮助用户高效完成科研写作任务,确保内容的专业性与国际化,适用于学术论文、科研报告、科普文章及教学材料等多种应用场景。

UniReal

UniReal是一款由香港大学与Adobe研究院合作开发的多功能图像处理框架,能够实现图像生成、编辑、定制和合成等任务。它通过视频生成模型的设计理念,利用大规模视频数据作为监督源,学习图像间的连贯性与变化性,生成高质量的逼真图像。该框架特别擅长处理复杂的场景,支持多种应用场景,包括数字内容创作、媒体娱乐、广告营销、电子商务及教育等领域。

Explorer

Explorer是一款由Odyssey公司研发的生成性世界模型,主要功能包括将图像转换为高质量的3D场景,并支持动态效果生成。它利用高斯溅射技术和先进的图像识别算法,实现逼真的视觉效果。Explorer生成的场景可无缝集成到主流创作软件中,广泛应用于电影、游戏开发、虚拟现实等领域,显著提升内容创作效率。

Klap

Klap是一款利用AI技术的视频编辑工具,主要功能包括将长视频快速转换为适合社交媒体平台的短视频、智能场景分析、自动裁剪与布局优化、多语言字幕生成等。它支持一键分享至各大社交平台,帮助用户提高内容传播效率。适用于个人、品牌及教育机构等多种场景。