增强

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型,利用运动潜在空间和流匹配技术,实现时间一致性视频生成。它支持情感增强,生成自然且富有表现力的虚拟人物,广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域,同时具备高效的采样和生成能力。

HitPaw Video Enhancer

HitPaw视频增强器是一款使用人工智能技术的视频质量增强工具,可提高视频分辨率和质量。

NeroAI

一个提供多种图像修复工具的网站,包括图像放大、照片上色、照片修复以及AI生成头像等工具。

Wonder Animation

Wonder Animation是一款基于AI的视频到3D场景转换工具,由Autodesk的Wonder Dynamics研发。它能够将视频序列转化为包含摄像机设置和角色动画的3D动画场景,支持多剪辑和多种镜头处理。通过深度学习和计算机视觉技术,Wonder Animation在3D空间中重建场景,并确保动作和场景的高度同步与一致。此工具特别适合动画电影制作、视频游戏开发、虚拟制作以及增强现实和虚

Granite 3.0

Granite 3.0是IBM推出的一套先进的AI模型,适用于多种应用场景,包括客户服务自动化、内容创作与审核、数据分析以及编程辅助。它通过检索增强生成技术和多语言支持提升任务效率,并具备出色的安全防护能力。该模型采用深度学习和混合专家架构,经过大规模数据训练,为企业提供高效、灵活且可靠的AI解决方案。

渗透智能

一款全方位AI产品,集成问答+绘画+导图+PDF对话等功能!

ZAKER

机器人客服、智能客服、ai机器人客服

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱,支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能,采用传统图像处理与深度学习技术相结合的方式,提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。

Infinity

Infinity-MM是智源研究院发布的千万级多模态指令数据集,包含4300万条样本,涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量,并采用合成数据生成技术扩展数据集规模。基于此数据集,智源研究院训练出了20亿参数的Aquila-VL-2B模型,在多项基准测试中表现出色,推动了多模态AI领域的研究与发展。

VMB

VMB是一个由多机构合作研发的多模态音乐生成框架,可从文本、图像和视频等多样化输入生成音乐。它通过文本桥接和音乐桥接优化跨模态对齐与可控性,显著提高了音乐生成的质量和定制化程度。VMB具有增强模态对齐、提升可控性、显式条件生成等特点,适用于电影、游戏、虚拟现实等多个领域。