学习

Immersity AI

Immersity AI 是一款基于先进神经深度学习技术的AI平台,可将2D图像和视频转换为沉浸式3D视觉效果。它具备实时预览、编辑功能,并支持从静态图片到动态视频的全面转换,广泛应用于社交媒体、广告营销、教育、娱乐等领域,旨在提升用户体验与内容表现力。

OpenL

OpenL 是一个功能强大的 AI 驱动翻译工具,它利用最新的人工智能技术为用户提供快速、准确的翻译服务。

SAM2Point

SAM2Point是一种基于SAM2的3D分割技术,无需额外训练或2D-3D投影,即可直接对任意3D数据进行零样本分割。该工具通过将3D数据体素化,并将其模拟为多方向视频流,实现精确的空间分割。SAM2Point支持多种3D提示类型,如点、框和掩码,展现了在多种场景下的泛化能力,包括3D物体、室内室外环境以及LiDAR数据,为未来的3D可提示分割研究提供了新起点。

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架,采用两阶段流程:先生成场景深度图,再进行细节渲染。通过注意力机制实现文本与图像的精准对齐,无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域,具备良好的兼容性和性能优势。

Large Motion Model

Large Motion Model(LMM)是一款由新加坡南洋理工大学S-Lab和商汤科技合作研发的多模态运动生成框架。它支持从文本、音乐等多种模态生成逼真运动序列,具备高度精准的身体部位控制能力和强大的泛化能力。通过整合多样化的MotionVerse数据集以及创新性的ArtAttention机制和预训练策略,LMM在多个领域展现出高效的应用潜力,包括动画、虚拟现实、影视特效及运动分析等。

爱五笔

为用户提供一个在线的五笔词库,让用户可以高效地定制自己的五笔词库,兼容主流词库格式,方便用户更换输入法软件以后仍然能使用自己的词库。

Goku

Goku是由香港大学与字节跳动联合开发的AI视频生成模型,支持文本到图像、文本到视频、图像到视频等多种生成方式。其核心优势在于高质量的视频输出、低制作成本及多模态生成能力。Goku+作为扩展版本,专注于广告视频创作,具备稳定的动作表现和丰富的表情交互。模型基于大规模数据集和先进架构,适用于广告、教育、娱乐等多个领域,提升了内容创作效率与质量。

Polyspeak

Polyspeak是一款由AI技术提供支持的语言培训应用程序,它提供西班牙语、法语、德语、中文和英语的免费语言学习,具有身临其境的聊天和对话功能。

QwQ

QwQ-32B-Preview是一款由阿里巴巴开发的开源AI推理模型,具有325亿参数,擅长处理数学与编程领域的复杂任务。它能在多个基准测试中超越同类产品,并提供透明化的推理流程。然而,该模型在语言切换及跨领域应用上存在一定局限性。