AI

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架,结合大型语言模型与视频扩散模型,实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入,精确控制摄像机运动轨迹,具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果,并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域,提高视频创作效率与质量。

Scam AI

Scam AI 是一款基于人工智能的防诈骗工具,支持快速验证视频、音频和文本内容的真实性,识别AI生成或深度伪造内容。它结合自然语言处理、视觉和音频分析技术,具备多格式支持、隐私保护和实时检测等功能,适用于个人、企业、媒体和金融等多个场景,帮助用户有效防范网络欺诈风险。

MVoT

MVoT是一种多模态推理框架,通过生成图像形式的推理痕迹,增强多模态大语言模型在复杂空间推理任务中的表现。其核心技术包括多模态推理范式、token discrepancy loss以及递归生成机制,有效提升推理准确性和可解释性。该工具适用于机器人导航、自动驾驶、智能教育、医疗影像分析及VR/AR交互等多个领域,具有广泛的应用潜力。

StoriesForKids AI

StoriesForKids.ai 是一款使用AI为孩子们创建个性化的故事和插图工具。这是一种与孩子一起阅读和创作的有趣而简单的方法。

Step

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

SpinBot

SpinBot是一款基于AI的文本改写工具,支持文章重写、语法检查和摘要生成等功能,适用于内容创作、学术写作、市场营销及社交媒体管理等场景。用户可通过该工具提升写作效率,生成高质量、原创性内容,同时支持自定义设置以保留特定术语。SpinBot有助于避免内容重复,提高文本的准确性和可读性。

声动视界SoundView

一款面向带货短视频的AI视频工具,声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。

AvatarGO

AvatarGO是由南洋理工大学、上海AI Lab和香港大学联合开发的AI框架,能够根据文本描述生成高质量的4D人体与物体交互场景。其核心在于利用LLM引导的接触重定位、空间感知的分数蒸馏采样和运动优化技术,实现精确的接触识别与动画生成,有效解决穿透问题。支持多种人物与物体组合,适用于虚拟导购、展厅讲解、VR/AR内容创作等多个领域。

Together AI

Together AI 是一家提供生成式 AI 云服务的平台,支持模型快速推理、微调及训练,具备高性能、低成本和可扩展性。平台提供无服务器或专用端点部署,支持企业级 VPC,确保数据安全。其 GPU 集群支持大规模 AI 计算,适用于内容创作、企业应用、网络安全等多个领域,满足从模型优化到定制开发的全流程需求。