机器学习

SpeciesNet

SpeciesNet 是 Google 开发的 AI 模型,用于识别相机陷阱图像中的动物物种,支持超过 2000 种标签分类,涵盖动物、分类群及非生物对象。基于 6500 万张图像训练,具备高效数据处理和跨场景识别能力,适用于野生动物监测、生物多样性研究及生态保护。模型开源,可在 GitHub 获取,支持开发人员部署与优化。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

GoEnhance AI

一个基于AI专门用于视频转动漫风格的AI视频增强工具,以实现更高的细节和质量的工具。它利用先进的人工智能技术来分析图像和视频,识别特征和模式,并生成具有更多细节的更高分辨率版本。

BioEmu

BioEmu是由微软研究院开发的生成式深度学习系统,用于高效模拟蛋白质的动态结构和平衡态构象。它能在单个GPU上每小时生成数千种蛋白质结构样本,误差控制在1 kcal/mol以内,支持功能构象变化模拟和热力学性质预测。该工具适用于科学研究、药物开发、个性化医疗等多个领域,显著提升蛋白质结构模拟的效率和精度,为生物医学研究提供强大计算支持。

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具,支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构,结合Articulation-XL大规模数据集,实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域,显著提升动画制作效率与质量。

Platon.AI

Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。

MAETok

MAETok是一种基于掩码建模的图像标记化方法,通过自编码器结构学习更具语义丰富性的潜在空间,提升图像生成质量与训练效率。它支持高分辨率图像生成,具备多特征预测能力和灵活的潜在空间设计,适用于娱乐、数字营销、计算机视觉等多个领域。实验表明其在ImageNet数据集上表现优异。

LLMDet

LLMDet是一款基于大型语言模型协同训练的开放词汇目标检测器,能够识别训练阶段未见过的目标类别。其通过结合图像和文本信息,实现高精度的零样本检测,并支持图像描述生成与多模态任务优化,适用于多种实际应用场景。

Amazon Q

Amazon Q是亚马逊专为IT专业人士和开发人员设计的AI助手,具备智能问答、代码理解和生成、数据源连接、个性化服务、内容创作及业务流程自动化等功能。它通过自然语言处理和机器学习技术,帮助企业提升工作效率,实现数字化转型。Amazon Q能够连接多种数据源,理解企业内部信息,并提供定制化的信息和答案。

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架,采用“下一个X预测”和“噪声上下文学习”技术,提升视觉生成的准确性和效率。其支持多种预测单元,具备高性能生成能力,在ImageNet数据集上表现优异,适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。