深度学习

SVFR

SVFR是一款由腾讯优图实验室与厦门大学联合开发的视频人脸修复框架,能够统一处理视频中的人脸修复、着色和缺失区域补全任务。基于Stable Video Diffusion模型,结合任务嵌入、统一潜在正则化等技术,提升修复精度与时间稳定性。适用于影视后期、网络视频制作及数字档案修复等领域,具有广泛的应用价值。

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架,用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体,支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式,适用于不同复杂度任务,如日程安排、数学证明、自动驾驶等。具有模型不可知性,可与多种大语言模型结合,具备良好的可扩展性和灵活性。

RF

RF-DETR是一款由Roboflow推出的实时目标检测模型,支持多分辨率训练,具备高精度和低延迟特性,在COCO数据集上达到60+ mAP。结合Transformer架构和预训练DINOv2主干,提升领域适应性和检测效果。适用于安防、自动驾驶、工业检测等多个场景,提供预训练检查点以支持快速微调和部署。

代悟

代悟是一款基于深度学习技术和知识图谱的智能AI搜索引擎,专注于为开发者提供高效、精准的技术支持。它能够解析复杂的技术问题,提供代码示例、文档检索、错误诊断及性能优化建议等功能。代悟支持多语言开发环境,适用于代码开发、问题解决、技术学习及项目规划等多个场景。

ProtGPS

ProtGPS是一款由MIT与怀特黑德生物医学研究所开发的深度学习模型,用于预测蛋白质在细胞内的亚细胞定位。它基于Transformer架构,能准确识别蛋白质在12种不同亚细胞区域的分布,并支持设计特定定位的蛋白质序列。该工具还可分析致病突变对蛋白质定位的影响,为疾病机制研究、蛋白质工程和药物开发提供新思路。

Object Cutter

Object Cutter是一款基于AI的智能图像处理工具,支持文字指令和框选操作,实现高精度图像分割。它能够自动识别并抠出图像中的特定对象,尤其擅长处理复杂背景和细节丰富的图像。其主要功能包括智能抠图、背景移除和高精度图像分割,广泛应用于电商展示、设计创作、影视后期及个人照片编辑等领域。

Dream

Dream-7B是由香港大学与华为诺亚方舟实验室联合开发的开源扩散模型,支持文本、数学和代码生成,具备双向上下文建模能力和灵活的生成控制。其在通用任务、数学推理和编程方面表现优异,适用于文本创作、数学求解、编程辅助及复杂任务规划等多种场景,提供高效且高质量的生成服务。

ShowMeAI

ShowMeAI知识社区是一个资源丰富、易于访问的平台,适合所有希望深入了解和掌握人工智能技术的人士。

OmniParse

OmniParse是一款开源数据解析平台,支持多种文件类型的非结构化数据转换为结构化格式,包括文档、图像、视频、音频及网页内容。其核心功能涵盖表格提取、图像字幕生成、音视频转录以及网页内容结构化处理,利用自然语言处理、光学字符识别及深度学习技术提升解析效率与准确性。OmniParse完全在本地运行,确保数据隐私与安全,广泛应用于文档自动化处理、客户服务、市场研究、法律合规及医疗记录管理等领域。

Kolors Virtual Try

Kolors Virtual Try-On 是一款基于深度学习技术的 AI 虚拟换衣工具,能够分析用户上传的照片并智能适配服装,生成逼真的试穿效果。主要功能包括 AI 虚拟换衣、自动适配光线和阴影、支持多种服装和风格、快速生成效果图以及个性化试穿体验。该工具适用于在线购物、时尚搭配、内容创作和电商营销等多种应用场景。