学习

PGTFormer

PGTFormer是一款先进的视频人脸修复框架,通过解析引导的时间一致性变换器恢复视频中的高保真细节,同时增强时间连贯性。该方法无需预对齐,通过语义解析选择最佳人脸先验,并结合时空Transformer模块和时序保真度调节器,实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

OmniCorpus

OmniCorpus是上海人工智能实验室联合多家知名高校和研究机构共同创建的一个大规模多模态数据集,包含86亿张图像和16960亿个文本标记,支持中英双语。它通过整合来自网站和视频平台的文本和视觉内容,提供了丰富的数据多样性。OmniCorpus不仅规模庞大,而且数据质量高,适合多模态机器学习模型的训练和研究。它广泛应用于图像识别、视觉问答、图像描述生成和内容推荐系统等领域。

ZeroSearch

ZeroSearch 是阿里巴巴通义实验室开发的基于大模型的搜索引擎框架,通过强化学习技术提升搜索能力,无需依赖真实搜索引擎。它能动态生成相关或噪声文档,显著降低训练成本(超80%),并支持多种模型和算法,适用于问答、内容创作、教育等多个场景。

OurTeacher

一款面向教师的一站式AI教学辅助网站,适用于幼儿园到大学的各个教育阶段,它通过智能技术帮助教师在备课、教学、作业批改和学生管理等方面提升效率和质量。

Pollinations.AI

Pollinations.AI是一个开源AI内容生成平台,提供图像生成、文本生成、音频转换及视觉分析等功能。用户无需注册即可使用,支持多种模型和参数配置,适合开发者和创作者快速集成与应用。平台还提供浏览器开发环境,简化了使用流程,提升了效率。

OpenThinker

OpenThinker-32B 是一款由多所高校联合开发的开源推理模型,拥有 328 亿参数和 16,000 token 上下文支持,以高效的数据利用和严格的质量控制著称。模型基于少量数据实现优异性能,适用于数学、科学、代码生成等多种推理任务。全面开源,提供模型权重、代码和数据集,支持研究与开发扩展。

华藏通用大模型

华藏通用大模型是一个多功能的人工智能平台,它通过集成先进的算法和大量数据训练,为用户提供了一个强大的工具,以支持各种应用场景,从客户服务到专业咨询,再到数据分析和自动...

BEN2

BEN2是一款由Prama LLC开发的深度学习图像和视频处理工具,专注于高效、精准的背景移除与前景分割。采用置信度引导抠图技术,可处理复杂细节,如头发和边缘,确保高精度分割。支持4K图像处理,具备GPU加速功能,适用于图像编辑、视频剪辑及批量处理等多种应用场景。

SumBuddy

一款浏览器AI阅读助手,能快速总结网页内容并基于此进行对话。你还可以使用自己的AI模型,打造真正属于你的浏览器AI助手。

DeepEP

DeepEP 是 DeepSeek 开发的开源 EP 通信库,专为混合专家模型(MoE)的训练和推理设计。它提供高吞吐、低延迟的 GPU 内核,支持 NVLink 和 RDMA 通信,优化了组限制门控算法,兼容 FP8 等低精度数据格式。适用于大规模模型训练、推理解码及高性能计算场景,具有良好的系统兼容性和网络优化能力。