深度学习

SVFR

SVFR是一款由腾讯优图实验室与厦门大学联合开发的视频人脸修复框架,能够统一处理视频中的人脸修复、着色和缺失区域补全任务。基于Stable Video Diffusion模型,结合任务嵌入、统一潜在正则化等技术,提升修复精度与时间稳定性。适用于影视后期、网络视频制作及数字档案修复等领域,具有广泛的应用价值。

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架,用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体,支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式,适用于不同复杂度任务,如日程安排、数学证明、自动驾驶等。具有模型不可知性,可与多种大语言模型结合,具备良好的可扩展性和灵活性。

AiNiee

AiNiee是一款基于AI技术的多功能翻译工具,支持多种文件格式和语言的自动翻译,包括游戏文件、小说、字幕等。它通过接入主流AI平台,提供高效的多语言翻译服务,支持自定义参数设置和批量翻译功能,确保翻译结果的准确性和流畅性,广泛应用于游戏本地化、字幕制作、电子书阅读等多个领域。

理想同学网页版

理想同学网页版是一款由理想汽车推出的AI智能助手,集成DeepSeek R1/V3 671B满血版模型,支持多模型切换、联网搜索、图像识别等功能。用户可通过文字、长文本或图片进行交互,支持360°视觉追踪,提升交互体验。适用于办公、学习、多设备协同等场景,支持网页与移动端同步,打造无缝智能服务生态。

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。

DeepFloyd

DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习。

疯语咒AI

疯语咒AI是AI技术和教育的先行者,提供海量免费的AI学习材料。

ProtGPS

ProtGPS是一款由MIT与怀特黑德生物医学研究所开发的深度学习模型,用于预测蛋白质在细胞内的亚细胞定位。它基于Transformer架构,能准确识别蛋白质在12种不同亚细胞区域的分布,并支持设计特定定位的蛋白质序列。该工具还可分析致病突变对蛋白质定位的影响,为疾病机制研究、蛋白质工程和药物开发提供新思路。

Object Cutter

Object Cutter是一款基于AI的智能图像处理工具,支持文字指令和框选操作,实现高精度图像分割。它能够自动识别并抠出图像中的特定对象,尤其擅长处理复杂背景和细节丰富的图像。其主要功能包括智能抠图、背景移除和高精度图像分割,广泛应用于电商展示、设计创作、影视后期及个人照片编辑等领域。