深度学习 - 智狐AI导航

Finedefics

Finedefics是由北京大学彭宇新教授团队开发的细粒度多模态大模型，专注于提升多模态大语言模型在细粒度视觉识别任务中的表现。该模型通过引入对象的细粒度属性描述，结合对比学习方法，实现视觉对象与类别名称的精准对齐。在多个权威数据集上表现出色，准确率达76.84%。其应用场景涵盖生物多样性监测、智能交通、零售管理及工业检测等领域。

AI项目与工具 2025年06月12日 10 点赞 0 评论 806 浏览

ImageRAG

ImageRAG 是一种基于检索增强生成（RAG）技术的图像生成工具，通过动态检索相关图像提升文本到图像模型的生成能力。它能够增强对罕见概念的理解与生成，提升图像的真实度和相关性，支持多模态生成与个性化定制。无需额外训练即可适配多种 T2I 模型，广泛应用于创意设计、品牌推广、教育及影视等领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 692 浏览

WiseDiag

WiseDiag是杭州智诊科技开发的医疗AI模型，基于海量医学数据训练，具备深度推理能力和个性化服务功能。支持多场景健康咨询，包括医学报告解读、长期健康记录管理及专家级建议。提供多种版本以适应不同需求，适用于健康管理、医疗辅助和远程医疗等应用。

AI项目与工具 2025年06月12日 55 点赞 0 评论 535 浏览

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架，能够将任意角色图像与目标场景结合，生成高质量视频。它采用两阶段训练策略，确保角色细节的高保真保留，并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型，具备良好的泛化能力，适用于影视制作、艺术创作、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 494 浏览

CineMaster

CineMaster是快手推出的3D感知视频生成框架，支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术，结合语义布局控制网络与摄像机适配器，提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 815 浏览

AuraFusion360

AuraFusion360是一款面向360°无边界场景修复的AI工具，采用高斯散射表示和深度感知技术，实现高质量的物体移除与孔洞填充。其核心包括自适应引导深度扩散（AGDD）和基于SDEdit的细节增强，确保多视角一致性。适用于虚拟现实、建筑可视化、影视特效及文物修复等多个领域，提供高效、精确的场景修复解决方案。

AI项目与工具 2025年06月12日 57 点赞 0 评论 770 浏览

UltraMem

UltraMem是字节跳动推出的超稀疏模型架构，通过优化内存访问和计算效率，显著降低推理成本并提升速度。其核心技术包括多层结构改进、TDQKR和IVE，使模型在保持性能的同时具备更强的扩展性。适用于实时推理、大规模模型部署及多个行业场景。

AI项目与工具 2025年06月12日 11 点赞 0 评论 618 浏览

ProtGPS

ProtGPS是一款由MIT与怀特黑德生物医学研究所开发的深度学习模型，用于预测蛋白质在细胞内的亚细胞定位。它基于Transformer架构，能准确识别蛋白质在12种不同亚细胞区域的分布，并支持设计特定定位的蛋白质序列。该工具还可分析致病突变对蛋白质定位的影响，为疾病机制研究、蛋白质工程和药物开发提供新思路。

AI项目与工具 2025年06月12日 60 点赞 0 评论 580 浏览

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架，基于扩散变换器（DiT）实现姿态引导的视频生成。它支持长序列、多分辨率视频生成，并通过关键点扩散变换器（Keypoint-DiT）确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征，结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

AI项目与工具 2025年06月12日 41 点赞 0 评论 640 浏览

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型，具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务，适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

AI项目与工具 2025年06月12日 50 点赞 0 评论 929 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期