深度学习 - 智狐AI导航

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架，能够将任意角色图像与目标场景结合，生成高质量视频。它采用两阶段训练策略，确保角色细节的高保真保留，并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型，具备良好的泛化能力，适用于影视制作、艺术创作、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 494 浏览

CineMaster

CineMaster是快手推出的3D感知视频生成框架，支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术，结合语义布局控制网络与摄像机适配器，提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 817 浏览

AuraFusion360

AuraFusion360是一款面向360°无边界场景修复的AI工具，采用高斯散射表示和深度感知技术，实现高质量的物体移除与孔洞填充。其核心包括自适应引导深度扩散（AGDD）和基于SDEdit的细节增强，确保多视角一致性。适用于虚拟现实、建筑可视化、影视特效及文物修复等多个领域，提供高效、精确的场景修复解决方案。

AI项目与工具 2025年06月12日 57 点赞 0 评论 770 浏览

UltraMem

UltraMem是字节跳动推出的超稀疏模型架构，通过优化内存访问和计算效率，显著降低推理成本并提升速度。其核心技术包括多层结构改进、TDQKR和IVE，使模型在保持性能的同时具备更强的扩展性。适用于实时推理、大规模模型部署及多个行业场景。

AI项目与工具 2025年06月12日 11 点赞 0 评论 619 浏览

ProtGPS

ProtGPS是一款由MIT与怀特黑德生物医学研究所开发的深度学习模型，用于预测蛋白质在细胞内的亚细胞定位。它基于Transformer架构，能准确识别蛋白质在12种不同亚细胞区域的分布，并支持设计特定定位的蛋白质序列。该工具还可分析致病突变对蛋白质定位的影响，为疾病机制研究、蛋白质工程和药物开发提供新思路。

AI项目与工具 2025年06月12日 60 点赞 0 评论 581 浏览

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架，基于扩散变换器（DiT）实现姿态引导的视频生成。它支持长序列、多分辨率视频生成，并通过关键点扩散变换器（Keypoint-DiT）确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征，结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

AI项目与工具 2025年06月12日 41 点赞 0 评论 642 浏览

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型，具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务，适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

AI项目与工具 2025年06月12日 50 点赞 0 评论 930 浏览

Goku

Goku是由香港大学与字节跳动联合开发的AI视频生成模型，支持文本到图像、文本到视频、图像到视频等多种生成方式。其核心优势在于高质量的视频输出、低制作成本及多模态生成能力。Goku+作为扩展版本，专注于广告视频创作，具备稳定的动作表现和丰富的表情交互。模型基于大规模数据集和先进架构，适用于广告、教育、娱乐等多个领域，提升了内容创作效率与质量。

AI项目与工具 2025年02月11日 29 点赞 0 评论 861 浏览

VisoMaster

VisoMaster 是一款基于 AI 的面部编辑与换脸工具，支持图片、视频及直播场景，能生成自然逼真的换脸效果。采用 GPU 加速与自定义模型功能，适用于影视、广告、视频创作等领域。核心技术包括深度学习与 GANs，实现高精度面部特征提取与图像合成，支持实时预览与参数调整，提升用户体验与效率。

AI项目与工具 2025年06月12日 82 点赞 0 评论 843 浏览

LLMDet

LLMDet是一款基于大型语言模型协同训练的开放词汇目标检测器，能够识别训练阶段未见过的目标类别。其通过结合图像和文本信息，实现高精度的零样本检测，并支持图像描述生成与多模态任务优化，适用于多种实际应用场景。

AI项目与工具 2025年06月12日 68 点赞 0 评论 537 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期