模型 - 智狐AI导航

In

In-Context LoRA是一种基于扩散变换器（DiTs）的图像生成框架，通过微调少量数据实现多样化图像生成任务。它无需修改原始模型结构，减少了对大规模标注数据的依赖，同时保持了高质量的生成效果。该工具支持多任务图像生成、上下文学习能力、任务无关性以及条件图像生成等功能，适用于故事板生成、字体设计、家居装饰等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 836 浏览

Neural4D

Neural4D是一款由DreamTech团队开发的AI驱动型3D模型生成平台，利用Direct3D-5B大模型实现从文字或图片到高精度3D模型的自动化生成。其主要功能包括文本生成3D、图片生成3D、CuteMe Q版化身转换以及高精度模型输出。平台支持多种应用场景，如游戏开发、动画制作、虚拟现实设计、产品可视化及3D打印等，推动了3D内容创作领域的快速发展。

AI项目与工具 2025年06月12日 90 点赞 0 评论 836 浏览

LightLab

LightLab是一款基于扩散模型的图像光源控制工具，支持对图像中的光源强度、颜色、环境光以及虚拟光源进行精细调整。通过结合真实照片与合成图像训练，该工具能生成逼真的光照效果，如阴影和反射。其交互式界面使用户能够直观地进行光照编辑，适用于摄影后期、影视特效、室内设计、游戏开发和广告制作等多个领域。

AI项目与工具 2025年06月11日 34 点赞 0 评论 836 浏览

VideoAgent

VideoAgent是一款基于自改进机制的视频生成系统，结合图像观察与语言指令生成机器人控制视频计划。它采用自我条件一致性方法优化视频质量，通过预训练视觉-语言模型反馈和实际执行数据的收集，持续提升生成效果，减少幻觉内容并提高任务成功率。VideoAgent在模拟环境中有优异表现，并已应用于机器人控制、模拟训练、教育研究、游戏开发以及电影制作等领域，展现出广泛的应用潜力。

AI项目与工具 2025年06月12日 66 点赞 0 评论 836 浏览

飞桨AI Studio

百度飞桨人工智能学习实训社区

Ai编程建站 2026年06月22日 0 点赞 0 评论 836 浏览

ChatLaw

ChatLaw是一款针对中文法律领域的大型语言模型，它通过定制化的设计和智能分析功能，为法律专业人士提供了一个强大的工具。

Ai平台模型 2026年06月22日 0 点赞 0 评论 837 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 837 浏览

CogView3

CogView3是一款基于中继扩散技术的开源AI图像生成模型，由清华大学与智谱AI联合研发。它通过分阶段生成图像，从低分辨率逐步提升至高分辨率，提高了生成效率并降低了运行成本。CogView3在生成质量和速度上超越了现有的开源模型SDXL，在保持图像细节的同时大幅减少推理时间。其核心特性包括高性能、多分辨率支持及多种优化技术，适用于艺术创作、数字娱乐、广告营销等多个领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 837 浏览

AgentSquare

AgentSquare是一款由清华大学团队研发的模块化设计工具，专注于在大型语言模型代理的设计空间内实现高效搜索。其核心功能包括模块化设计、模块重组与进化、性能预测及自动化搜索等，通过标准化接口支持模块间无缝集成，广泛应用于客户服务、个人助理、教育、医疗及金融等多个领域，旨在提升智能体性能并降低推理成本。

AI项目与工具 2025年06月12日 39 点赞 0 评论 837 浏览

Motion Prompting

Motion Prompting 是一种利用点轨迹表示的视频生成技术，支持对象控制、相机控制及物理现象模拟等功能。它通过将用户输入转化为详细的运动轨迹，结合预训练的视频扩散模型与控制网络，在保持灵活性的同时提高生成质量。这项技术广泛应用于电影制作、游戏开发、虚拟现实等领域，为用户提供了强大的交互式视频生成工具。 ---

AI项目与工具 2025年06月12日 11 点赞 0 评论 838 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期

In