框架 - 智狐AI导航

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架，通过高质量提示构建、偏好采样和分布加权机制，提升图像质量和与人类偏好的对齐度，减少训练崩溃风险。它具备自演化能力，降低对大规模数据的依赖，广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 552 浏览

书生·筑梦2.0

它不仅提供了更大的创作灵活性，还通过高质量的视频输出满足了用户对画质和帧率的高需求。Vchitect 2.0及其配套的VEnhancer框架，为视频内容创作者提供了强大的工具，以创造更加生...

Ai平台模型 2026年06月21日 0 点赞 0 评论 549 浏览

Deck of Brilliance

帮助创意专业人士产生点子

剧本文案 2025年06月05日 81 点赞 0 评论 544 浏览

Cooragent

Cooragent是清华大学LeapLab团队推出的开源AI Agent协作框架，支持通过自然语言快速创建Agent并实现多Agent协同。采用Prompt-Free设计，无需手动编写Prompt，系统自动优化功能。支持本地部署，保障数据安全，兼容Langchain工具链和MCP协议，提供全面API支持，适用于旅行规划、股票分析、文档处理等多种场景。

AI项目与工具 2025年06月11日 29 点赞 0 评论 542 浏览

HaiSnap

一个适合小白用户快速开发简单应用的零代码开发平台。用户只需描述需求，即可生成应用并直接通过网页访问，无需部署。

Ai编程建站 2025年06月05日 10 点赞 0 评论 539 浏览

VARGPT

VARGPT是一款多模态大语言模型，整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制，支持文本与图像的混合输入和输出，具备高效的视觉生成能力。模型采用三阶段训练策略，提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 531 浏览

ShotAdapter

ShotAdapter是一款由Adobe与UIUC联合开发的文本到多镜头视频生成框架，通过过渡标记和局部注意力掩码策略，实现角色身份一致性和镜头内容精准控制。支持用户通过文本提示调节镜头数量、时长和背景，适用于影视、广告、教育、游戏等领域，具备高效、灵活和可扩展的技术特点。

AI项目与工具 2025年06月11日 73 点赞 0 评论 531 浏览

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架，支持多模态输入（如图片、文字、视频等）生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化，具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景，有效降低音乐创作门槛，提升创作效率与个性化体验。

AI项目与工具 2025年06月12日 77 点赞 0 评论 530 浏览

FlagevalMM

FlagEvalMM是一个由北京智源人工智能研究院开发的开源多模态模型评测框架，专注于评估处理文本、图像、视频等多模态任务的模型性能。它支持多种任务和指标，采用解耦评测与推理的设计，提供统一的评测流程，集成丰富模型库并兼容多种后端引擎。该工具适用于学术研究、工业应用、模型开发、教育领域及内容创作等多个场景。

AI项目与工具 2025年06月12日 89 点赞 0 评论 529 浏览

II

II-Agent 是一个开源的 Agent 框架，通过与大型语言模型（LLM）交互，简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口，适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。

AI项目与工具 2025年06月11日 67 点赞 0 评论 527 浏览

框架

首页

框架

列表

默认

浏览次数

发布日期