框架 - 智狐AI导航

UniFluid

UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架，支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入，结合Gemma模型和VAE技术，实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色，具备良好的下游任务迁移能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 689 浏览

scikit

scikit-learnPython机器学习库

Ai编程建站 2026年06月21日 0 点赞 0 评论 681 浏览

Eko

Eko是一款由Fellou AI开发的JavaScript框架，基于自然语言处理技术，支持开发者创建从简单指令到复杂流程的智能代理。它具备跨平台兼容性、任务分解与调度能力，以及高度可干预性，适用于自动化测试、数据采集、系统管理等多种场景。其API设计简洁，文档完善，有助于提升开发效率和任务处理能力。

AI项目与工具 2025年06月12日 28 点赞 0 评论 680 浏览

PyTorch2.0

实现快速、灵活的实验和高效的生产。

Ai编程建站 2026年06月21日 0 点赞 0 评论 679 浏览

iAgents

iAgents是一款由清华大学研发的多AI智能体协作框架，专注于通过个性化AI智能体协助用户完成复杂任务。它利用infoNav推理机制优化信息交换，支持多轮对话与任务解决，同时具备混合记忆机制（清晰记忆与模糊记忆）用于高效信息检索。iAgents广泛应用于会议协调、项目管理、客户服务等领域，显著提升了团队协作效率。

AI项目与工具 2025年06月12日 79 点赞 0 评论 678 浏览

Lightning AI

Lightning AI快速训练、部署...

Ai编程建站 2026年06月21日 0 点赞 0 评论 678 浏览

Phantom

Phantom是由字节跳动研发的视频生成框架，支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术，结合文本和图像提示，实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能，适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练，具备强大的跨模态理解和生成能力。

AI项目与工具 2025年06月12日 72 点赞 0 评论 677 浏览

HunyuanCustom

HunyuanCustom是腾讯混元团队开发的多模态视频生成框架，支持图像、音频、视频和文本等多种输入条件，生成高质量定制化视频。采用文本-图像融合与图像ID增强技术，提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景，具备音频驱动和视频驱动两种生成方式，展现强大可控性与灵活性。

AI项目与工具 2025年06月11日 73 点赞 0 评论 675 浏览

AnyStory

AnyStory是阿里巴巴通义实验室开发的文本到图像生成工具，支持单个或多个主体的高保真图像生成。其核心在于“编码-路由”架构，结合ReferenceNet和CLIP视觉编码器实现主体特征的精准建模与定位。通过解耦路由机制，有效避免多主体混淆，确保图像与文本描述高度一致。适用于创意设计、角色生成、广告制作等多个场景，提供高质量、个性化的图像生成能力。

AI项目与工具 2025年06月12日 42 点赞 0 评论 670 浏览

Airtest

Airtest AI是一个强大的旨在实现跨台的移动应用程序测试的自动化开源框架。它为开发人员提供了一套全面的工具和功能，以简化测试过程并确保其应用程序的可靠性和性能。

Ai编程建站 2025年06月05日 50 点赞 0 评论 667 浏览

框架

首页

框架

列表

默认

浏览次数

发布日期