AI项目与工具

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架，通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间，使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本，提升视觉生成与理解性能，并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用，适用于创意设计、内容创作及智能交互等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 590 浏览

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型，结合多模态大语言模型与扩散模型，支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 590 浏览

Qwen2vl

Qwen2VL-Flux 是一款基于多模态图像生成的模型，结合了 Qwen2VL 和 FLUX 技术。它支持多种生成模式，包括变体生成、图像到图像转换、智能修复和 ControlNet 引导生成，并具备深度估计和线条检测功能。该模型提供灵活的注意力机制和高分辨率输出，适用于艺术创作、内容营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 590 浏览

JanusFlow

JanusFlow是一款集成了自回归语言模型与校正流技术的多模态AI模型，能够在单一框架内高效完成图像理解和生成任务。它通过解耦视觉编码器和表示对齐策略，显著提升了模型在视觉理解与图像生成上的表现，广泛应用于图像生成、多模态内容创作、视觉问答、图像理解和辅助设计等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 590 浏览

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 590 浏览

Quik

Quik是一款由GoPro推出的视频编辑工具，支持自动选取视频亮点、音乐同步及多风格主题应用。用户可通过手动编辑调整视频速度、添加滤镜和文字，同时享受丰富的音乐资源库和云存储功能，适用于户外运动、家庭聚会、旅行记录等多种场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 590 浏览

aoGen

aoGen 是一款面向电商行业的 AI 图像生成工具，可快速生成多种风格的虚拟模特并实现服装适配，提供虚拟试衣功能以提升购物体验。其图像增强与编辑功能包括智能修复和物体移除，还可将静态图片转为动态视频，支持多场景应用，有效降低拍摄成本并提升视觉吸引力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 590 浏览

MewX AI

MewX AI是一款集文生图、图生图、艺术二维码生成及室内设计于一体的生成式AI平台，支持多种风格的艺术创作与设计任务。主要功能包括MX绘画、MX Cute、MJ绘画、边缘检测和室内设计，广泛应用于艺术创作、平面设计、插画制作等领域。用户可以通过简洁的操作流程快速生成高质量图像，并灵活调整参数以满足个性化需求。

AI项目与工具 2025年06月12日 52 点赞 0 评论 590 浏览

Pixcap

Pixcap 是一款基于AI技术的3D设计工具，允许用户通过选择和混合10,000多个3D元素，快速生成个性化设计。平台提供强大的AI生成功能、动画制作能力以及广泛的文件格式兼容性，适用于网页设计、动画制作、品牌推广等多个领域，助力提升视觉效果与用户体验。 ---

AI项目与工具 2025年06月12日 43 点赞 0 评论 591 浏览

Qwen2

Qwen2是由阿里云通义千问团队开发的大型语言模型系列，涵盖从0.5B到72B的不同规模版本。该系列模型在自然语言理解、代码编写、数学解题及多语言处理方面表现出色，尤其在Qwen2-72B模型上，其性能已超过Meta的Llama-3-70B。Qwen2支持最长128K tokens的上下文长度，并已在Hugging Face和ModelScope平台上开源。 ---

AI项目与工具 2024年01月01日 48 点赞 0 评论 591 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间