AI项目与工具

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 588 浏览

EzAudio

EzAudio是一款基于文本到音频（Text-to-Audio, T2A）生成模型，通过优化的扩散变换器架构和高效的数据训练策略，实现了快速生成高质量音频的功能。它支持多种应用场景，如音乐创作、影视后期制作、语音合成等，并具备高保真度和低资源消耗的特点。

AI项目与工具 2025年06月12日 73 点赞 0 评论 588 浏览

ChatMCP

ChatMCP是一款基于模型上下文协议（MCP）的AI聊天客户端，支持与多种大型语言模型（LLM）交互。它提供自动化安装MCP服务器、SSE传输支持、自动选择服务器及聊天记录管理等功能，并通过MCP服务器市场实现与不同数据源的聊天。用户可配置LLM API密钥和端点，界面友好且功能强大，适用于客户服务、个人助理、教育学习、企业内部沟通及信息检索等多种场景。

AI项目与工具 2025年06月12日 48 点赞 0 评论 588 浏览

豆包AI编程

豆包AI编程是一款基于AI技术的编程辅助工具，支持一键上传代码、实时接入GitHub项目，并提供沉浸式代码阅读和精准提问功能。它能生成、解释、修复和优化代码，提升编程效率与理解力，适用于学习、开发、代码审查及团队协作等场景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 588 浏览

muzaic

Muzaic是一款AI驱动的在线音乐生成工具，专注于为视频制作者和内容创作者提供高效、高质量的音乐解决方案。其核心功能包括基于AI的快速音乐生成、定制化参数调整、实时同步以及录音室级别的音质输出。Muzaic支持多种应用场景，如社交媒体内容、个性化广告、播客、游戏音效及企业视频配乐，帮助用户轻松实现音乐与视频内容的无缝结合。

AI项目与工具 2025年06月12日 99 点赞 0 评论 588 浏览

PromptBase

PromptBase是一个在线平台，专注于AI提示词的交易与应用。用户可以浏览并购买由专业AI创作者制作的提示词，涵盖多种AI模型及应用场景；同时，用户也可上传自己的提示词成为卖家，或利用这些提示构建AI应用程序。PromptBase支持内容生成、艺术创作、社交媒体营销、游戏开发等多个领域，为AI技术的普及与创新提供了有力支持。

AI项目与工具 2025年06月12日 58 点赞 0 评论 588 浏览

CSM

CSM是一款基于人工智能的3D建模平台，能够将2D图像、文本描述或手绘草图快速转换为高质量的3D模型。其主要功能包括图像到三维、文本到三维、草图到三维以及实时建模等，并支持动画和纹理编辑。CSM适用于游戏开发、影视制作、产品设计及建筑设计等多个行业，助力创意工作者高效完成从概念到原型的创作流程。

AI项目与工具 2025年06月12日 55 点赞 0 评论 587 浏览

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架，由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导，提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态，提供高分辨率基准数据集HR-VVT，适用于在线购物、时尚设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 60 点赞 0 评论 587 浏览