Stable Video 3D (SV3D) Stable Video 3D(SV3D)是一款由Stability AI公司开发的多视角合成和3D生成模型,能够从单张图片生成一致的多视角图像,并进一步优化生成高质量的3D网格模型。该模型在视频扩散模型基础上进行改进,提供更好的质量和多视角体验。主要功能包括多视角视频生成、3D网格创建、轨道视频生成、相机路径控制以及新视角合成。SV3D在新视角合成方面取得显著进展,能够生成逼真且一致的视图,提升 AI项目与工具 2024年01月01日 39 点赞 0 评论 585 浏览
ChatMCP ChatMCP是一款基于模型上下文协议(MCP)的AI聊天客户端,支持与多种大型语言模型(LLM)交互。它提供自动化安装MCP服务器、SSE传输支持、自动选择服务器及聊天记录管理等功能,并通过MCP服务器市场实现与不同数据源的聊天。用户可配置LLM API密钥和端点,界面友好且功能强大,适用于客户服务、个人助理、教育学习、企业内部沟通及信息检索等多种场景。 AI项目与工具 2025年06月12日 48 点赞 0 评论 586 浏览
WeGen WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型,结合多模态大语言模型与扩散模型,支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力,适用于创意设计、内容创作等多个领域。 AI项目与工具 2025年06月12日 79 点赞 0 评论 587 浏览
H H-Optimus-0是由法国公司Bioptimus推出的全球最大的开源病理学AI基础模型,拥有11亿参数,基于超过50万张组织病理学切片训练,涵盖多种人体组织。该模型在癌症识别、基因异常检测、组织分类及生存分析等方面表现优异,具备强大的特征提取能力。作为开源工具,H-Optimus-0可促进病理研究与临床应用的协同创新。 AI项目与工具 2025年06月12日 75 点赞 0 评论 587 浏览
OpenVision OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。 AI项目与工具 2025年06月11日 58 点赞 0 评论 587 浏览
SwiftBrush V2 SwiftBrush V2 是一款基于文本到图像的单步扩散模型,通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术,实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练,显著提升了生成速度和图像质量,广泛应用于艺术创作、游戏开发、虚拟现实等领域。 AI项目与工具 2025年06月12日 21 点赞 0 评论 588 浏览
SmolDocling SmolDocling-256M-preview 是一款轻量级多模态文档处理模型,能将图像文档高效转换为结构化文本,支持文本、公式、图表等多种元素识别。模型参数量仅256M,推理速度快,适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能,并兼容Docling,适用于文档数字化、科学研究及移动环境应用。 AI项目与工具 2025年03月22日 98 点赞 0 评论 588 浏览