模型

WiseDiag

WiseDiag是杭州智诊科技开发的医疗AI模型,基于海量医学数据训练,具备深度推理能力和个性化服务功能。支持多场景健康咨询,包括医学报告解读、长期健康记录管理及专家级建议。提供多种版本以适应不同需求,适用于健康管理、医疗辅助和远程医疗等应用。

Fabrie AI

Fabrie AI,设计师的在线设计协作平台 ,基于Fabrie白板构建的AI驱动的设计工具。它可以帮助工业设计师、时装设计师和室内设计师在几秒钟内快速生成带有草图的逼真渲染。

iDP3

iDP3是一种基于自我中心3D视觉表征的改进型人形机器人运动策略,由斯坦福大学等机构联合开发。它摒弃了对精确相机校准和点云分割的需求,具备出色的视图、对象及场景泛化能力,可高效适应未知环境。此外,其优化的视觉编码器和扩散模型进一步提高了学习和推理性能,在家庭、工业、医疗、搜救及教育等领域具有广泛应用潜力。

ModelEngine

ModelEngine 是华为开源的全流程 AI 开发工具链,涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理,提供低代码编排和 RAG 框架,适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。

Bard PDF

一个用于汇总和分析 PDF 文档的终极 AI 驱动工具,AI Bard PDF允许用户通过自然对话上传PDF文档并与之交互。

OmniAI

OmniAI是一款基于OCR与NLP技术的智能文档处理平台,支持多种文件格式的数据提取与分类。其核心功能包括批量处理、结构化数据输出以及自定义模型开发,适用于财务审计、客户服务、法律合规、医疗健康及保险理赔等多个领域,为企业提供高效的文档智能化解决方案。

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架,通过高质量提示构建、偏好采样和分布加权机制,提升图像质量和与人类偏好的对齐度,减少训练崩溃风险。它具备自演化能力,降低对大规模数据的依赖,广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

BAGEL

BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,采用混合变换器专家架构(MoT),通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异,生成质量接近SD3,并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

FigureToCartoon

FigureToCartoon是一个可以将您喜爱的照片即时转换为漫画、3D、素描、艺术或自由手绘风格卡通图片的在线工具。

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。