医疗

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。

明犀AI

明犀AI是一款基于大模型技术的图像增强工具,能够通过文本提示引导实现图像修复与优化,有效提升图像清晰度、细节表现和整体质感。其功能包括图像清晰度增强、细节优化、老照片修复等,适用于摄影、设计、印刷、文化遗产保护及医疗影像等多个领域。用户可通过网站注册后上传图片并进行处理,支持不同分辨率输出,满足多样化的图像处理需求。

Google Beam

Google Beam是谷歌推出的AI驱动的3D视频通信平台,能够将2D视频流转换为逼真的3D效果,提升远程通话的自然度和直观性。用户可实现眼神交流和细微表情识别,增强沟通效果。支持实时语音翻译,打破语言障碍,并基于Google Cloud提供企业级可靠性,适用于远程协作、教育、医疗、国际合作和个人社交等多种场景。

SleepFM

SleepFM是一款由斯坦福大学开发的开源多模态睡眠分析模型,利用脑电图(EEG)、心电图(ECG)和呼吸信号等数据,实现睡眠阶段分类、睡眠呼吸障碍检测及人口统计属性预测等功能。它通过对比学习技术和自监督预训练方法提升分析精度,并支持临床诊断、药物开发、健康管理等多个应用场景,为睡眠医学研究提供重要工具。

万木健康

万木健康,AIGC超写实医生数字人运营商。

Yescribe.ai

一款AI驱动的转录服务,Yescribe.ai能够将音频和视频文件准确快速地转换为文本。支持98种语言、多种格式,并确保各行业的安全转录。

OmniAI

OmniAI是一款基于OCR与NLP技术的智能文档处理平台,支持多种文件格式的数据提取与分类。其核心功能包括批量处理、结构化数据输出以及自定义模型开发,适用于财务审计、客户服务、法律合规、医疗健康及保险理赔等多个领域,为企业提供高效的文档智能化解决方案。

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型,能够处理音频、图像、视频和文本等多种输入,并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色,具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练,结合高质量音频数据提升性能,并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

智谱CoCo

智谱CoCo是智谱AICO平台推出的首个企业级超级助手Agent,具备交付导向、记忆机制和无缝嵌入三大特性。它能全流程辅助工作,根据员工职能和需求主动服务,无缝接入企业资源,提供个性化服务。支持多种对话方式,包括快思考、慢思考和页面唤起,适用于政务、企业、个人助理、教育与培训、金融与医疗等多个场景,提升工作效率和用户体验。

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型,具备结构化推理和透明性,支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试,涵盖4000多个推理步骤,用于全面评估推理能力。其性能优于多个开源模型,适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景,具有高准确性和可解释性。