DeepSeek Janus-Pro-7B 多模态大模型医疗影像应用测试

2025 年 1 月 27 日，DeepSeek 发布了多模态模型 Janus-Pro-7B。该模型在图像生成和多模态理解方面表现优异，甚至在部分指标上超越了 OpenAI 的 DALL-E 3。鉴于其强大的视觉理解能力，本文旨在测试该通用模型对专业医学影像的理解可行性，通过五种常见医学影像进行验证。

一、背景与模型概述

Janus-Pro-7B 作为新一代多模态大模型，采用了统一的架构处理文本和图像输入。其核心优势在于能够同时理解复杂的视觉场景和生成相应的自然语言描述。在医疗领域，这种能力理论上可以辅助医生快速识别影像中的异常区域，提供初步的参考意见，特别是在医疗资源匮乏的地区，可能成为有价值的辅助工具。

然而，通用大模型并未针对医疗数据进行专门微调，因此其在诊断准确性、解剖结构细节识别以及病理特征判断上可能存在局限性。本次测试旨在客观评估其当前水平，明确适用边界。

二、测试案例与分析

1. CT 图测试

测试目的：评估模型对腹部 CT 影像中肿块及钙化的识别能力。

参考标准：肾细胞癌（RCC），肾实质内单发肿块，少数为多发，呈类圆形或分叶状，常造成局部肾轮廓外突。肿瘤较大者可出现囊变出血和坏死，造成密度不均。10%～20% 肿块内可见点状或弧线状钙化。

模型输出分析：

这张 MRI 图显示了两个脑部切片，分别标记为 A 和 B。以下是对这些切片中可能反映的症状和异常的详细分析：

### 切片 A
1. **箭头标记的区域**：
   - 箭头指向的区域似乎是大脑的灰质部分，可能是大脑皮层。
   - 箭头指向的区域显示了某种异常，可能是病变、损伤或异常信号。
   - 箭头指向的区域可能与某些脑部疾病或损伤有关，例如中风、肿瘤或炎症。

2. **灰质和白质**：
   - 灰质和白质之间的界限清晰，表明切片质量较好。
   - 灰质部分显示了正常的脑组织结构，但箭头标记的区域可能存在异常。

(注：此处原文本存在上下文错位，实际测试中模型成功识别出右侧肾脏肿大异常)

简单评价：Janus-Pro-7B 能识别出是右侧肾脏有肿大异常，但在具体病理性质（如 RCC）的判断上缺乏精确度。

CT 影像测试结果

2. 心电图 (ECG) 测试

测试目的：评估模型对心脏电信号波形变化的敏感度。

参考标准：男性患者，54 岁，胸闷 1h 就诊，心电图示 V2-V4 导联 T 波高尖，提示急性心梗（AMI）超急性期改变。T 波高尖可见于正常人、高钾血症等临床情况，发现心电图 T 波高尖时如有缺血性胸痛应注意是否为 AMI 超急性期改变。

模型输出分析：

未能识别出明显的急性心梗特征，未提示任何危急值。

简单评价：模型未能看出任何问题。心电图对时序性和微小波形变化极其敏感，通用视觉模型在此类任务上表现较弱，无法替代专业心电分析系统。

心电图测试结果

3. 核磁共振（MRI）图测试

测试目的：评估模型对脑部复杂结构的解析能力。

参考标准：21 岁难治性癫痫伴结节性硬化症女性患者；A：FLAIR 可见高信号皮质结节伴条带状异常信号，从皮质延伸至侧脑室；B：FLAIR 可见多发高信号室管膜下结节。

模型输出分析：

DeepSeek Janus-Pro-7B 多模态大模型医疗影像应用测试