DICOM 标准详解：文件解析、Java/Python 库与 AI 应用 | 极客日志

编程语言AIjava算法

DICOM 标准详解：文件解析、Java/Python 库与 AI 应用

DICOM 是医学影像存储传输国际标准，包含图像数据与元数据。内容涵盖 DICOM 标准结构、数据字典及文件格式解析方法。介绍 Java 端 dcm4che 与 DCMTK 库的使用示例，以及 Python 端 PyDicom 的读取与处理流程。探讨医疗 AI 领域框架 MONAI 和微软开源模型 MedImageInsight 的应用场景，包括分类预测与嵌入向量生成接口调用，为医学影像数字化处理提供技术参考。

萤火微光发布于 2026/3/16更新于 2026/7/2547 浏览

概述

Digital Imaging and Communications in Medicine，医学数字成像和通信，简称 DICOM，一种用于存储和传输如 X 光、CT、MRI、超声等医学影像数据的国际标准。

主要特点是标准化，确保不同医疗设备和系统间可以相互兼容、共享和解读医学影像。关键特征：

内容丰富：包含图像数据和丰富的元数据。
广泛应用：放射科、心血管科、眼科、牙科等领域。
标准制定：由美国国家电气制造商协会（NEMA）开发。

标准

自从 1985 年首次发布以来，标准已经历多次修订和扩展，以适应不断发展的医学影像技术和需求。

[图片]

当前最新版本为 2026a。

数据字典

DICOM 数据字典，定义 DICOM 文件中使用的上千个数据元素及其属性，分成四类：

DICOM Data Elements
DICOM File Meta Elements
DICOM Directory Structuring Elements
DICOM Dynamic RTP Payload Elements

数据字典格式：

Tag：标签，相当于唯一 ID，由两个十六进制数字组成，分别表示组号和元素号，标准数据元素的组号为偶数，私有数据元素组号为奇数。
Name：名称，描述该元素的含义。
Keyword：关键字，通常是名称的简写形式。
VR：Value Representation，值表示，定义该元素的数据类型，如：UL（Unsigned Long）、CS（Code String）、PN（Person Name）等。
VM：Value Multiplicity，值多重性，表示该元素可以包含多少个值（如单值、多值等）。
说明，Description

部分常见数据元素

标签 (Tag)	名称	VR	VM	说明 (Description)
(0010,0010)	Patient's Name	PN	1	患者姓名
(0010,0020)	Patient ID	LO	1	患者标识
(0008,0060)	Modality	CS	1	检查模态（如 CT、MR、US 等）
(0028,0010)	Rows	US	1	图像的行数
(0028,0011)	Columns	US	1	图像的列数
(0028,0030)	Pixel Spacing	DS	2	像素间距（行间距和列间距，单位为毫米）
(0028,1050)	Window Center	DS	1-n	窗口中心值
(0028,1051)	Window Width	DS	1-n	窗口宽度值
(0028,0008)	Number of Frames

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online

<dependency>
    <groupId>org.dcm4che</groupId>
    <artifactId>dcm4che-core</artifactId>
    <version>5.34.1</version>
    <scope>compile</scope>
</dependency>

private static final Set<String> ALLOWED_FILE_EXT = Sets.newHashSet("dcm", "dicom");
public static String parseDcm(MultipartFile img) {
    String suffix = FileUtil.getSuffix(img.getOriginalFilename());
    if (ALLOWED_FILE_EXT.contains(suffix)) {
        try (DicomInputStream dis = new DicomInputStream(img.getInputStream())) {
            Attributes attr = dis.readDataset(-1, -1);
            String patientId = attr.getString(Tag.PatientID);
            String patientName = attr.getString(Tag.PatientName);
            // logging
        }
    }
}

import org.dcmtk.dcmdata.DcmFileFormat;
import org.dcmtk.dcmdata.DcmObject;
import org.dcmtk.dcmdata.Tag;
import org.dcmtk.dcmdata.TagPath;
import org.dcmtk.dcmdata.VR;

public class DicomParser {
    public static void main(String[] args) {
        String filePath = "/path/to/dicom/file.dcm";
        DcmFileFormat dcmFileFormat = new DcmFileFormat();
        if (dcmFileFormat.loadFile(filePath).good()) {
            // 获取数据集对象
            DcmObject dcmObject = dcmFileFormat.getDataset();
            String patientName = dcmObject.getString(Tag.PatientName);
            String patientID = dcmObject.getString(Tag.PatientID);
            // 获取图像宽度、高度
            int width = dcmObject.getInt(Tag.Columns, 0);
            int height = dcmObject.getInt(Tag.Rows, 0);
            // 获取像素数据类型
            VR pixelDataType = dcmObject.getVR(Tag.PixelData);
        } else {
            log.error("Failed to load DICOM file:{}.", filePath);
        }
    }
}

import matplotlib.pyplot as plt
import pydicom

file_name = '/P202601010001_肝穿刺_HE 染色_20250923_001.dcm'
ds = pydicom.dcmread(file_name)
print(f"{len(ds.file_meta.keys())} + {len(ds.keys())} Tags：")
for key in ds.file_meta.keys():
    print(f"{key}: {ds.file_meta.get(key)}")
for key in ds.keys():
    print(f"{key}: {ds.get(key)}")
print('\n---\n')
print(f"SOP 类..........: {ds.SOPClassUID} ({ds.SOPClassUID.name})")
print(f"患者姓名........: {ds.PatientName.family_comma_given()}")
print(f"检查模态........: {ds.Modality}")
print(f"图像尺寸........: {ds.get(0x00280010).value} x {ds[0x0028,0x0011].value}")
print(f"像素数组维度.....: {ds.pixel_array.ndim}")
print(f"像素数组形状.....: {ds.pixel_array.shape}")
print(f"图像帧数........: {ds.NumberOfFrames}")
print(f"协议名称........: {ds.get('ProtocolName','(缺失)')}")
print(f"检查部位........: {ds.get('BodyPartExamined','(缺失)')}")
print(f"切片位置........: {ds.get('SliceLocation','(缺失)')}")
if ds.pixel_array.ndim == 2:
    plt.imsave('./test.jpg', ds.pixel_array, cmap='gray')
else:
    for i in range(ds.pixel_array.shape[0]):
        png_file = f'./test/test_{i:03d}.jpg'
        plt.imsave(png_file, ds.pixel_array[i,:,:], cmap='gray')

img1=$(base64 -i ultrasound.jpg | tr -d '\n')
img2=$(base64 -i computed-tomography.jpg | tr -d '\n')
img3=$(base64 -i x-ray.jpg | tr -d '\n')
curl -X POST -H "Content-Type: application/json" \
-d "{\"images\": [\"$img1\",\"$img2\",\"$img3\"], \"labels\":[\"X-Ray\",\"Magnetic Resonance Imaging\",\"Computed Tomography\",\"Ultrasound\",\"Dermoscopy\",\"Clinical Photography\",\"Optical Coherence Tomography\"]}" http://localhost:8000/predict

curl -X POST -H "Content-Type: application/json" \
-d "{\"images\": [\"$img1\"], \"texts\":[\"Ultrasound\"]}" http://localhost:8000/encode
curl -X POST -H "Content-Type: application/json" \
-d "{\"texts\":[\"Ultrasound\"]}" http://localhost:8000/encode

DICOM 标准详解：文件解析、Java/Python 库与 AI 应用

概述

标准

数据字典

更多推荐文章

相关免费在线工具

文件

库

dcm4che

DCMTK

PyDicom

AI

MONAI

MedImageInsight

参考

更多推荐文章

相关免费在线工具

DICOM 标准详解：文件解析、Java/Python 库与 AI 应用

概述

标准

数据字典

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

文件

库

dcm4che

DCMTK

PyDicom

AI

MONAI

MedImageInsight

参考

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具