文章

医学影像常见文件格式与查看工具

医学影像常见文件格式与查看工具

医学影像常见文件格式与查看工具

梳理临床与科研中常见的 医学影像文件格式(DICOM、NIfTI、NRRD、WSI 等):中文名称、结构特点、所含信息及常用查看工具。侧重 AI 与数据预处理 视角;非诊疗建议,临床以院内 PACS 规范为准。


目录


一、总览:临床与科研两条线

场景最常见格式一句话
医院 PACS / 设备直连DICOM行业标准,带丰富元数据与层级
AI 训练 / 神经影像科研NIfTI、有时 NRRD / MHA体数据矩阵 + 简单头信息,便于编程
报告、教学、网页展示JPEG / PNG从 DICOM 导出 的「照片」,元数据大量丢失
病理全视野TIFF / 厂商专用格式超大分辨率切片,常配合专用查看器

下文按格式展开;DICOM 单独写细,其余写清与 DICOM 的关系即可。


二、DICOM(医学数字成像与通信标准)

说明
中文名医学数字成像与通信标准文件;口语常叫 DICOM 文件DCM
常见扩展名.dcm、无扩展名、有时 .dicom
文件特点不仅存 像素,还存 患者、检查、序列、设备、窗宽窗位 等成百上千条 标签(Tag);同一检查常 多文件组成序列(如 CT 几百张切片)
谁在用DR/CR 胸片、CT、MRI、超声、PET-CT 等院内影像链路

2.1 逻辑结构

DICOM 用 层级 组织一次检查,便于 PACS 管理:

1
2
3
4
Patient(患者)
  └── Study(一次检查/检查访问,如「2026-06-03 胸部 CT」)
        └── Series(序列,如「平扫」「增强动脉期」「肺窗」)
              └── Instance(单帧实例 = 通常一个 .dcm 文件,CT 的一张切片)

通俗例子

  • Study = 你这次来医院做的「胸部 CT 这一套」;
  • Series = 其中「平扫 1mm」「骨窗」「肺窗」等不同扫描设置;
  • Instance = 某一层的断层图(一个文件)。

2.2 文件里大致包含哪些信息

可分两类:

(1)像素数据

  • 灰度或彩色矩阵;CT 常为 HU 值 的离散存储,显示时需 窗宽窗位(WW/WL) 映射到屏幕。

(2)元数据(DICOM Tag) — 节选常见项:

中文含义典型用途
患者 ID / 姓名(可脱敏)与 HIS 关联
检查日期时间、检查号归档检索
模态 Modality(CT、MR、CR、US…)区分设备类型
序列描述、层厚、间距重建与 AI 预处理
像素间距、切片位置、方向余弦3D 重建、测量、配准
窗宽窗位显示肺窗/纵隔窗
设备厂商、协议名质控与域偏移分析

隐私:DICOM 常含 身份信息;科研与 AI 须 脱敏 后再出库,遵守法规与伦理。

2.3 常用查看工具

工具适用场景备注
RadiAnt、Horos、Weasis、MicroDicomWindows / Mac 上快速阅片轻量、适合初学者看 DICOM
3D Slicer3D 重建、分割、科研功能强,学习曲线略陡
OHIF Viewer浏览器阅片(常接 PACS)偏 Web 集成
ITK-SNAP分割标注常与科研配合
厂商工作站医院正式诊断不对外分发

编程读取pydicom(Python)、DCMTK、SimpleITK 等。

2.4 CT 与 MRI 专节

二者都是 断层影像:不是一张平面投影(如胸片),而是 沿身体一层层「切」出来的很多张图,在院内 几乎一律用 DICOM 存储,层级仍是 Patient → Study → Series → Instance

CT(Computed Tomography,计算机断层扫描)

说明
是什么X 线 绕身体旋转多角度拍摄,计算机 重建 出横断面(及可重建冠状面、矢状面);通俗说 「一层层切片看内脏」
典型用途急诊胸腹、骨折、肺结节、肿瘤分期、出血、钙化等;速度快,对 骨、出血、钙化 敏感
和胸片区别胸片是 2D 投影(结构重叠);CT 是 3D 体(重叠被拆开),一个 Instance = 一层切片

文件组成(一次胸部 CT 举例)

1
2
3
4
Study:2026-06-03 胸部 CT 平扫+增强(一次预约的一次检查)
  ├── Series A:平扫 1mm 薄层(300+ 个 .dcm,每层一个 Instance)
  ├── Series B:增强静脉期(又一串 .dcm)
  └── Series C:有时还有骨窗/肺窗重建序列(或靠软件调窗,不另存)
  • 磁盘上:常见 几百个 .dcm 文件 属于同一 Series,按 Instance Number / 切片位置 排序后叠成 3D 体。
  • 科研/AI:常把一整串 DICOM 转成 NIfTI 一个 .nii.gz,方便 Python 读成一个数组。

CT 特有的关键信息(除通用 DICOM 标签外)

信息含义为何重要
Modality = CT标识为 CT与 MRI 区分
HU(Hounsfield Unit,亨氏单位)像素与 水/空气/骨 相关的物理标度调窗、定量分析、部分 AI 直接用 HU 阈值
层厚、层间距、重建核扫描与重建参数影响分辨率与小病灶检出
kVp、mAsX 线管电压、剂量相关图像噪声、辐射剂量质控
窗宽窗位 WW/WL显示映射肺窗、纵隔窗、骨窗
Rescale Slope/Intercept存储值 → HU 的换算读 DICOM 必查,否则 HU 不对

通俗例子:CT 图像像 一摞切得很薄的面包片;每片一个文件;软件把整摞叠起来就能 旋转看 3D、量结节大小

MRI(Magnetic Resonance Imaging,磁共振成像)

说明
是什么利用 磁场与射频 激发人体组织信号,计算机成像;无电离辐射(有禁忌证,如部分金属植入物)
典型用途脑、脊髓、关节软组织、部分腹部器官、乳腺等;软组织对比 往往优于 CT
和 CT 对比CT 偏 骨、急性出血、钙化、快速筛查;MRI 偏 软组织、神经、关节韧带、部分肿瘤边界

文件组成(一次颅脑 MRI 举例)

1
2
3
4
5
6
Study:颅脑 MRI
  ├── Series 1:T1 加权像(一串 .dcm)
  ├── Series 2:T2 加权像(另一串 .dcm)
  ├── Series 3:FLAIR(又一串)
  ├── Series 4:DWI(扩散加权,常看急性脑梗)
  └── Series 5:可能还有 ADC 图、增强扫描等
  • 一次 MRI 检查 往往 多个 Series,每个 Series 是一种 成像序列/对比度(不是 CT 那种「窗」为主,而是 换脉冲序列)。
  • 每个 Series 内仍是 多张切片 Instance;也有 3D 容积序列(一层很厚的块一次采完再重建)。

MRI 特有的关键信息

信息含义为何重要
Modality = MR标识为磁共振与 CT 区分
Sequence Name / 序列描述如 T1、T2、FLAIR、DWI决定图像对比,读片与 AI 必须知道是哪种序列
TR、TE、Flip Angle 等脉冲序列参数影响对比度与信噪比
磁场强度 B0(如 1.5T、3.0T)设备场强分辨率与信噪比
像素值一般 不是 HU;多为相对信号强度AI 预处理常做 强度归一化,不能照搬 CT 的窗宽窗位逻辑
多通道/多回波部分高级序列读取时要按 Series 分开

通俗例子:同一次头颅检查,MRI 像 同一部位拍了多种「滤镜」的照片(T1、T2、FLAIR…),每种滤镜一个文件夹(Series);而 CT 更像 同一种成像下切了很多层

CT vs MRI:文件层面小结

对比项CTMRI
文件格式院内几乎均为 DICOM同左
一次检查的文件量1~数个 Series × 每层一文件多个 Series(多序列)× 每层一文件
像素物理含义HU,可定量信号强度,序列依赖强
显示习惯窗宽窗位(肺窗/骨窗)按序列类型选片,增强需看造影剂期相
AI 常见处理重采样、调窗或 HU 裁剪、转 NIfTI 体按序列分开训练、强度归一化、注意 域偏移

注意:PET-CT、MRI 增强等会在同一 Study 下再增加 不同 Series;文件结构仍是 DICOM,只是 Series 描述标签 不同。


三、NIfTI(神经影像信息技术倡议格式)

说明
中文名神经影像信息技术倡议格式;常称 NIfTI 文件
常见扩展名.nii.nii.gz(压缩)
文件特点主要为 一个 3D/4D 体数据矩阵 + 较短的头文件信息(仿射矩阵、体素尺寸);一般不携带 DICOM 级完整临床元数据
谁在用脑 MRI/fMRI、部分 AI 竞赛与论文复现;也常把 CT 体 从 DICOM 转成 NIfTI 再训练

3.1 结构组成(概念)

1
2
3
.nii / .nii.gz
  ├── Header:维度 (X,Y,Z[,T])、体素大小、方向/原点(仿射)
  └── Data:体素数组(如 512×512×120)
  • 3D:一层层堆起来的体(如 CT 全肺)。
  • 4D:多时间点或多模态叠在时间/通道维(如 fMRI)。

3.2 文件里包含哪些信息

通常没有(需另存 CSV/Sidecar)
体素强度值完整 DICOM 患者信息
空间分辨率、方向(仿射)机构级检查号、完整序列描述
有时在扩展字段存备注法律级审计链路

3.3 常用查看工具

工具说明
ITK-SNAP看 NIfTI、做分割
3D Slicer导入 NIfTI 三维浏览
FSLeyes神经影像常用
PythonnibabelSimpleITKAI 流水线标配

四、NRRD(几乎原始栅格数据)

说明
中文名几乎原始栅格数据格式
常见扩展名.nrrd、头文件 .nhdr + 原始 .raw(分离式)
文件特点头信息 可读文本 或二进制;灵活描述多维数组;科研与 MedVis 生态常见
与 NIfTI角色类似,都是 「体数据 + 头」;工具链有重叠(3D Slicer、ITK)

包含信息:维度、类型、间距、方向、可选元数据键值;临床标签通常不靠 NRRD 携带

查看:3D Slicer、ImageJ、ParaView(偏可视化)。


五、MetaImage(MHA / MHD + RAW)

说明
中文名Meta 图像格式
常见扩展名.mha(单文件)、.mhd + .raw(头+数据分离)
文件特点ITK 生态友好;文本头描述维度与类型,数据可分离存储
用途与 SimpleITK 流水线、部分老项目数据交换

查看 / 处理:3D Slicer、ITK-SNAP、SimpleITK。


六、Analyze 7.5(遗留格式)

说明
中文名Analyze 7.5 格式(较老)
结构.hdr(头)+ .img(体素)
现状多被 NIfTI 取代;偶见历史数据

七、常见二维图像(JPEG / PNG 等)

说明
中文名联合图像专家组格式 / 便携式网络图形 / 标签图像文件格式 等
在医学中的角色多为 DICOM 截图、导出片、论文插图、部分移动端上传不是 院内标准归档格式
特点只有(或 mainly)像素 + 少量 EXIF;丢失 层厚、HU、患者与检查层级
AI 注意可用,但 无法做可靠 3D 测量;窗宽窗位可能已被「烤」进图里

查看:系统看图、ImageJ、任何浏览器。

例子:把胸片 DICOM 导出为 PNG 发论文图——人眼能看,不适合 当作与 PACS 等价的临床源数据。


八、病理全视野数字化(WSI)

说明
中文名全视野病理切片数字化图像
常见扩展名.svs.ndpi.mrxs.tif(金字塔 TIFF)厂商格式 为主
特点极大分辨率(亿级像素);常 金字塔分层(低倍预览→高倍细节)
结构多为 专有容器 + 多层分辨率;不统一为一种开放标准
包含信息像素 + 扫描倍率、MPP(微米/像素)等;患者信息常在外部 LIS

查看OpenSlide 支持的查看器、QuPath、部分厂商软件。

与放射影像区别:切片是 组织染色,不是 X 线/CT;AI 流程常为 分块(patch)训练 + slide 级预测


九、视频与动态超声

说明
中文名动态超声多帧、心脏超声 DICOM 多帧、造影 cine
常见形式DICOM 多帧(一个文件里多帧);或导出 MP4 / AVI(元数据减少)
特点时间维 + 空间维;帧率、心动周期相关

查看:超声工作站、支持 cine 的 DICOM 查看器、VLC(仅视频导出时)。


十、相关非图像文件

类型中文/说明和影像的关系
DICOM SR结构化报告存测量、发现,引用图像 Series
DICOM SEG / RTSTRUCT分割 / 勾画轮廓AI 标注、放疗轮廓,挂到同一 Study
DICOM GSPS图形批注箭头、文字叠加
HL7 / FHIR医疗信息交换传报告、医嘱,不是像素文件
PDF影像报告 PDF文字结论,不能替代 DICOM 做 AI 训练源(除非 OCR 做 NLP)

十一、格式选型速查

1
2
3
4
进医院、做诊断、训练要空间与 HU  →  优先理解 DICOM(+ 脱敏)
做 AI 实验、体数据 numpy 化      →  常见 DICOM → NIfTI 再进模型
写论文配图、网页展示            →  PNG/JPEG(衍生,非源数据)
病理 AI                         →  厂商 WSI + OpenSlide / QuPath

与 AI 预处理的关系

  • 换模态时,任务类型(分类/检测/分割)不变;
  • 变的是文件里有什么:2D 单帧 vs 3D 体、是否有 HU、是否多帧、标签在哪一层级标注。
  • 预处理 必须先 读对格式(DICOM 用 pydicom/SimpleITK,NIfTI 用 nibabel),再谈 ResNet、U-Net。

十二、参考与延伸

本文由作者按照 CC BY 4.0 进行授权