医学影像常见文件格式与查看工具
医学影像常见文件格式与查看工具
梳理临床与科研中常见的 医学影像文件格式(DICOM、NIfTI、NRRD、WSI 等):中文名称、结构特点、所含信息及常用查看工具。侧重 AI 与数据预处理 视角;非诊疗建议,临床以院内 PACS 规范为准。
目录
- 一、总览:临床与科研两条线
- 二、DICOM(医学数字成像与通信标准)
- 三、NIfTI
- 四、NRRD
- 五、MetaImage(MHA / MHD)
- 六、Analyze 7.5(遗留格式)
- 七、常见二维图像(JPEG / PNG 等)
- 八、病理全视野数字化(WSI)
- 九、视频与动态超声
- 十、相关非图像文件
- 十一、格式选型速查
- 十二、参考与延伸
一、总览:临床与科研两条线
| 场景 | 最常见格式 | 一句话 |
|---|---|---|
| 医院 PACS / 设备直连 | DICOM | 行业标准,带丰富元数据与层级 |
| AI 训练 / 神经影像科研 | NIfTI、有时 NRRD / MHA | 体数据矩阵 + 简单头信息,便于编程 |
| 报告、教学、网页展示 | JPEG / PNG 等 | 从 DICOM 导出 的「照片」,元数据大量丢失 |
| 病理全视野 | TIFF / 厂商专用格式 | 超大分辨率切片,常配合专用查看器 |
下文按格式展开;DICOM 单独写细,其余写清与 DICOM 的关系即可。
二、DICOM(医学数字成像与通信标准)
| 项 | 说明 |
|---|---|
| 中文名 | 医学数字成像与通信标准文件;口语常叫 DICOM 文件、DCM |
| 常见扩展名 | .dcm、无扩展名、有时 .dicom |
| 文件特点 | 不仅存 像素,还存 患者、检查、序列、设备、窗宽窗位 等成百上千条 标签(Tag);同一检查常 多文件组成序列(如 CT 几百张切片) |
| 谁在用 | DR/CR 胸片、CT、MRI、超声、PET-CT 等院内影像链路 |
2.1 逻辑结构
DICOM 用 层级 组织一次检查,便于 PACS 管理:
1
2
3
4
Patient(患者)
└── Study(一次检查/检查访问,如「2026-06-03 胸部 CT」)
└── Series(序列,如「平扫」「增强动脉期」「肺窗」)
└── Instance(单帧实例 = 通常一个 .dcm 文件,CT 的一张切片)
通俗例子:
- Study = 你这次来医院做的「胸部 CT 这一套」;
- Series = 其中「平扫 1mm」「骨窗」「肺窗」等不同扫描设置;
- Instance = 某一层的断层图(一个文件)。
2.2 文件里大致包含哪些信息
可分两类:
(1)像素数据
- 灰度或彩色矩阵;CT 常为 HU 值 的离散存储,显示时需 窗宽窗位(WW/WL) 映射到屏幕。
(2)元数据(DICOM Tag) — 节选常见项:
| 中文含义 | 典型用途 |
|---|---|
| 患者 ID / 姓名(可脱敏) | 与 HIS 关联 |
| 检查日期时间、检查号 | 归档检索 |
| 模态 Modality(CT、MR、CR、US…) | 区分设备类型 |
| 序列描述、层厚、间距 | 重建与 AI 预处理 |
| 像素间距、切片位置、方向余弦 | 3D 重建、测量、配准 |
| 窗宽窗位 | 显示肺窗/纵隔窗 |
| 设备厂商、协议名 | 质控与域偏移分析 |
隐私:DICOM 常含 身份信息;科研与 AI 须 脱敏 后再出库,遵守法规与伦理。
2.3 常用查看工具
| 工具 | 适用场景 | 备注 |
|---|---|---|
| RadiAnt、Horos、Weasis、MicroDicom | Windows / Mac 上快速阅片 | 轻量、适合初学者看 DICOM |
| 3D Slicer | 3D 重建、分割、科研 | 功能强,学习曲线略陡 |
| OHIF Viewer | 浏览器阅片(常接 PACS) | 偏 Web 集成 |
| ITK-SNAP | 分割标注 | 常与科研配合 |
| 厂商工作站 | 医院正式诊断 | 不对外分发 |
编程读取:pydicom(Python)、DCMTK、SimpleITK 等。
2.4 CT 与 MRI 专节
二者都是 断层影像:不是一张平面投影(如胸片),而是 沿身体一层层「切」出来的很多张图,在院内 几乎一律用 DICOM 存储,层级仍是 Patient → Study → Series → Instance。
CT(Computed Tomography,计算机断层扫描)
| 项 | 说明 |
|---|---|
| 是什么 | 用 X 线 绕身体旋转多角度拍摄,计算机 重建 出横断面(及可重建冠状面、矢状面);通俗说 「一层层切片看内脏」 |
| 典型用途 | 急诊胸腹、骨折、肺结节、肿瘤分期、出血、钙化等;速度快,对 骨、出血、钙化 敏感 |
| 和胸片区别 | 胸片是 2D 投影(结构重叠);CT 是 3D 体(重叠被拆开),一个 Instance = 一层切片 |
文件组成(一次胸部 CT 举例)
1
2
3
4
Study:2026-06-03 胸部 CT 平扫+增强(一次预约的一次检查)
├── Series A:平扫 1mm 薄层(300+ 个 .dcm,每层一个 Instance)
├── Series B:增强静脉期(又一串 .dcm)
└── Series C:有时还有骨窗/肺窗重建序列(或靠软件调窗,不另存)
- 磁盘上:常见 几百个
.dcm文件 属于同一 Series,按 Instance Number / 切片位置 排序后叠成 3D 体。 - 科研/AI:常把一整串 DICOM 转成 NIfTI 一个
.nii.gz,方便 Python 读成一个数组。
CT 特有的关键信息(除通用 DICOM 标签外)
| 信息 | 含义 | 为何重要 |
|---|---|---|
| Modality = CT | 标识为 CT | 与 MRI 区分 |
| HU(Hounsfield Unit,亨氏单位) | 像素与 水/空气/骨 相关的物理标度 | 调窗、定量分析、部分 AI 直接用 HU 阈值 |
| 层厚、层间距、重建核 | 扫描与重建参数 | 影响分辨率与小病灶检出 |
| kVp、mAs | X 线管电压、剂量相关 | 图像噪声、辐射剂量质控 |
| 窗宽窗位 WW/WL | 显示映射 | 肺窗、纵隔窗、骨窗 |
| Rescale Slope/Intercept | 存储值 → HU 的换算 | 读 DICOM 必查,否则 HU 不对 |
通俗例子:CT 图像像 一摞切得很薄的面包片;每片一个文件;软件把整摞叠起来就能 旋转看 3D、量结节大小。
MRI(Magnetic Resonance Imaging,磁共振成像)
| 项 | 说明 |
|---|---|
| 是什么 | 利用 磁场与射频 激发人体组织信号,计算机成像;无电离辐射(有禁忌证,如部分金属植入物) |
| 典型用途 | 脑、脊髓、关节软组织、部分腹部器官、乳腺等;软组织对比 往往优于 CT |
| 和 CT 对比 | CT 偏 骨、急性出血、钙化、快速筛查;MRI 偏 软组织、神经、关节韧带、部分肿瘤边界 |
文件组成(一次颅脑 MRI 举例)
1
2
3
4
5
6
Study:颅脑 MRI
├── Series 1:T1 加权像(一串 .dcm)
├── Series 2:T2 加权像(另一串 .dcm)
├── Series 3:FLAIR(又一串)
├── Series 4:DWI(扩散加权,常看急性脑梗)
└── Series 5:可能还有 ADC 图、增强扫描等
- 一次 MRI 检查 往往 多个 Series,每个 Series 是一种 成像序列/对比度(不是 CT 那种「窗」为主,而是 换脉冲序列)。
- 每个 Series 内仍是 多张切片 Instance;也有 3D 容积序列(一层很厚的块一次采完再重建)。
MRI 特有的关键信息
| 信息 | 含义 | 为何重要 |
|---|---|---|
| Modality = MR | 标识为磁共振 | 与 CT 区分 |
| Sequence Name / 序列描述 | 如 T1、T2、FLAIR、DWI | 决定图像对比,读片与 AI 必须知道是哪种序列 |
| TR、TE、Flip Angle 等 | 脉冲序列参数 | 影响对比度与信噪比 |
| 磁场强度 B0(如 1.5T、3.0T) | 设备场强 | 分辨率与信噪比 |
| 像素值 | 一般 不是 HU;多为相对信号强度 | AI 预处理常做 强度归一化,不能照搬 CT 的窗宽窗位逻辑 |
| 多通道/多回波 | 部分高级序列 | 读取时要按 Series 分开 |
通俗例子:同一次头颅检查,MRI 像 同一部位拍了多种「滤镜」的照片(T1、T2、FLAIR…),每种滤镜一个文件夹(Series);而 CT 更像 同一种成像下切了很多层。
CT vs MRI:文件层面小结
| 对比项 | CT | MRI |
|---|---|---|
| 文件格式 | 院内几乎均为 DICOM | 同左 |
| 一次检查的文件量 | 常 1~数个 Series × 每层一文件 | 常 多个 Series(多序列)× 每层一文件 |
| 像素物理含义 | HU,可定量 | 信号强度,序列依赖强 |
| 显示习惯 | 窗宽窗位(肺窗/骨窗) | 按序列类型选片,增强需看造影剂期相 |
| AI 常见处理 | 重采样、调窗或 HU 裁剪、转 NIfTI 体 | 按序列分开训练、强度归一化、注意 域偏移 |
注意:PET-CT、MRI 增强等会在同一 Study 下再增加 不同 Series;文件结构仍是 DICOM,只是 Series 描述 与 标签 不同。
三、NIfTI(神经影像信息技术倡议格式)
| 项 | 说明 |
|---|---|
| 中文名 | 神经影像信息技术倡议格式;常称 NIfTI 文件 |
| 常见扩展名 | .nii、.nii.gz(压缩) |
| 文件特点 | 主要为 一个 3D/4D 体数据矩阵 + 较短的头文件信息(仿射矩阵、体素尺寸);一般不携带 DICOM 级完整临床元数据 |
| 谁在用 | 脑 MRI/fMRI、部分 AI 竞赛与论文复现;也常把 CT 体 从 DICOM 转成 NIfTI 再训练 |
3.1 结构组成(概念)
1
2
3
.nii / .nii.gz
├── Header:维度 (X,Y,Z[,T])、体素大小、方向/原点(仿射)
└── Data:体素数组(如 512×512×120)
- 3D:一层层堆起来的体(如 CT 全肺)。
- 4D:多时间点或多模态叠在时间/通道维(如 fMRI)。
3.2 文件里包含哪些信息
| 有 | 通常没有(需另存 CSV/Sidecar) |
|---|---|
| 体素强度值 | 完整 DICOM 患者信息 |
| 空间分辨率、方向(仿射) | 机构级检查号、完整序列描述 |
| 有时在扩展字段存备注 | 法律级审计链路 |
3.3 常用查看工具
| 工具 | 说明 |
|---|---|
| ITK-SNAP | 看 NIfTI、做分割 |
| 3D Slicer | 导入 NIfTI 三维浏览 |
| FSLeyes | 神经影像常用 |
Python:nibabel、SimpleITK | AI 流水线标配 |
四、NRRD(几乎原始栅格数据)
| 项 | 说明 |
|---|---|
| 中文名 | 几乎原始栅格数据格式 |
| 常见扩展名 | .nrrd、头文件 .nhdr + 原始 .raw(分离式) |
| 文件特点 | 头信息 可读文本 或二进制;灵活描述多维数组;科研与 MedVis 生态常见 |
| 与 NIfTI | 角色类似,都是 「体数据 + 头」;工具链有重叠(3D Slicer、ITK) |
包含信息:维度、类型、间距、方向、可选元数据键值;临床标签通常不靠 NRRD 携带。
查看:3D Slicer、ImageJ、ParaView(偏可视化)。
五、MetaImage(MHA / MHD + RAW)
| 项 | 说明 |
|---|---|
| 中文名 | Meta 图像格式 |
| 常见扩展名 | .mha(单文件)、.mhd + .raw(头+数据分离) |
| 文件特点 | ITK 生态友好;文本头描述维度与类型,数据可分离存储 |
| 用途 | 与 SimpleITK 流水线、部分老项目数据交换 |
查看 / 处理:3D Slicer、ITK-SNAP、SimpleITK。
六、Analyze 7.5(遗留格式)
| 项 | 说明 |
|---|---|
| 中文名 | Analyze 7.5 格式(较老) |
| 结构 | .hdr(头)+ .img(体素) |
| 现状 | 多被 NIfTI 取代;偶见历史数据 |
七、常见二维图像(JPEG / PNG 等)
| 项 | 说明 |
|---|---|
| 中文名 | 联合图像专家组格式 / 便携式网络图形 / 标签图像文件格式 等 |
| 在医学中的角色 | 多为 DICOM 截图、导出片、论文插图、部分移动端上传;不是 院内标准归档格式 |
| 特点 | 只有(或 mainly)像素 + 少量 EXIF;丢失 层厚、HU、患者与检查层级 |
| AI 注意 | 可用,但 无法做可靠 3D 测量;窗宽窗位可能已被「烤」进图里 |
查看:系统看图、ImageJ、任何浏览器。
例子:把胸片 DICOM 导出为 PNG 发论文图——人眼能看,不适合 当作与 PACS 等价的临床源数据。
八、病理全视野数字化(WSI)
| 项 | 说明 |
|---|---|
| 中文名 | 全视野病理切片数字化图像 |
| 常见扩展名 | .svs、.ndpi、.mrxs、.tif(金字塔 TIFF) 等 厂商格式 为主 |
| 特点 | 极大分辨率(亿级像素);常 金字塔分层(低倍预览→高倍细节) |
| 结构 | 多为 专有容器 + 多层分辨率;不统一为一种开放标准 |
| 包含信息 | 像素 + 扫描倍率、MPP(微米/像素)等;患者信息常在外部 LIS |
查看:OpenSlide 支持的查看器、QuPath、部分厂商软件。
与放射影像区别:切片是 组织染色,不是 X 线/CT;AI 流程常为 分块(patch)训练 + slide 级预测。
九、视频与动态超声
| 项 | 说明 |
|---|---|
| 中文名 | 动态超声多帧、心脏超声 DICOM 多帧、造影 cine |
| 常见形式 | DICOM 多帧(一个文件里多帧);或导出 MP4 / AVI(元数据减少) |
| 特点 | 时间维 + 空间维;帧率、心动周期相关 |
查看:超声工作站、支持 cine 的 DICOM 查看器、VLC(仅视频导出时)。
十、相关非图像文件
| 类型 | 中文/说明 | 和影像的关系 |
|---|---|---|
| DICOM SR | 结构化报告 | 存测量、发现,引用图像 Series |
| DICOM SEG / RTSTRUCT | 分割 / 勾画轮廓 | AI 标注、放疗轮廓,挂到同一 Study |
| DICOM GSPS | 图形批注 | 箭头、文字叠加 |
| HL7 / FHIR | 医疗信息交换 | 传报告、医嘱,不是像素文件 |
| 影像报告 PDF | 文字结论,不能替代 DICOM 做 AI 训练源(除非 OCR 做 NLP) |
十一、格式选型速查
1
2
3
4
进医院、做诊断、训练要空间与 HU → 优先理解 DICOM(+ 脱敏)
做 AI 实验、体数据 numpy 化 → 常见 DICOM → NIfTI 再进模型
写论文配图、网页展示 → PNG/JPEG(衍生,非源数据)
病理 AI → 厂商 WSI + OpenSlide / QuPath
与 AI 预处理的关系
- 换模态时,任务类型(分类/检测/分割)不变;
- 变的是文件里有什么:2D 单帧 vs 3D 体、是否有 HU、是否多帧、标签在哪一层级标注。
- 预处理 必须先 读对格式(DICOM 用 pydicom/SimpleITK,NIfTI 用 nibabel),再谈 ResNet、U-Net。
十二、参考与延伸
- DICOM 标准概览:https://www.dicomstandard.org/
- pydicom 文档:https://pydicom.github.io/
- NIfTI 格式说明(神经影像社区):可检索 “NIfTI format specification”
- 3D Slicer:https://www.slicer.org/
