自 2019 年 12 月起,严重急性呼吸系统综合症冠状病毒 2(SARS-COV-2,也被称为 2019-nCov)引起的非典型和人与人之间传播的肺炎在湖北武汉爆发,进而蔓延到全国,现在已引起全球关注。新型冠状病毒肺炎(NCP,也被称为 COVID-19)传染性强,症状与普通流感症状类似,所以能否快速准确地鉴别诊断 NCP 是控制此次疫情的关键。在 NCP 疫情爆发早期,由于确诊病例样本量少,核酸检测作为病原学证据被公认为 NCP 的主要参考标准。随着临床确定病例资料的累积,NCP 的 CT 影像特征逐渐清晰,在国家卫建委公布的第五版诊疗方案,临床诊断无需依赖核酸检测结构,CT 影像临床诊断结果可作为 NCP 诊断的标准。但是,一名 NCP 患者的 CT 影像大概有 300 张左右,医生对一个病例的 CT 影像肉眼判读耗时大约为 5-15 分钟,这给临床医生诊断带来巨大的压力。利用人工智能(AI)技术对 CT 影像进行智能检测和诊断,是一个非常好的解决方案。广大医务人员在积极参与患者救治的同时,也在积极和国内的超级计算机中心、高校以及互联网公司展开 AI+CT 快速诊断 NCP 科研探索,取得了一些创新性和突破性的研究成果。接下来,我们会定期对此领域突破性的研究进行解读和分享。本期是关于 AI 技术结合 CT 快速精准诊断 COVID-19 第二篇研究。这篇研究是由中山大学国家超级计算中心联合武汉大学人民医院、中山大学孙逸仙纪念医院等多家单位共同做的,并发布在 medRxiv 平台上。
Deep learning Enables Accurate Diagnosis of Novel Coronavirus (COVID-19) with CT images
(深度学习算法结合 CT 图像可以准确诊断新型冠状病毒疾病(COVID-19))
Song Ying, Shuangjia Zheng, Liang Li, et al.
研究背景(Background)
最近出现了一种新型冠状病毒肺炎(COVID-19),是一种急性呼吸系统综合症。该病最初是在中国武汉报道的,但随后蔓延到全世界。随着 COVID-19 继续在世界范围内迅速传播,计算机断层扫描(CT)对其快速诊断已变得至关重要。因此,迫切需要开发一种准确的计算机辅助方法,以辅助临床医生通过 CT 图像识别被 COVID-19 感染的患者。
材料与方法(Materials and Methods)
本研究收集了来自中国两个省份医院的 88 例确诊为 COVID-19 的患者,101 例感染了细菌性肺炎的患者以及 86 例健康人的胸部 CT 扫描,以进行比较和建模。基于收集的数据集,本研究开发了一种基于深度学习算法的 CT 诊断系统(DeepPneumonia)以识别 COVID-19 患者。
研究结果(Results)
实验结果表明,本研究的模型可以从其他疾病患者中准确识别出 COVID-19 患者,AUC 为 0.99,召回率(敏感度)为 0.93。此外,本研究的模型能够区分 COVID-19 感染患者和细菌性肺炎感染患者,AUC 为 0.95,召回率(敏感度)为 0.96。此外,本研究的模型还可以定位主要病变特征,尤其是磨砂玻璃结节(GGO),这对帮助医生进行诊断非常有帮助。此模型对单个患者的诊断可以在 30 秒内完成,诊断是在 Tianhe-2 超级计算机上实现且可以同时执行数千个任务。可通过在线服务器进行 CT 图像的在线诊断(http://biomed.nsccgz.cn/server/Ncov2019)。
结论(Conclusions)
建立的模型可以快速准确地鉴定人群样品中的 COVID-19 患者,从而可以鉴定患者
研究过程
为了建立可以快速准确鉴别诊断 COVID-19 的模型,本研究共收集了来自中国两个省份医院的 88 例被确诊为 COVID-19 患者的胸部 CT 图像,101 例感染了细菌性肺炎的患者以及 86 例健康被试者的胸部 CT 图像。基于以上收集数据集,开发基于深度学习的 CT 诊断系统,也被称为 DeepPneumonia 模型,以识别 COVID-19 的患者。具体的过程分为三步(如下流程图 Figure 1):①每组 3D CT 图像均等地分为 15 个切片,去除肺显示不完整的切片。利用开源软件包 OpenCV 自动提取每个切片中的肺区域,并用肺本身填补了肺分割的空白,以避免由不同肺轮廓引起的噪声。由于人的肺部轮廓差异很大,因此图像填充了由 10 个平移和旋转肺部组成的背景。最终,在本研究中,保留了 88 例 COVID-19 患者的 777 个 CT 切片,100 例细菌性肺炎患者的 505 个切片片以及 86 例健康被试者 708 个切片;②本研究设计了一个 DRE-Net 算法模型,以提取 CT 图像中的前 K 个细节,并获得图像级别的预测。该模型是在经过预先训练的 ResNet-50 上具体构建的,并添加了功能金字塔网络(FPN),以从每个图像中提取 top-K 细节和耦合一个注意力模块,以了解每个细节的重要性。通过使用 FPN 和注意力模块,本研究构建的模型不仅可以检测图像的最重要部分,还可以通过神经网络解释输出;③对图像级别的预测进行汇总以实现患者级别的诊断。
Figure 1: Illustration of DeepPneumonia framework
最终训练的结果
本研究构建此模型的目的有两个:一个目的是将感染 COVID-19 的患者和感染细菌的患者区分开,另一个目的是将 COVID-19 的患者与健康对照区分开来。结果显示我们的模型能够区分 COVID-19 感染患者和细菌性肺炎感染患者,AUC 为 0.95,召回率(敏感度)为 0.96。同时,本研究的模型能够区分 COVID-19 感染患者和健康对照区分开来,AUC 为 0.99,召回率(敏感度)为 0.93。为了测试本研究构建的模型在鉴别诊断 COVID-19 患者的优势,特地与深度残差网络(Resnet),DenseNet 以及 VGG16 进行一一对比。Table 1 和 Figure 2 显示本研究的模型在区分 COVID-19 感染患者和细菌性肺炎感染患者放面,具有一定的优势。Table 2 和 Figure 3 显示本研究的模型在区分 COVID-19 感染患者和健康被试者放面,也具有一定的优势。
医学点评
由于基于核酸的实验室检测 COVID-19 的局限性,迫切需要寻找能够被一线医护人员用于迅速地、准确地诊断该疾病的替代方法。本研究构建了 DeepPneumonia 诊断模型,该模型基于 DRE-Net 算法,通过测试与对比,该模型能够有效地将感染 COVID-19 的患者和感染细菌的患者以及健康人群区分开来。本研究证明了深度学习方法的可行性,该方法可帮助医生检测 COVID-19 的患者并自动从 CT 图像中识别病变。通过在肺炎检测和分类任务上均实现高性能,所提出的系统可以实现对患者的快速识别。
Table 2. Performance comparisons on pneumonia diagnosis dataset
Figure 2: Performance of the DRE-Net on the pneumonia classification. A) Receiver operating characteristic curves for the classification between COVID-19 and normal bacteria pneumonia. B) Confusion matrix of the DRE-Net on the test set.
Table 2. Performance comparisons on pneumonia diagnosis dataset.
Figure 3: Performance of the DRE-Net on the pneumonia diagnosis. A) Receiver operating characteristic curves for the diagnosis of COVID-19. B) Confusion matrix of the DRE-Net on the test set
注:正文中 Figure 1, Figure 2, Figure 3, Table 1,Table 2 均摘自原文。
参考文献:Ying Song, Shuangjia Zheng, et al. Deep learning Enables Accurate Diagnosis of Novel Coronavirus (COVID-19) with CT images | medRxiv. doi: https://doi.org/10.1101 /2020.02.23.20026930 February 23, 2020.