文献解读 | 一项使用 CT 图像筛选冠状病毒疾病(COVID-19)的深度学习算法

2020-03-04 09:27 来源:丁香园 作者:
字体大小
- | +

自 2019 年 12 月起,严重急性呼吸系统综合症冠状病毒 2(SARS-COV-2,也被称为 2019-nCov)引起的非典型和人与人之间传播的肺炎在湖北武汉爆发,进而蔓延到全国,现在已引起全球警报。新型冠状病毒肺炎(NCP,也被称为 COVID-19)传染性强,症状与普通流感症状类似,所以能否快速准确地鉴别诊断 NCP 是控制此次疫情的关键。

在 NCP 疫情爆发早期,由于确诊病例样本量少,核酸检测作为病原学证据被公认为 NCP 的主要参考标准。随着临床确定病例资料的累积,NCP 的 CT 影像特征逐渐清晰,在国家卫建委公布的第五版诊疗方案,临床诊断无需依赖核酸检测结构,CT 影像临床诊断结果可作为 NCP 诊断的标准。但是,一名 NCP 患者的 CT 影像大概有 300 张左右,医生对一个病例的 CT 影像肉眼判读耗时大约为 5-15 分钟,这给临床医生诊断带来巨大的压力。利用人工智能(AI)技术对 CT 影像进行智能检测和诊断,是一个非常好的解决方案。广大医务人员在积极参与患者救治的同时,也在积极和国内的超级计算机中心、高校以及互联网公司展开 AI+CT 快速诊断 NCP 科研探索,取得了一些创新性和突破性的研究成果。接下来,我们会定期对此领域突破性的研究进行解读和分享。

下面是由天津医科大学肿瘤医院、西安交通大学第一附属医院以及南昌大学第一医院等多家医院联合天津国家超级计算机中心和天津大学智能计算学院共同做的第一个将 AI 技术结合 CT 图像有效筛选冠状病毒病(COVID-19)的研究,并发布在 medRxiv 平台上。

A deep learning algorithm using CT images to screen for Corona Virus Disease (COVID-19)

(一项使用 CT 图像筛选冠状病毒疾病(COVID-19)的深度学习算法)

Shuai Wang, Bo Kang,et al.

研究背景(Background)

为了控制冠状病毒病(COVID-19)的传播,筛查大量疑似病例以便于进行适当的隔离和治疗措施是当务之急。病原实验室检测是诊断的金标准,但很耗时,而且会产生明显的假阳性结果。迫切需要快速又准确的诊断方法来对抗这种疾病。基于 CT 图像中 COVID-19 的放射学图像的改变,我们假设深度学习方法可能能够提取 COVID-19 的图形特征,并在病原检测之前提供临床诊断,从而为控制疾病节约宝贵的时间。

研究方法(Methods)

本研究收集 453 张 CT 图像,这些图像来自于病原检测确诊的 COVID-19 病例以及先前被诊断为典型的病毒性肺炎病例。我们改良了 inception 迁移学习模型的算法,然后进行内部和外部验证。

研究结果(Findings)

内部验证的准确度达到了 82.9%,特异度为 80.5%,灵敏度为 84%。外部测试数据集显示了总准确度为 73.1%,特异度为 67%,灵敏度为 74%。

总结(Interpretation)

这些结果证明了使用人工智能的方法证能提取放射学特征以进行及时、准确地诊断 COVID-19。

研究设计

为了开发用于识别病毒性肺炎图像的深度学习算法,本研究共回顾性纳入 99 例患者,其中包含 55 例先前在 COVID-19 爆发之前被诊断的典型病毒性肺炎(被称为 COVID-19 阴性)患者,其他 44 例为通过核酸检测确诊的 COVID-19 阳性患者。然后由两名放射科医师对以上所有患者的 CT 图像绘制感兴趣区(ROI),ROI 大小约为 395×223 到 636×533 像素,下面 Figure 2 为示例。总共标记了 453 个 ROI(COVID-19 阴性患者中选择了 258 个,COVID-19 阳性患者选择了 195 个)。然后从每个病例中选择 2-3 张图片作为训练集训练模型,总共 236 张,每个病例的其他 CT 图片作为验证集,共 217 张图片,进行内部验证。另外,为了测试模型的稳定性和泛化性,本研究另外从 453 个 ROI 中随机选择 237 张图像(118 张来自 COVID-19 阴性患者和 119 张来自于 COVID-19 阳性患者),然后将其余患者图像共计 216 张图像,进行外部验证(见下面研究技术路线图)。

图片1.png
整个研究的技术路线图

图片2.png
Figure 2. An example of COVID-19 pneumonia features.  The blue arrow points to ground-glass opacity, and the yellow arrow points to the pleural indentation sign

最终训练的结果

内部验证模型训练损失曲线和外部验证模型训练曲线在下降后,均趋于稳定,表明训练过程都收敛(见 Figure3)。深度学习算法得出的内部 AUC 为 0.90(95%CI,0.86-0.94), 外部验证为 0.78(95%CI,0.71-0.84)(AUC 见 Figure 4)。内部验证的准确度达到了 82.9%,特异度为 80.5%,灵敏度为 84%。外部测试数据集显示了总准确度为 73.1%,特异度为 67%,灵敏度为 74%(见 Table 2)。

图片3.png
Figure 3.  Training loss curves of the models on internal (A) and external (B) validation. The loss curve tends to be stable after descending, indicating that the training process converges

图片4.png
Table 2. Deep learning Algorithm Performance

图片5.png
Figure 4.  Receiver operating characteristic plots for COVID-19 identification for the deep learning (Inception) algorithm

医学点评

由于基于核酸的实验室检测 COVID-19 的局限性,迫切需要寻找能够被一线医护人员用于迅速地、准确地诊断该疾病的替代方法。本研究利用深度学习算法分析标定后的 CT 图像,研发一个 AI 程序,以期快速准确地诊断 COVID-19,最后的验证结果是达到 82.9% 的准确度,每个病例的诊断时间为 2 秒,这大大提高了病例的诊断速度,缩短疾病控制的诊断时间。但是,本研究也存在一些缺陷,比如:研究中只有两名放射科医师参与 ROI 的标定,训练数据集较少,也有必要将 CT 图像特征与疾病进展以及疾病的所有病理学阶段相关联,以优化诊断系统。

注:正文中 Figure 2, Figure 3, Figure 4, Table 2 均摘自原文。

参考文献:WANG S, BO K, JINLU M, et al. A deep learning algorithm using CT images to screen for Corona Virus Disease (COVID-19) [J]. medRxiv, 2020 Feb. 


编辑: 朱卿

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。