Inter-observer variability between readers of CT images: all for one and one for all

Nikolas S. Kulberg; Кульберг Николай Сергеевич; Nikolas S. Kulberg; Roman V. Reshetnikov; Решетников Роман Владимирович; Roman V. Reshetnikov; Vladimir P. Novik; Новик Владимир Петрович; Vladimir P. Novik; Alexey B. Elizarov; Елизаров Алексей Борисович; Alexey B. Elizarov; Maxim A. Gusev; Гусев Максим Александрович; Maxim A. Gusev; Victor A. Gombolevskiy; Гомболевский Виктор Александрович; Victor A. Gombolevskiy; Anton V. Vladzymyrskyy; Владзимирский Антон Вячеславович; Anton V. Vladzymyrskyy; Sergey P. Morozov; Морозов Сергей Павлович; Sergey P. Morozov

doi:10.17816/DD60622

CT 图像读取器之间的观察者间变异性：全部为一个，一个为全部

作者: Kulberg N.S.¹^,2, Reshetnikov R.V.¹^,3, Novik V.P.¹, Elizarov A.B.¹, Gusev M.A.¹^,4, Gombolevskiy V.A.¹, Vladzymyrskyy A.V.¹, Morozov S.P.¹
隶属关系:
1. Moscow Center for Diagnostics and Telemedicine
2. Federal Research Center “Computer Science and Control” of Russian Academy of Sciences
3. Institute of Molecular Medicine, The First Sechenov Moscow State Medical University
4. Moscow Polytechnic University
期: 卷 2, 编号 2 (2021)
页面: 105-118
栏目: 原创性科研成果
URL: https://journals.rcsi.science/DD/article/view/60622
DOI: https://doi.org/10.17816/DD60622
ID: 60622

如何引用文章

全文:

详细
全文:
作者简介
参考
补充文件
统计

详细

理由: 医学图像集的标记在很大程度上依赖于观察到的可疑结构的主观解释。目前，没有推荐的协议用于根据医学描述确定参考数据（ground truth）。

目标: 评估参与编制公开数据集»CTLungCa-500»的放射科医生评估的正确性和一致性，以及确定这些指标与对CT研究进行独立解释的专家数量的关系。

方法: 该数据集包括有患肺癌风险的患者的536项CT研究，其中34名放射科医生参加了该研究。每项CT研究都由六位专家独立解释，之后他们发现的可疑结构由另一位专家进行仲裁。对于每位专家计算真阳性，假阳性，真阴性和假阴性结果的数量，在此基础上评估放射科医生的诊断准确性。为了分析放射科医生的结论之间的一致性，使用了百分比度量。

结果:对CT研究进行独立解释的专家数量的增加在一致性降低的情况下导致其评估的正确性增加。在影响成对研究人员之间结论一致性的因素中，关于CT图像的特定部分中存在肺焦点的观点不一致。

结论:独立的初级解释数量的增加使它们的组合正确性会升高，但需要仲裁，放射科医生的资格对分析的质量没有决定性的价值。从结合解释的正确性及其成本的角度来看，由四名放射科医生进行主要标记是最佳的。

关键词

计算机断层扫描，数据集，参考数据，结论之间的一致性

全文:

##article.viewOnOriginalSite##

作者简介

Nikolas S. Kulberg

Moscow Center for Diagnostics and Telemedicine; Federal Research Center “Computer Science and Control” of Russian Academy of Sciences

编辑信件的主要联系方式.
Email: kulberg@npcmr.ru
ORCID iD: 0000-0001-7046-7157
SPIN 代码: 2135-9543

Cand. Sci. (Phys.-Math.)

俄罗斯联邦, 24 Petrovka str., 109029, Moscow; Moscow

Roman V. Reshetnikov

Moscow Center for Diagnostics and Telemedicine; Institute of Molecular Medicine, The First Sechenov Moscow State Medical University

Email: reshetnikov@fbb.msu.ru
ORCID iD: 0000-0002-9661-0254
SPIN 代码: 8592-0558

Cand. Sci. (Phys.-Math.)

俄罗斯联邦, 24 Petrovka str., 109029, Moscow; Moscow

Vladimir P. Novik

Moscow Center for Diagnostics and Telemedicine

Email: v.novik@npcmr.ru
ORCID iD: 0000-0002-6752-1375
SPIN 代码: 2251-1016
俄罗斯联邦, 24 Petrovka str., 109029, Moscow

Alexey B. Elizarov

Moscow Center for Diagnostics and Telemedicine

Email: a.elizarov@npcmr.ru
ORCID iD: 0000-0003-3786-4171
SPIN 代码: 7025-1257

Cand. Sci. (Phys.-Math.)

俄罗斯联邦, 24 Petrovka str., 109029, Moscow

Maxim A. Gusev

Moscow Center for Diagnostics and Telemedicine; Moscow Polytechnic University

Email: m.gusev@npcmr.ru
ORCID iD: 0000-0001-8864-8722
SPIN 代码: 1526-1140
俄罗斯联邦, 24 Petrovka str., 109029, Moscow; Moscow

Victor A. Gombolevskiy

Moscow Center for Diagnostics and Telemedicine

Email: g_victor@mail.ru
ORCID iD: 0000-0003-1816-1315
SPIN 代码: 6810-3279

MD, Cand. Sci. (Med.)

俄罗斯联邦, 24 Petrovka str., 109029, Moscow

Anton V. Vladzymyrskyy

Moscow Center for Diagnostics and Telemedicine

Email: a.vladzimirsky@npcmr.ru
ORCID iD: 0000-0002-2990-7736
SPIN 代码: 3602-7120

Dr. Sci. (Med.), Professor

俄罗斯联邦, 24 Petrovka str., 109029, Moscow

Sergey P. Morozov

Moscow Center for Diagnostics and Telemedicine

Email: morozov@npcmr.ru
ORCID iD: 0000-0001-6545-6170
SPIN 代码: 8542-1720

Dr. Sci. (Med.), Professor

俄罗斯联邦, 24 Petrovka str., 109029, Moscow

参考

Morozov SP, Kulberg NS, Gombolevsky VA, et al. Moscow Radiology Dataset CTLungCa-500. 2018. (In Russ). Available from: https://mosmed.ai/datasets/ct_lungcancer_500/
Morozov SP, Gombolevskiy VA, Elizarov AB, et al. A simplified cluster model and a tool adapted for collaborative labeling of lung cancer CT Scans. Comput Methods Programs Biomed. 2021;206:106111. doi: 10.1016/j.cmpb.2021.106111
Kulberg NS, Gusev MA, Reshetnikov RV, et al. Methodology and tools for creating training samples for artificial intelligence systems for recognizing lung cancer on CT images. Heal Care Russ Fed. 2020;64(6):343–350. doi: 10.46563/0044-197X-2020-64-6-343-350
Hessel SJ, Herman PG, Swensson RG. Improving performance by multiple interpretations of chest radiographs: effectiveness and cost. Radiology. 1978;127(3):589–594. doi: 10.1148/127.3.589
Herman PG, Hessel SJ. Accuracy and its relationship to experience in the interpretation of chest radiographs. Invest Radiol. 1975;10(1):62–67. doi: 10.1097/00004424-197501000-00008
MacMahon H, Naidich DP, Goo JM, et al. Guidelines for management of incidental pulmonary nodules detected on ct images: from the fleischner society 2017. Radiology. 2017;284:228–243. doi: 10.1148/radiol.2017161659
Gerke O, Vilstrup MH, Segtnan EA, et al. How to assess intra- and inter-observer agreement with quantitative PET using variance component analysis: a proposal for standardisation. BMC Med Imaging. 2016;16(1):54. doi: 10.1186/s12880-016-0159-3
Rasheed K, Rabinowitz YS, Remba D, Remba MJ. Interobserver and intraobserver reliability of a classification scheme for corneal topographic patterns. Br J Ophthalmol. 1998;82(12):1401–1406. doi: 10.1136/bjo.82.12.1401
Van Riel SJ, Sánchez CI, Bankier AA, et al. Observer variability for classification of pulmonary nodules on low-dose ct images and its effect on nodule management. Radiology. 2015;277(3):863–871. doi: 10.1148/radiol.2015142700
Wickham H, François R, Henry L, Müller K. dplyr: A Grammar of Data Manipulation. R package version 1.0.4. 2021.
Gamer M, Lemon J, Fellows I, Singh P. irr: Various Coefficients of Interrater Reliability and Agreement. 2019.
Wickham H. ggplot2: elegant Graphics for Data Analysis. Springer-Verlag New York; 2016. 260 р.
R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria; 2020. Available from: http://www.r-project.org/index.html
Van Rossum G, Drake FL. Python 3 Reference Manual. CreateSpace, Scotts Valley, CA; 2009.
Ardila D, Kiraly AP, Bharadwaj S, et al. End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography. Nat Med. 2019;25(6):954–961. doi: 10.1038/s41591-019-0447-x
Peters R, Heuvelmans M, Brinkhof S, et al. Prevalence of pulmonary multi-nodularity in CT lung cancer screening. 2015.
Creative Research Systems. The survey systems: Sample size calculator. 2012.
Hugo GD, Weiss E, Sleeman WC, et al. A longitudinal four-dimensional computed tomography and cone beam computed tomography dataset for image-guided radiation therapy research in lung cancer. Med Phys. 2017;44(2):762–771. doi: 10.1002/mp.12059
Bakr S, Gevaert O, Echegaray S, et al. A radiogenomic dataset of non-small cell lung cancer. Sci Data. 2018;5:180202. doi: 10.1038/sdata.2018.202
Armato SG, McLennan G, Bidaut L, et al. The lung image database consortium (LIDC) and image database resource initiative (IDRI): a completed reference database of lung nodules on ct scans. Med Phys. 2011;38(2):915–931. doi: 10.1118/1.3528204

补充文件

附件文件

动作

1. JATS XML

下载

2. 图 1评估的正确性和一致性是参与初级标记的放射科医生数量的函数。灰色表示95%的置信区间。这些点对应于初级专家的不同样本。对于两名、三名和四名专家的实验，从最初的六名放射技师中选择了三个不同的样本；五 - 两个。

下载 (109KB)

索引源数据

3. 图 2专家之间存在重大分歧的 CT 研究示例（a、b、CTLungCa-500 AN RLADD02000018919、ID RLSDD02000018855）和完全一致（c、d、CTLungCa-500 AN RLAD42D007-25151、ID RLSD42500）。研究显示在肺 (a, c) 和软组织 (b, d ) 模式下的正面投影中。垂直分割为 50 毫米，水平分割为 100 像素。放射科医师的标记以不同的颜色显示：a、b - 六位主要专家中有五位对焦点进行了标记，四位将其指定为实心类型，一位指定为半实心类型。仲裁员不同意他们的意见，认为该发现为良性钙化； c, d - 所有六位主要评估员和仲裁员都将病变归类为潜在恶性实体。

下载 (389KB)

索引源数据

4. 图 3主要专家之间的协议： a - 原始 15 名放射线技师的代表； b - 更换放射线技师。由于注意到的病变数量很少，因此没有给出 ID 000++ 专家的数据。对于每位放射科医生，第一列对应于该专家唯一标记的病变数量（其他五位专家均未识别出这一发现）。以下列对应于放射科医师确定的病变由一名、两名、三名、四名和五名其他主要专家注意到的情况。该图没有考虑仲裁员的批准，以及放射科医师对病变类型的意见分歧。

下载 (184KB)

索引源数据

用户名
密码
记住我

忘记您的密码?	注册

用户名
密码
记住我

忘记您的密码?	注册