Возможности и ограничения использования инструментов машинной обработки текстов в лучевой диагностике

Обложка

Цитировать

Аннотация

Обоснование. В радиологии важную информацию содержат не только медицинские изображения, но и сопровождающие их текстовые описания, создаваемые врачами-рентгенологами. Идентификация протоколов исследований, содержащих определённые данные, и извлечение этих данных может быть полезным в первую очередь для клинических задач, однако, учитывая большой объём таких данных, необходима разработка машинных алгоритмов анализа.

Цель ― оценить возможности и ограничения использования инструментов машинной обработки текстов для поиска патологий в протоколах лучевых исследований.

Материалы и методы. Для создания первого прототипа алгоритма автоматического анализа протоколов были выбраны исследования молочных желёз (маммография) и органов грудной клетки (рентгенография, флюорография, компьютерная томография и низкодозная компьютерная томография), выполненные в лечебно-профилактических учреждениях Москвы, которые участвовали в эксперименте по использованию инновационных технологий в области компьютерного зрения для анализа медицинских изображений. Для каждого вида исследований был первоначально составлен словарь ключевых слов, соответствующий наличию или отсутствию целевых патологий. После первичной автоматической разметки протоколов разработанным инструментом производились выборочная оценка и валидация результатов врачом-рентгенологом. Количество протоколов, проанализированных врачом для обучения и валидации алгоритмов, составило 977 для маммографии, 3196 для рентгенографии, 1608 для флюорографии, 4074 для компьютерной и 398 для низкодозной компьютерной томографии органов грудной клетки. Для окончательного тестирования разработанных алгоритмов были дополнительно размечены тестовые датасеты из 1032 исследований для маммографии, 544 для флюорографии/рентгенографии, 5000 для компьютерной и 1082 для низкодозной компьютерной томографии органов грудной клетки.

Результаты. Наилучшие результаты достигнуты в поиске признаков вирусной пневмонии по протоколам компьютерной томографии органов грудной клетки (точность 0,996, чувствительность 0,998, специфичность 0,989) и рака молочной железы по протоколам маммографии (точность 1,0, чувствительность 1,0, специфичность 1,0). При поиске алгоритмом признаков рака лёгкого метрики получились следующими: точность 0,895, чувствительность 0,829, специфичность 0,936, а при поиске патологических изменений органов грудной клетки в протоколах рентгенографии и флюорографии точность составила 0,912, чувствительность ― 1,000, специфичность ― 0,844.

Заключение. Машинные методы с высокой точностью могут быть использованы с целью автоматической классификации текстов рентгенологических протоколов маммографии и компьютерной томографии органов грудной клетки для поиска вирусной пневмонии. Для поиска признаков рака лёгкого в модальности компьютерной и низкодозной компьютерной томографии, а также патологических изменений в протоколах рентгенографии и флюорографии органов грудной клетки достигнутой точности достаточно для успешного применения в целях автоматизированного сравнения работы врачей и моделей искусственного интеллекта.

Об авторах

Дарья Юрьевна Кокина

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: d.kokina@npcmr.ru
ORCID iD: 0000-0002-1141-8395
SPIN-код: 9883-4656
Россия, Москва

Виктор Александрович Гомболевский

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: g_victor@mail.ru
ORCID iD: 0000-0003-1816-1315
SPIN-код: 6810-3279

к.м.н.

Россия, Москва

Кирилл Михайлович Арзамасов

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: k.arzamasov@npcmr.ru
ORCID iD: 0000-0001-7786-0349
SPIN-код: 3160-8062

к.м.н.

Россия, Москва

Анна Евгеньевна Андрейченко

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: a.andreychenko@npcmr.ru
ORCID iD: 0000-0001-6359-0763
SPIN-код: 6625-4186

канд. физ.-мат. наук

Россия, Москва

Сергей Павлович Морозов

Научно-практический клинический центр диагностики и телемедицинских технологий

Автор, ответственный за переписку.
Email: spmoroz@gmail.com
ORCID iD: 0000-0001-6545-6170
SPIN-код: 8542-1720

д.м.н., профессор

Россия, Москва

Список литературы

  1. Sorin V., Barash Y., Konen E., Klang E. Deep learning for natural language processing in radiology: Fundamentals and a systematic review // J Am College Radiol. 2020. Vol. 17, N 5. P. 639–648. doi: 10.1016/j.jacr.2019.12.026
  2. Monshi M.M., Poon J., Chung V. Deep learning in generating radiology reports: A survey // Artif Intell Med. 2020. N 106. P. 101878. doi: 10.1016/j.artmed.2020.101878
  3. Banerjee I., Chen M.C., Lungren M.P., Rubin D.L. Radiology report annotation using intelligent word embeddings: Applied to multi-institutional chest CT cohort // J Biomed Inform. 2018. N 77. P. 11–20. doi: 10.1016/j.jbi.2017.11.012
  4. Kivotova E., Maksudov B., Kuleev R., Ibragimov B. Extracting clinical information from chest x-ray reports: A case study for Russian language // Conference: International Conference Nonlinearity, Information and Robotics (NIR)At: Innopolis, Russia, 2020. Р. 1–6. doi: 10.1109/NIR50484.2020.9290235
  5. Lee C., Kim Y., Kim Y.S., Jang J. Automatic disease annotation from radiology reports using artificial intelligence implemented by a recurrent neural network // Am J Roentgenol. 2019. Vol. 212, N 4. Р. 734–740. doi: 10.2214/AJR.18.19869
  6. Yuan J., Zhu H., Tahmasebi A. Classification of pulmonary nodular findings based on characterization of change using radiology reports // AMIA Jt Summits Transl Sci Proc. 2019. Vol. 2019. P. 285–294.
  7. Морозов С.П., Проценко Д.Н., Сметанина С.В., и др. Лучевая диагностика коронавирусной болезни (COVID-19): организация, методология, интерпретация результатов: препринт № ЦДТ 2020-II. Версия 2. Москва, 2020. 78 с.
  8. Профилактика, диагностика и лечение новой коронавирусной инфекции 2019-nCoV. Временные методические рекомендации Министерства здравоохранения Российской Федерации // Пульмонология. 2019. Т. 29, № 6. С. 655–672. doi: 10.18093/0869-0189-2019-29-6-655-672
  9. D’Orsi C.J., Sickles E.A., Mendelson E.B., et al. ACR BI-RADS atlas, breast imaging reporting and data system. Reston, VA, American College of Radiology; 2013.
  10. Caliskan D., Zierk J., Kraska D., et al. First steps to evaluate an NLP tool’s medication extraction accuracy from discharge letters // Stud Health Technol Inform. 2021. N 278. P. 224–230. doi: 10.3233/SHTI210073
  11. American College of Radiology Committee on Lung-RADS. Lung-RADS Assessment Categories version 1.1. Режим доступа: https:// www.acr.org/-/media/ACR/Files/RADS/Lung-RADS/LungRADSAssessmentCategoriesv1-1.pdf. Дата обращения: 01.01.2020.
  12. Морозов С.П., Владзимирский А.В., Гомболевский В.А., и др. Искусственный интеллект: автоматизированный анализ текста на естественном языке для аудита радиологических исследований // Вестник рентгенологии и радиологии. 2018. Т. 99, № 5. С. 253–258.
  13. Hansell D.M., Bankier A.A., MacMahon H., et al. Fleischner Society: glossary of terms for thoracic imaging // Radiology. 2008. Vol. 246, N 3. P. 697–722. doi: 10.1148/radiol.2462070712
  14. MacMahon H., Naidich D.P., Goo J.M., et al. Guidelines for management of incidental pulmonary nodules detected on CT images: from the fleischner society 2017 // Radiology. 2017. Vol. 284, N 1. P. 228–243. doi: 10.1148/radiol.2017161659
  15. Callister M.E., Baldwin D.R., Akram A.R., et al. British Thoracic Society Pulmonary Nodule Guideline Development Group; British Thoracic Society Standards of Care Committee. British Thoracic Society guidelines for the investigation and management of pulmonary nodules // Thorax. 2015. Vol. 70, Suppl 2. Р. ii1–ii54. doi: 10.1136/thoraxjnl-2015-207168
  16. Синицын В.Е., Комарова М.А., Мершина Е.А. Протокол рентгенологического описания: прошлое, настоящее, будущее // Вестник рентгенологии и радиологии. 2014. № 3. С. 35–40.

© Эко-вектор, 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах