数字技术在病理学家工作中的应用:使用自动语音识别系统培训的研究

封面

如何引用文章

详细

自然语言处理,或Natural language processing是计算语言学的一个领域。这是计算机科学的一个分支,包括自然语言中的语音和文本的算法处理。利用这些算法,机器翻译系统、问题答案和数字自动语音识别应运而生。数字自动语音识别的应用主要是在人机交互过程中进行语音转换,生成相关且有意义的文本,以及用自然语言进行交流。如今,这些系统被广泛应用于医学实践,包括病理解剖学。成功使用自动语音识别系统的主要步骤如下:编写标准模板(用于自动纳入诊断的描述),并培训医生在实践中使用此类系统的技能。长期以来,世界各地的医生都试图将病理解剖学结论标准化。通过对国内外文献的研究,我们编制了宏观描述和微观描述中必须包含的元素列表,并在最终结论中体现出来。这些模板有助于作出决定和准确地作出诊断,因为它们按照重要性的顺序包含所有关键因素。这大大减少了对固定宏观材料和额外组织学切片的重复检查。内置在数字自动语音识别中的模板可以减少维护文档的时间,并显著减少病理学家的工作量。为成功使用数字自动语音识别,我们为国内外博士研究生开设了《解剖病理学实践中的数字语音识别》培训课程。这篇文章给出了课程的简要描述,课程本身可以在互联网上找到。

全文:

自然语言处理,或Natural language processing是计算语言学的一个领域。这是计算机科学的一个分支,包括自然语言中的语音和文本的算法处理[1, 2, 6]。

数字自动语音识别(ASR)系统已被世界各地的医疗专业人员成功地使用[7]。这些系统已经在医疗机构实施了20年,并在此期间取得了显著进展。如今,这项技术(见图1)简化了医生使用电子文档的工作,减少了错误的数量,并有助于决策。

成功使用自动语音识别系统的主要步骤如下:编写标准模板(用于自动纳入诊断的描述),并培训医生在实践中使用此类系统的技能。

本研究的目的是分析在病理学家的实践中使用数字自动语音识别的现代文献,以及标准化的宏观描述和组织学结论的写作;为不同年龄组的肿瘤病理学和其他疾病的活检和手术材料的标准化结构化描述开发模板,并使用数字自动语音识别来使用它们;总结我们自己 在数字自动语音识别方面的长期经验,并为病理医师的研究生培训编写一门课程。

 

图. 1. 数字自动语音识别的工作原理

Fig. 1. General architecture of digital speech recognition systems

 

目前,市场上使用自然语言处理的国内外商业系统有几种类型:Voice2Med; Dragon Medical One;Nuance Communications,Inc.;VoiceOver PRO.Voicebrook,Inc.;The Sayit for Pathologists,Inc.nVoq™;Fusion Speech for Pathology, Dolbey [16, 18, 19, 21, 22].将这种系统引入病理医师的实际活动中,不仅可以加快工作流程,避免错误,而且可以为病理科室带来明显的经济效益[3, 9, 10, 12]。

在学习了俄罗斯和外国文献之后,我们工作的第一阶段是制定标准模板,无论是宏观的还是微观的描述,以及撰写结论。应该注意的是,医生在临床实践中广泛使用标准方案和方案来治疗 病人。在大多数情况下,治疗的处方考虑数据的病理学家的结论[5]。在病理解剖描述中缺少关键元素会导致诊断的错误表述,从而导致对患者的治疗不充分。为了排除这种情况,病理学家多次试图将病理解剖学结论标准化[8, 13–15]。

目前,在俄罗斯联邦,进行终身形态研究的程序由俄罗斯联邦卫生部2016年3月24日第179n号命令确定1。该命令的规定符合第323-FL号联邦法2,以及根据相关资料的医疗护理标准提供医疗护理的程序[4]。经俄罗斯联邦司法部批准,俄罗斯联邦卫生部第179n号命令于2016年3月24日实施了扩大版医疗文件会计格式(第014-1/y号)。《活组织检查(手术材料)终身病理解剖检查方案》连同指示是一种强制性的医疗文件会计形式,第014-1/y号。

《活组织检查(手术材料)终身病理解剖检查方案》是传统的描述。这种描述不能再以任何形式作出,但必须按照国家或国际标准编制。为此目的,编译包含基本形态参数的模板。其中一个例子是由美国病理学家协会(CAP—College of American Pathologists)开发的模板,在国外广泛使用。然而,同样重要的是,要使用美国病理学家协会推荐的电子模板,不仅要有合格的翻译,而且要有版权所有者的许可才能使用[20]。在实践中,大多数病理实验室使用他们自己的协议和模板。这项工作的目标之一是开发这种模板,用于活检和手术材料的标准化结构化描述,并使用数字自动语音识别将其纳入《活组织检查(手术材料)终身病理解剖检查 方案》。

以现代文献资料为基础,编制了宏观描述和微观描述模板中必须包含并反映在最终结论中的元素列表(见图2)。

 

图. 2. 使用Dragon Medical One软件创建宏观描述和组织学诊断协议的一个例子

Fig. 2. An example of work with Dragon Medical One software for dictation of gross description and histological diagnosis

 

宏观描述应包括:

1、送检样品的名称、标记、碎片数量、状况(新鲜或固定送检);

2、有什么解剖结构存在,它们的解剖方向和样品的完整性。在这个阶段有用的是使用外科标记(固件、金属夹、染料)和基本的地形解剖学知识;

3、国际单位制中重量和尺寸的测量结果;

4、主要病理形态学发现的描述,其大小、形状、颜色、一致性,指示切除边缘的距离;

5、附加发现和背景过程的描述;

6、病理科采用的在解剖平面上用染料标记宏观制剂;

7、对样品碎片进行分类的描述,用于组织学和其他研究方法(盒式编号说明其内容);

8、照片文档。

微观描述应该包括:

1、按照重要性顺序对所有微观发现进行描述;

2、在免疫组化检查—抗体的名称,制造商表明抗体克隆和质量控制。

终身病理解剖结论应包含与编码的最新修订分类相对应的简短分型诊断[20]。在某些情况下,需要组织分子诊断的公式。那么结论应该包含分子遗传学研究的数据或癌症标志物分析的结果。

评论可能包括对任命其他研究方法的建议。

在我们的工作中,在创建模板时,我们采用了以下方法:以单独段落的形式对文本进行描述,抽象的信息表达,以及倒金字塔管理法(Pyramid Upside Down)[11, 13]。

这种模板的使用有助于诊断的决策和准确的公式,因为它包含了所有的关键因素,按照其重要性的顺序,并显著减少了对固定的宏观材料和额外的组织学切片的重复检查的需要。

我们工作的最后一个阶段是«Digital Speech Recognition in an Anatomical Pathology Practice» (《解剖病理学实践中的数字语音识别》)课程的编写,并在博士研究生培养中实施。本课程包括:基本设备的描述,操作系统的技术要求,也包括一个简短的培训课程—使用这种系统的指导。它提供了基本的术语,讨论了使用数字自动语音识别的优点和缺点。在课程结束时,通过提问来测试所学知识。工作分析表明,由于本课程的完成,病理医师在各级用户中使用数字自动语音识别的能力水平有了显著提高(每天使用数字自动语音识别,定期使用数字自动语音识别,以前不使用数字自动语音识别)。 本课程在网上提供给所有感兴趣的用户,可用于教学国内和国外的学生[17]。

数字自动语音识别的使用是将数字技术引入病理学家工作的一个例子,使医疗保健达到现代水平。标准模板数据库的存在和数字自动语音识别的使用可以大大简化病理科的质量控制程序,减少维护文档的时间,大大减轻了病理学家的负担,腾出了时间来提高专业水平。

×

作者简介

Andrey Khramtsov

Ann & Robert H. Lurie Children’s Hospital of Chicago

编辑信件的主要联系方式.
Email: duvip@yandex.ru

MD, PhD, Senior Researcher, Department of Pathology and Laboratory Medicine

美国, Chicago

Ruslan Nasyrov

Saint Petersburg State Pediatric Medical University of the Ministry of Healthcare of the Russian Federation

Email: ran.53@mail.ru

MD, PhD, Dr. Sci. (Med.), Professor, Head, Department of Anatomic Pathology and Forensic Medicine

俄罗斯联邦, Saint Petersburg

Galina Khramtsova

The University of Chicago

Email: galina@uchicago.edu

MD, PhD, Senior Researcher, Department of Medicine, Section of Hematology and Oncology

美国, Chicago

参考

  1. Белоногов Г.Г. Компьютерная лингвистика и перспективные информационные технологии. М.: Русский мир, 2004. [Belonogov GG. Komp’yuternaya lingvistika i perspektivnye informatsionnye tekhnologii. Moscow: Russkiy mir; 2004. (In Russ.)]
  2. Боярский К.К. Введение в компьютерную лингвистику. Учеб. пос. СПб.: НИУ ИТМО, 2013. [Boyarskiy KK. Vvedenie v komp’yuternuyu lingvistiku. Ucheb. pos. Saint Petersburg: NIU ITMO; 2013. (In Russ.)]
  3. Кудрявцев Н.Д., Сергунова К.А., Иванова Г.В., и др. Оценка эффективности внедрения технологии распознавания речи для подготовки протоколов рентгенологических исследований//Врач и информационные технологии. 2020. Т. S1. С. 58–64. [Kudryavtsev ND, Sergunova KA, Ivanova GV, et al. Evolution of the effectiveness of the introduction of speech recognition technology for the preparation of protocols for X-ray examinations. Information Technologies for the Physician. 2020; S1:58-64. (In Russ.)] doi: 10.37690/1811-0193-2020-S1-58-64
  4. Мальков П.Г., Франк Г.А., Пальцев М.А. Стандартные технологические процедуры при проведении патологоанатомических исследований: Клинические рекомендации. М.: Практическая медицина, 2017. [Mal’kov PG, Frank GA, Pal’tsev MA. Standartnye tekhnologicheskie protsedury pri provedenii patologoanatomicheskikh issledovaniy: Klinicheskie rekomendatsii. Moscow: Prakticheskaya meditsina; 2017. (In Russ.)]
  5. Трякин А. А., Гладков О. А., Матвеев В. Б., и др. Практические рекомендации по лечению герминогенных опухолей у мужчин. Злокачественные опухоли: Практические рекомендации//RUSSCO. 2020. T. 10, № 3s2. С. 572–602. [Tryakin AA, Gladkov OA, Matveev VB, et al. Prakticheskie rekomendatsii po lecheniyu germinogennykh opukholey u muzhchin Zlokachestvennye opukholi: Prakticheskie rekomendatsii. RUSSCO. 2020;10(3s2):572-602. (In Russ.)] doi: 10.18027/2224-5057-2020-10-3s2-34
  6. Цитульский А.М., Иванников А.В., Рогов И.С. NLP — Обработка естественных языков//Научно-образовательный журнал для студентов и преподавателей StudNet. 2020. Т. 3. № 6. С. 467–475. [Tsitul’skiy AM, Ivannikov AV, Rogov IS. NLP – Natural language processing. StudNet. 2020;6:467-475. (In Russ.)]
  7. Blackley SV, Schubert VD, Goss FR, et al. Physician use of speech recognition versus typing in clinical documentation: A controlled observational study. Int J Med Inform. 2020;141:104178. doi: 10.1016/j.ijmedinf.2020.104178
  8. Goldsmith JD, Siegal GP, Suster S, et al. Reporting guidelines for clinical laboratory reports in surgical pathology. Arch Pathol Lab Med. 2008;132(10):1608-1616. doi: 10.5858/2008-132-1608-RGFCLR
  9. Henricks WH, Roumina K, Skilton BE, et al. The utility and cost effectiveness of voice recognition technology in surgical pathology. Mod Pathol. 2002;15(5):565-571. doi: 10.1038/modpathol.3880564
  10. Kang HP, Sirintrapun SJ, Nestler RJ, Parwani AV. Experience with voice recognition in surgical pathology at a large academic multi-institutional center. Am J Clin Pathol. 2010;133(1):156-159. doi: 10.1309/AJCPOI5F1LPSLZKP
  11. Renshaw AA, Mena-Allauca M, Gould EW, Sirintrapun SJ. Synoptic Reporting: Evidence-Based Review and Future Directions. JCO Clin Cancer Inform. 2018;2:1-9. doi: 10.1200/CCI.17.00088
  12. Singh M, Pal TR. Voice recognition technology implementation in surgical pathology: advantages and limitations. Arch Pathol Lab Med. 2011;135(11): 1476-1481. doi: 10.5858/arpa.2010-0714-OA
  13. Sluijter CE, van Workum F, Wiggers T, et al. Improvement of Care in Patients with Colorectal Cancer: Influence of the Introduction of Standardized Structured Reporting for Pathology. JCO Clin Cancer Inform. 2019;3:1-12. doi: 10.1200/CCI.18.00104
  14. Valenstein PN. Formatting pathology reports: applying four design principles to improve communication and patient safety. Arch Pathol Lab Med. 2008;132(1): 84-94. doi: 10.5858/2008-132-84-FPRAFD
  15. Veras LV, Arnold M, Avansino JR, et al. Guidelines for synoptic reporting of surgery and pathology in Hirschsprung disease. J Pediatr Surg. 2019;54(10):2017-2023. doi: 10.1016/j.jpedsurg.2019.03.010
  16. Программа Voice2Med. Режим доступа: https://www.speechpro.ru/product/programmy-dlya-raspoznavaniya-rechi-v-tekst/voice2med Дата обращения: 06.09.21. [Program Voice2Med. Available from: https://www.speechpro.ru/product/programmy-dlya-raspoznavaniya-rechi-v-tekst/voice2med (In Russ.)]
  17. Digital Speech Recognition Systems in an Anatomical Pathology Practice. Media Lab. Available from: https://www.medialab.com/digital_speech_recognition_systems_in_an_anatomic_pathology_practice.aspx Accessed: 06.09.2021.
  18. Dragon Medical One. Nuance Communications Inc. Available from: https://www.nuance.com/healthcare/provider-solutions/speech-recognition/dragon-medical-one.html Accessed: 06.09.21.
  19. VoiceOver PRO. Voicebrook Inc. Available from: https://www.voicebrook.com/voiceover.
  20. The College of American Pathologists (CAP) eCC (electronic Cancer Checklists). Available from: https://www.cap.org/laboratory-improvement/proficiency-testing/cap-ecc
  21. The Say it for Pathologists. Inc n Voq. Available from: https://sayit.nvoq.com/medical-dictation-software-for-pathologists/ (accessed 07.03.2021).
  22. Fusion Speech for Pathology. Dolbey. Available from: https://www.dolbey.com/solutions/speech-recognition/fusion-speechemr/pathology/(accessed 07.03.2021).

补充文件

附件文件
动作
1. JATS XML
2. 图. 1. 数字自动语音识别的工作原理 Fig. 1. General architecture of digital speech recognition systems

下载 (53KB)
3. 图. 2. 使用Dragon Medical One软件创建宏观描述和组织学诊断协议的一个例子 Fig. 2. An example of work with Dragon Medical One software for dictation of gross description and histological diagnosis

下载 (251KB)

版权所有 © Khramtsov A., Nasyrov R., Khramtsova G., 2021

Creative Commons License
此作品已接受知识共享署名 4.0国际许可协议的许可
 


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».