Clinical pathways analysis of patients in medical institutions based on hard and fuzzy clustering methods

Мұқаба

Дәйексөз келтіру

Толық мәтін

Аннотация

Modeling the processes in a healthcare system plays a large role in understanding its activities and serves as the basis for increasing the efficiency of medical institutions. The tasks of analyzing and modeling large amounts of urban healthcare data using machine learning methods are of particular importance and relevance for the development of industry solutions in the framework of digitalization of the economy, where data is the key factor in production. The problem of automatic analysis and determination of clinical pathways groups of patients based on clustering methods is considered in this research. Existing projects in this area reflect a great interest on the part of the scientific community in such studies; however, there is a need to develop a number of methodological approaches for their further practical application in urban outpatient institutions, taking into account the specifics of the organization being analyzed. The aim of the study is to improve the quality of management and segmentation of patient input flow in urban medical institutions based on cluster analysis methods for the further development of recommendation services. One approach to achieving this goal is the development and implementation of clinical pathways, or patient trajectories. In general, the clinical pathway of a patient might be interpreted as the trajectory when receiving medical services in respective institutions. The approach of developing groups of patient routes by the hierarchical agglomerative algorithm with the Ward method and Additive Regularization of Topic Models (ARTM) is presented in this article. A computational experiment based on public data on the routes of patients with a diagnosis of sepsis is described. One feature of the proposed approach is not just the automation of the determination of similar groups of patient trajectories, but also the consideration of clinical pathways patterns to form recommendations for organizing the resource allocation of a medical institution. The proposed approach to segmenting the input heterogeneous flow of patients in urban medical institutions on the basis of clustering consists of the following steps: 1) preparing the data of the medical institution in the format of an event log; 2) encoding patient routes; 3) determination of the upper limit of the clinical pathway length; 4) hierarchical agglomerative clustering; 5) additive regularization of topic models (ARTM); 6) identifying popular patient route patterns. The resulting clusters of routes serve as the foundation for the further development of a simulation model of a medical institution and provide recommendations to patients. In addition, these groups may underlie the development of the robotic process automation system (RPA), which simulates human actions and allows you to automate the interpretation of data to manage the resources of the institution.

Авторлар туралы

Elizaveta Prokofyeva

HSE University

Хат алмасуға жауапты Автор.
Email: prokofyeva.liza@gmail.com
ORCID iD: 0000-0003-1322-2932

Roman Zaytsev

FORS Group

Email: roman.zaitsev@fors.ru
3, Trifonovskiy Tupik Street, Moscow 1292723, Russia

Әдебиет тізімі

  1. Ilyushin G.Ya., Limanskij V.I. (2015) Development of the patient flow management system. Systems and Approaches of Informatics, vol. 25, no 1, pp. 186–197 (in Russian).
  2. Azanov V.G. (2016) Structural-functional model of patient flow management. Systems and Approaches of Informatics, vol. 26, no 1, pp. 13–29 (in Russian).
  3. Kinsman L., Rotter T., James E., Snow P., Willis J. (2010) What is a clinical pathway? Development of a definition to inform the debate. BMC Medicine, vol. 8, no 31. doi: 10.1186/1741-7015-8-31.
  4. Pearson S.D., Goulart-Fisher D., Lee T.H. (1995) Critical pathways as a strategy for improving care: Problems and potential. Annals of Internal Medicine, vol. 123, no 12, pp. 941–948.
  5. Wakamiya S., Yamauchi K. (2009) What are the standard functions of electronic clinical pathways? International Journal of Medical Informatics, vol. 78, no 8, pp. 543–550. doi: 10.1016/j.ijmedinf.2009.03.003.
  6. Vesel A., Zvárov J., Peleska J., Buchtela D., Anger Z. (2006) Medical guidelines presentation and comparing with electronic health record. International Journal of Medical Informatics, vol. 75, no 3–4, pp. 240–245. doi: 10.1016/j.ijmedinf.2005.07.016.
  7. Rojas E., Munoz-Gama J., Sepúlveda M., Capurro D. (2016) Process mining in healthcare: A literature review. Journal of Biomedical Informatics, no 61, pp. 224–236. doi: 10.1016/j.jbi.2016.04.007.
  8. Huang Z., Lu X., Duan H. (2012) On mining clinical pathway patterns from medical behaviors. Artificial Intelligence in Medicine, vol. 56, no 1, pp. 35–50. doi: 10.1016/j.artmed.2012.06.002.
  9. Rakocevic G., Djukic T., Filipovic N., Milutinovi V. (2013) Computational medicine in data mining and modeling. N.Y.: Springer. doi: 10.1007/978-1-4614-8785-2.
  10. Ahmad M.A., Teredesai A., Eckert C. (2018) Interpretable machine learning in healthcare. Proceedings of the 2018 IEEE International Conference on Healthcare Informatics (ICHI), New York, NY, USA, 4–7 June 2018, pp. 447–447. doi: 10.1109/ICHI.2018.00095.
  11. Rotter T., Kinsman L., James E.L., Machotta A., Gothe H., Willis J., Snow P., Kugler J. (2010) Clinical pathways: effects on professional practice, patient outcomes, length of stay and hospital costs: Cochrane database of systematic reviews and meta-analysis. Evaluation & the Health Professions, vol. 35, no 1, pp. 3–27. doi: 10.1177/0163278711407313.
  12. Prodel M. (2017) Process discovery, analysis and simulation of clinical pathways using health-care data. Université de Lyon. Available at: https://tel.archives-ouvertes.fr/tel-01665163/document (accessed 25 November 2019).
  13. Huang Z., Dong W., Ji L., Gan C., Lu X., Duan H. (2014) Discovery of clinical pathway patterns from event logs using probabilistic topic models. Journal of Biomedical Informatics, no 47, pp. 39–57. doi: 10.1016/j.jbi.2013.09.003.
  14. Lin F., Chou S., Pan S., Chen Y. (2001) Mining time dependency patterns in clinical pathways. International Journal of Medical Informatics, vol. 62, no 1, pp. 11–25. doi: 10.1016/S1386-5056(01)00126-5.
  15. Cote M.J., Stein W.E. (2007) A stochastic model for a visit to the doctor’s office. Mathematical and Computer Modelling, vol. 45, no 3–4, pp. 309–323. doi: 10.1016/j.mcm.2006.03.022.
  16. Zhang Y., Padman R., Patel N. (2015) Paving the cowpath: Learning and visualizing clinical pathways from electronic health record data. Journal of Biomedical Informatics, no 58, pp. 186–197.
  17. Blei D.M., Ng A.Y., Jordan M.I. (2003) Latent Dirichlet allocation. The Journal of Machine Learning Research, no 3, pp. 993–1022.
  18. Fernández-Llatas C., Benedi J.-M., García-Gómez J.M., Traver V. (2013) Process mining for individualized behavior modeling using wireless tracking in nursing homes. Sensors (Basel), vol. 13, no 11, pp. 15434–15451. doi: 10.3390/s131115434.
  19. van der Aalst W.M.P. (2011) Process mining: Discovery, conformance and enhancement of business processes. Springer. doi: 10.1007/978-3-642-19345-3.
  20. van der Aalst W.M.P. (2018) Process mining and simulation: A match made in heaven! Proceedings of the 50th Computer Simulation Conference (SummerSim 2018). Bordeaux, France, 9–12 July 2018. doi: 10.22360/summersim.2018.scsc.005.
  21. van der Aalst W.M.P. (2016) Process mining: Data science in action. Berlin: Springer-Verlag.
  22. van der Aalst W.M.P. (2011) Process mining manifesto. Business Process Management Workshops. Springer, pp. 169–194. doi: 10.1007/978-3-642-28108-2_19.
  23. Fernández-Llatas C., Meneu T., Benedi J.M., Traver V. (2010) Activity-based process mining for clinical pathways computer aided design. Proceedings of the 2010 Annual International Conference of the IEEE Engineering in Medicine and Biology. Buenos Aires, Argentina, 31 August – 4 September 2010, pp. 6178–6181. doi: 10.1109/IEMBS.2010.5627760.
  24. Kovalchuk S.V., Funkner A.A., Metsker O.G., Yakovlev A.N. (2018) Simulation of patient flow in multiple healthcare units using process and data mining techniques for model identification. Journal of Biomedical Informatics, no 82, pp. 128–142.
  25. Williams R., Buchan I., Prosperi M., Ainsworth J. (2014) Using string metrics to identify patient journeys through care pathways. Proceedings of the AMIA Annual Symposium, Washington, DC, USA, 15–19 November 2014, pp. 1208–1217.
  26. Kaufmann L., Rousseeuw P. (1987) Clustering by means of medoids. Data analysis based on the L1-norm and related methods, pp. 405–416.
  27. Ward J.H. (1963) Hierarchical grouping to optimize an objective function. Journal of the American Statistical Association, vol. 58, no 301, pp. 236–244.
  28. Zaitsev R.D., Britkov V.B. (2015) The use of the R language for multidimensional clustering of time series in order to analyze the dynamics of scientific and technological development. Transactions of the Second Youth Scientific Conference “Problems of Modern Computer Science”, Moscow, 29–30 October 2015, pp. 92–98.
  29. Ferreira L., Hitchcock D. (2009) A comparison of hierarchical methods for clustering functional data. Communications in Statistics – Simulation and Computation, no 38, pp. 1925–1949. doi: 10.1080/03610910903168603.
  30. Konnov I.V., Kashina O.A., Gilmanova E.I. (2019) Solving the clustering problem by optimization methods on graphs. Scientific Letters of the Kazan University, Series Physical and Mathematical Sciences, vol. 161, pp. 423–437 (in Russian). doi: 10.26907/2541-7746.2019.3.423-437.
  31. Boytsov L. (2011) Indexing methods for approximate dictionary searching. Journal of Experimental Algorithmics, vol. 16, no 1, article no 1.1. doi: 10.1145/1963190.1963191.
  32. Rousseeuw P.J. (1987) Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, vol. 20, pp. 53–65. doi: 10.1016/0377-0427(87)90125-7.
  33. Huang Z., Lu X., Duan H., Fan W. (2013) Summarizing clinical pathways from event logs. Journal of Biomedical Informatics, vol. 46, no 1, pp. 111–127. doi: 10.1016/j.jbi.2012.10.001.
  34. Vorontsov K.V., Potapenko A.A. (2014) Tutorial on probabilistic topic modeling: Additive regularization for stochastic matrix factorization. AIST’2014, Analysis of Images, Social Networks and Texts. Communications in Computer and Information Science. Springer, pp. 265–267.

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».