Проверка гипотез исследования с использованием языка R

Обложка

Цитировать

Аннотация

Для современных учёных становятся всё более важными компетенции в области статистической обработки данных. Очевидными преимуществами открытого программного обеспечения (open-source software) для статистического анализа являются доступность и многофункциональность. Наиболее широкими возможностями среди бесплатных решений обладают язык программирования и соответствующее программное обеспечение R, доступное в виде минималистичного консольного интерфейса или полноценной среды разработки RStudio/Posit.

Предлагаем вашему вниманию практическое руководство по сравнению двух групп с помощью инструментов языка R на примере сопоставления эффективной дозы, полученной при проведении стандартной компьютерной и низкодозной компьютерной томографии при COVID-19, в котором кратко обобщены теоретические подходы к обработке медицинских данных, а также рекомендации по корректной формулировке задач исследования и выбора оптимальных методов статистического анализа.

Основная задача практического руководства ― познакомить читателя с интерфейсом Posit и базовым функционалом языка R на практическом примере решения реальной медицинской задачи. Представленный материал может быть полезен на начальном этапе освоения статистического анализа с помощью инструментов языка R.

Об авторах

Иван Андреевич Блохин

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: i.blokhin@npcmr.ru
ORCID iD: 0000-0002-2681-9378
SPIN-код: 3306-1387
Россия, Москва

Мария Романовна Коденко

Научно-практический клинический центр диагностики и телемедицинских технологий; Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)

Email: KodenkoMR@zdrav.mos.ru
ORCID iD: 0000-0002-0166-3768
SPIN-код: 5789-0319
Россия, Москва; Москва

Юлия Федоровна Шумская

Научно-практический клинический центр диагностики и телемедицинских технологий; Первый Московский государственный медицинский университет имени И.М. Сеченова (Сеченовский Университет)

Email: ShumskayaYF@zdrav.mos.ru
ORCID iD: 0000-0002-8521-4045
SPIN-код: 3164-5518
Россия, Москва; Москва

Анна Павловна Гончар

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: a.gonchar@npcmr.ru
ORCID iD: 0000-0001-5161-6540
SPIN-код: 3513-9531
Россия, Москва

Роман Владимирович Решетников

Научно-практический клинический центр диагностики и телемедицинских технологий

Автор, ответственный за переписку.
Email: r.reshetnikov@npcmr.ru
ORCID iD: 0000-0002-9661-0254
SPIN-код: 8592-0558

к.ф.-м.н.

Россия, Москва

Список литературы

  1. Emerson J.D., Colditz G.A. Use of statistical analysis in the New England Journal of Medicine // New Engl J Med. 1983. Vol. 309, N 12. P. 709–713. doi: 10.1056/NEJM198309223091206
  2. Ali Z., Bhaskar S.B. Basic statistical tools in research and data analysis // Indian J Anaesth. 2016. Vol. 60, N 9. P. 662–669. doi: 10.4103/0019-5049.190623
  3. Mishra P., Pandey C.M., Singh U., et al. Selection of appropriate statistical methods for data analysis // Ann Card Anaesth. 2019. Vol. 22, N 3. P. 297–301. doi: 10.4103/aca.ACA_248_18
  4. Dwivedi A.K., Shukla R. Evidence-based statistical analysis and methods in biomedical research (SAMBR) checklists according to design features // Cancer Rep (Hoboken). 2020. Vol. 3, N 4. P. e1211. doi: 10.1002/cnr2.1211
  5. Rigby P.C., German D.M., Cowen L,. et al. Peer review on open-source software projects: Parameters, statistical models, and theory // ACM Trans Softw Eng Methodol. 2014. Vol. 23, N 4. P. 35.
  6. Culpepper S.A., Aguinis H. R is for revolution: A cutting-edge, free, open source statistical package // Organizational Research Methods. 2011. Vol. 14, N 4. P. 735–740.
  7. Ihaka R., Gentleman R. R: A language for data analysis and graphics // J Computational Graphical Statistics. 1996. Vol. 5, N 3. P. 299–314. doi: 10.1080/10618600.1996.10474713
  8. Niu G., Segall R.S., Zhao Z., et al. A survey of open source statistical software (OSSS) and their data processing functionalities // Int J Open Source Software Processes. 2021. Vol. 12, N 1. P. 1–20. doi: 10.4018/IJOSSP.2021010101
  9. Shatenok M.P., Ryzhov S.A., Lantukh Z.A., et al. Patient dose monitoring software in radiology // Digital Diagnostics. 2022. Vol. 3, N 3. P. 212–230. doi: 10.17816/DD106083
  10. Druzhinina U.V., Ryzhov S.A., Vodovatov A.V., et al. Coronavirus Disease-2019: Changes in computed tomography radiation burden across Moscow medical facilities // Digital Diagnostics. 2022. Vol. 3, N 1. P. 5–15. doi: 10.17816/DD87628
  11. Gombolevskiy V., Morozov S., Chernina V., et al. A phantom study to optimise the automatic tube current modulation for chest CT in COVID-19 // Eur Radiol Exp. 2021. Vol. 5, N 1. P. 21. doi: 10.1186/s41747-021-00218-0
  12. Blokhin I., Gombolevskiy V., Chernina V., et al. Inter-observer agreement between low-dose and standard-dose CT with soft and sharp convolution kernels in COVID-19 pneumonia // J Clin Med. 2022. Vol. 11, N 3. P. 669. doi: 10.3390/jcm11030669
  13. Blokhin I.A., Gonchar A.P., Kodenko M., et al. Impact of body mass index on the reliability of the CT0–4 grading system: A comparison of computed tomography protocols: 2 // Digital Diagnostics. 2022. Vol. 3, N 2. P. 108–118. doi: 10.17816/DD104358
  14. Kennedy-Shaffer L. Before p<0.05 to beyond p<0.05: Using history to contextualize p-values and significance testing // Am Stat. 2019. Vol. 73, Suppl. 1. P. 82–90. doi: 10.1080/00031305.2018.1537891
  15. Romão X., Delgado R., Costa A. An empirical power comparison of univariate goodness-of-fit tests for normality // J Statist Computation Simulat. 2010. Vol. 80, N 5. P. 545–591. doi: 10.1080/00949650902740824
  16. Lumley T., Diehr P., Emerson S., Chen L. The importance of the normality assumption in large public health data sets // Ann Rev Pub Health. 2002. Vol. 23, N 1. P. 151–169. doi: 10.1146/annurev.publhealth.23.100901.140546
  17. Mishra P., Pandey C.M., Singh U., et al. Descriptive statistics and normality tests for statistical data // Ann Card Anaesth. 2019. Vol. 22, N 1. P. 67–72. doi: 10.4103/aca.ACA_157_18

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Интерфейс программы Posit с указанием областей консоли, окружения и файлового менеджера.

Скачать (207KB)
3. Рис. 2. Интерфейс Posit после импорта файла: в левом верхнем квадранте экрана появилось окно с загруженными столбцами набора данных, а в правом верхнем квадранте указано количество столбцов (variables) и строк (obs., от англ. observations ― наблюдения).

Скачать (253KB)
4. Рис. 3. Создание отдельной переменной для эффективной дозы компьютерной томографии с указанием функции каждого элемента команды.

Скачать (141KB)
5. Рис. 4. Окно Posit после импорта файла и присвоения значений переменным: в правом верхнем квадранте появились новые переменные с предпросмотром первых пяти значений в каждой, в левом нижнем квадранте ― консольный интерфейс для выполнения команд.

Скачать (217KB)
6. Рис. 5. Область с консольным интерфейсом Posit. Проверка нормальности распределения данных тестом Шапиро–Уилка.

Скачать (190KB)
7. Рис. 6. Проведение теста Уилкоксона с указанием функции каждого элемента команды.

Скачать (124KB)
8. Рис. 7. Проверка нулевой гипотезы исследования с помощью критерия Уилкоксона.

Скачать (128KB)

© Эко-вектор, 2023

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах