Применение логистической регрессии в эпидемиологии: первичные данные, стратификация и скользящее среднее

Обложка

Цитировать

Полный текст

Аннотация

Обоснование. Методы логистической регрессии являются наиболее используемыми для установления статистических связей между количественными предикторами Х и дихотомическим откликом Y (Y=0 или Y=1). Именно поэтому разработка новых подходов к анализу связей между Х и Y такого типа является актуальной.

Цель. Показать особенности применения методов стратификации, скользящего среднего и функции кумулятивной вероятности при построении и анализе моделей логистической регрессии в задачах оценки риска здоровью.

Материалы и методы. Для анализа моделей логистической регрессии используются методы стратификации, скользящего среднего, функции кумулятивной вероятности, а также критерии согласия и методы сравнения долей.

Результаты. Показано, что стандартные методы стратификации недостаточны для оценки характера связей между дихотомическим Y и количественным Х. Дополнительные методы (скользящее среднее и функция кумулятивной вероятности) позволяют выявить особенности этих связей. Показана роль графического представления результатов логистической регрессии для понимания статистических связей между переменными Х и Y. Результаты применения методов стратификации, скользящего среднего и функции кумулятивной вероятности иллюстрируются примерами из области эпидемиологии.

Заключение. Методы скользящего среднего и функции кумулятивной вероятности в сочетании со стратификацией позволяют надёжно идентифицировать характер связи между дихотомическим Y и количественным Х и выявить возможные отклонения от условий применимости моделей логистической регрессии.

Об авторах

Анатолий Николаевич Вараксин

Институт промышленной экологии Уральского отделения Российской академии наук

Автор, ответственный за переписку.
Email: varaksin@ecko.uran.ru
ORCID iD: 0000-0003-2689-3006
SPIN-код: 9910-2326

д-р физ.-мат. наук, профессор

Россия, Екатеринбург

Юлия Валерьевна Шалаумова

Институт промышленной экологии Уральского отделения Российской академии наук

Email: jvshalaumova@gmail.com
ORCID iD: 0000-0002-0173-6293
SPIN-код: 3163-6856

канд. техн. наук

Россия, Екатеринбург

Татьяна Анатольевна Маслакова

Институт промышленной экологии Уральского отделения Российской академии наук

Email: t9126141139@gmail.com
ORCID iD: 0000-0001-6642-9027
SPIN-код: 3233-7652

канд. физ.-мат. наук

Россия, Екатеринбург

Список литературы

  1. Ayvazyan SA, Yenyukov IS, Meshalkin LD. Applied statistics. Addiction research. Moscow: Finansy i statistika; 1985. 487 p. (In Russ.)
  2. Ayvazyan SA, Buchstaber VM, Yenyukov IS, Meshalkin LD. Applied statistics. Classification and reduction of dimensionality. Moscow: Finansy i statistika; 1989. 606 p. (In Russ.)
  3. Afifi AA, Azen SP. Statistical analysis. A computer oriented approach. Moscow: Mir; 1982. 488 p. (In Russ.)
  4. Siegel AF. Practical business statistics. Irwin: McGraw-Hill; 1999. 800 p.
  5. Hosmer D, Lemeshow S. Applied logistic regression. New York: Wiley & Sons; 2000. 373 p.
  6. Shoukri MM, Pause CA. Statistical methods for health sciences. Boca Raton: CRC Press; 1999. 384 p.
  7. Afifi AA, May S, Clark V. Computer-aided multivariate analysis. Boca Raton: Chapman&Hall/CRC; 2003. 512 p.
  8. Peng C-YJ, Lee KL, Ingersoll GM. An introduction to logistic regression. Analysis and reporting. J. Educational Research. 2002;96(1):3–14. doi: 10.1080/00220670209598786
  9. Wooldridge JM. Introductory econometrics: a modern approach. Mason: South-Western; 2009. 865 p.
  10. Schmidt CO, Kohlmann T. When to use the odds ratio or the relative risk? Int J. Public Health. 2008;53(3):165–167. doi: 10.1007/s00038-008-7068-3
  11. Bakhtereva EV, Shirokov VA, Varaksin AN, Panov VG. Assessing the risk of carpal tunnel syndrome exposure occupational factors. Ural Medical Journal. 2015;(10):9–13. EDN: VLMSTX
  12. Varaksin AN, Bakhtereva EV, Panov VG, et al. Risk factors for neurological diseases development in workers of Urals industrial plants: prognostic models based on discriminant analysis. Ecological Systems and Devices. 2016;(5):27–33. EDN: WMATKB
  13. Mikhelson AA, Lazukina MV, Varaksin AN, et al. Erosion of the vaginal mucosa in postmenopausal women with surgical correction of genital prolapse. Treatment and prevention. 2020;10(4);55–64. EDN: ZCTUDM
  14. Mikhelson AA, Lazukina MV, Varaksin AN, et al. Effects of preoperative preparation on the vaginal mucosa in women with genital prolapse associated with genitourinary menopausal syndrome. Acta Scientific Women's Health. 2023;5(4):83–97. doi: 10.31080/ASWH.2023.05.0494 EDN: UWBRGC
  15. Varaksin AN, Shalaumova YuV, Maslakova TA, et al. Application of moving average methods for the construction of regression models in medical and environmental research. Ecological Systems and Devices. 2020;(6):12–21. doi: 10.25791/esip.06.2020.1159 EDN: XTBFAV
  16. Maksimov DM, Maksimova ZV. Prevalence of smoking and hazardous drinking among industrial workers in the Sverdlovsk region. Ekologiya cheloveka (Human Ecology). 2021;28(3):34–41. doi: 10.33396/1728-0869-2021-3-34-41 EDN: ICGEPK
  17. Kretova IG, Vedyasova OA, Komarova MV, Shiryaeva OI. Analysis and forecasting of reserve capabilities of the organism of students according to indices of heart rate variability. Hygiene and Sanitation. 2017;96(6):556–561. doi: 10.18821/0016-9900-2017-96-6-556-561 EDN: ZAPEEB
  18. Konyrtaeva NN, Ivanov SV, Kausova GK, et al. Leech therapy in kazakhstan: patients’ characteristics and compliance with treatment. Ekologiya cheloveka (Human Ecology). 2016;23(2):42–48. doi: 10.33396/1728-0869-2016-2-42-48 EDN: VQGTMZ
  19. Kharkova OA, Grjibovski AM. Analysis of one and two independent samples using STATA software: parametric tests. Ekologiya cheloveka (Human Ecology). 2014;21(3):57–61. EDN: RYIEZL
  20. Tukey JW. Exploratory data analysis. Moscow: Mir; 1981. 693 p. (In Russ.)
  21. Glantz S. Primer of biostatistics. New York: McGraw-Hill; 1992. 440 p.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Первичные (obs) данные для Y (Y=0 либо Y=1 для каждого из 100 пациентов, открытые кружки) и вероятности иметь сердечно-сосудистые заболевания W(ССЗ)calc согласно расчётам методом логистической регрессии (сплошные кружки).

Скачать (67KB)
3. Рис. 2. Данные о сердечно-сосудистых заболеваниях (ССЗ) в восьми стратах по возрасту: а — вероятность W, b — значения logit(W). Сплошные кружки — расчёт методом логистической регрессии (calc), открытые кружки (obs) — результат стратификации.

Скачать (94KB)
4. Рис. 3. Вероятности W иметь сердечно-сосудистые заболевания (ССЗ) в зависимости от возраста: стратификация 100 пациентов D. Hosmer, S. Lemeshow [5] на 10 страт с равным числом пациентов в страте; обозначения см. на рис. 2.

Скачать (54KB)
5. Рис. 4. Данные о сердечно-сосудистых заболеваниях (ССЗ) по результатам расчёта скользящего среднего в зависимости от среднего возраста в стратах, окно усреднения nW=10 (открытые кружки): а — вероятность W, b — значения logit(W). Сплошные кружки — расчёты методом логистической регрессии.

Скачать (117KB)
6. Рис. 5. Данные о сердечно-сосудистых заболеваниях (ССЗ) по результатам стратификации 820 работников на 10 страт с равным числом работников в страте в зависимости от индекса массы тела (ИМТ): a — вероятность W, b — значения logit(W), обозначения см. на рис. 2.

Скачать (101KB)
7. Рис. 6. Функция кумулятивной вероятности для сердечно-сосудистых заболеваний (ССЗ) в зависимости от индекса массы тела (ИМТ): a — для 820 работников, b — начальный участок для значений ИМТ, меньше 26 кг/м2.

Скачать (110KB)
8. Рис. 7. Вероятности W сердечно-сосудистых заболеваний (ССЗ) по результатам стратификации, показанной в табл. 1.

Скачать (53KB)
9. Рис. 8. Данные о заболеваниях щитовидной железы (ЩЖ): a — вероятность W по результатам стратификации 100 пациенток на 10 страт (открытые кружки), сплошные кружки – расчёт методом логистической регрессии, b — связь вероятности W с индексом массы тела (ИМТ) для данных скользящего среднего (окно скользящего среднего — 21, всего 80 страт).

Скачать (91KB)

© Эко-Вектор, 2025

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
 


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».