Применение логистической регрессии в эпидемиологии: первичные данные, стратификация и скользящее среднее

Обложка

Цитировать

Полный текст

Аннотация

Обоснование. Методы логистической регрессии являются наиболее используемыми для установления статистических связей между количественными предикторами Х и дихотомическим откликом Y (Y=0 или Y=1). Именно поэтому разработка новых подходов к анализу связей между Х и Y такого типа является актуальной.

Цель. Показать особенности применения методов стратификации, скользящего среднего и функции кумулятивной вероятности при построении и анализе моделей логистической регрессии в задачах оценки риска здоровью.

Материалы и методы. Для анализа моделей логистической регрессии используются методы стратификации, скользящего среднего, функции кумулятивной вероятности, а также критерии согласия и методы сравнения долей.

Результаты. Показано, что стандартные методы стратификации недостаточны для оценки характера связей между дихотомическим Y и количественным Х. Дополнительные методы (скользящее среднее и функция кумулятивной вероятности) позволяют выявить особенности этих связей. Показана роль графического представления результатов логистической регрессии для понимания статистических связей между переменными Х и Y. Результаты применения методов стратификации, скользящего среднего и функции кумулятивной вероятности иллюстрируются примерами из области эпидемиологии.

Заключение. Методы скользящего среднего и функции кумулятивной вероятности в сочетании со стратификацией позволяют надёжно идентифицировать характер связи между дихотомическим Y и количественным Х и выявить возможные отклонения от условий применимости моделей логистической регрессии.

Об авторах

Анатолий Николаевич Вараксин

Институт промышленной экологии Уральского отделения Российской академии наук

Автор, ответственный за переписку.
Email: varaksin@ecko.uran.ru
ORCID iD: 0000-0003-2689-3006
SPIN-код: 9910-2326

д-р физ.-мат. наук, профессор

Россия, Екатеринбург

Юлия Валерьевна Шалаумова

Институт промышленной экологии Уральского отделения Российской академии наук

Email: jvshalaumova@gmail.com
ORCID iD: 0000-0002-0173-6293
SPIN-код: 3163-6856

канд. техн. наук

Россия, Екатеринбург

Татьяна Анатольевна Маслакова

Институт промышленной экологии Уральского отделения Российской академии наук

Email: t9126141139@gmail.com
ORCID iD: 0000-0001-6642-9027
SPIN-код: 3233-7652

канд. физ.-мат. наук

Россия, Екатеринбург

Список литературы

  1. Ayvazyan SA, Yenyukov IS, Meshalkin LD. Applied statistics. Addiction research. Moscow: Finansy i statistika; 1985. 487 p. (In Russ.)
  2. Ayvazyan SA, Buchstaber VM, Yenyukov IS, Meshalkin LD. Applied statistics. Classification and reduction of dimensionality. Moscow: Finansy i statistika; 1989. 606 p. (In Russ.)
  3. Afifi AA, Azen SP. Statistical analysis. A computer oriented approach. Moscow: Mir; 1982. 488 p. (In Russ.)
  4. Siegel AF. Practical business statistics. Irwin: McGraw-Hill; 1999. 800 p.
  5. Hosmer D, Lemeshow S. Applied logistic regression. New York: Wiley & Sons; 2000. 373 p.
  6. Shoukri MM, Pause CA. Statistical methods for health sciences. Boca Raton: CRC Press; 1999. 384 p.
  7. Afifi AA, May S, Clark V. Computer-aided multivariate analysis. Boca Raton: Chapman&Hall/CRC; 2003. 512 p.
  8. Peng C-YJ, Lee KL, Ingersoll GM. An introduction to logistic regression. Analysis and reporting. J. Educational Research. 2002;96(1):3–14. doi: 10.1080/00220670209598786
  9. Wooldridge JM. Introductory econometrics: a modern approach. Mason: South-Western; 2009. 865 p.
  10. Schmidt CO, Kohlmann T. When to use the odds ratio or the relative risk? Int J. Public Health. 2008;53(3):165–167. doi: 10.1007/s00038-008-7068-3
  11. Bakhtereva EV, Shirokov VA, Varaksin AN, Panov VG. Assessing the risk of carpal tunnel syndrome exposure occupational factors. Ural Medical Journal. 2015;(10):9–13. EDN: VLMSTX
  12. Varaksin AN, Bakhtereva EV, Panov VG, et al. Risk factors for neurological diseases development in workers of Urals industrial plants: prognostic models based on discriminant analysis. Ecological Systems and Devices. 2016;(5):27–33. EDN: WMATKB
  13. Mikhelson AA, Lazukina MV, Varaksin AN, et al. Erosion of the vaginal mucosa in postmenopausal women with surgical correction of genital prolapse. Treatment and prevention. 2020;10(4);55–64. EDN: ZCTUDM
  14. Mikhelson AA, Lazukina MV, Varaksin AN, et al. Effects of preoperative preparation on the vaginal mucosa in women with genital prolapse associated with genitourinary menopausal syndrome. Acta Scientific Women's Health. 2023;5(4):83–97. doi: 10.31080/ASWH.2023.05.0494 EDN: UWBRGC
  15. Varaksin AN, Shalaumova YuV, Maslakova TA, et al. Application of moving average methods for the construction of regression models in medical and environmental research. Ecological Systems and Devices. 2020;(6):12–21. doi: 10.25791/esip.06.2020.1159 EDN: XTBFAV
  16. Maksimov DM, Maksimova ZV. Prevalence of smoking and hazardous drinking among industrial workers in the Sverdlovsk region. Ekologiya cheloveka (Human Ecology). 2021;28(3):34–41. doi: 10.33396/1728-0869-2021-3-34-41 EDN: ICGEPK
  17. Kretova IG, Vedyasova OA, Komarova MV, Shiryaeva OI. Analysis and forecasting of reserve capabilities of the organism of students according to indices of heart rate variability. Hygiene and Sanitation. 2017;96(6):556–561. doi: 10.18821/0016-9900-2017-96-6-556-561 EDN: ZAPEEB
  18. Konyrtaeva NN, Ivanov SV, Kausova GK, et al. Leech therapy in kazakhstan: patients’ characteristics and compliance with treatment. Ekologiya cheloveka (Human Ecology). 2016;23(2):42–48. doi: 10.33396/1728-0869-2016-2-42-48 EDN: VQGTMZ
  19. Kharkova OA, Grjibovski AM. Analysis of one and two independent samples using STATA software: parametric tests. Ekologiya cheloveka (Human Ecology). 2014;21(3):57–61. EDN: RYIEZL
  20. Tukey JW. Exploratory data analysis. Moscow: Mir; 1981. 693 p. (In Russ.)
  21. Glantz S. Primer of biostatistics. New York: McGraw-Hill; 1992. 440 p.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Первичные (obs) данные для Y (Y=0 либо Y=1 для каждого из 100 пациентов, открытые кружки) и вероятности иметь сердечно-сосудистые заболевания W(ССЗ)calc согласно расчётам методом логистической регрессии (сплошные кружки).

Скачать (67KB)
3. Рис. 2. Данные о сердечно-сосудистых заболеваниях (ССЗ) в восьми стратах по возрасту: а — вероятность W, b — значения logit(W). Сплошные кружки — расчёт методом логистической регрессии (calc), открытые кружки (obs) — результат стратификации.

Скачать (94KB)
4. Рис. 3. Вероятности W иметь сердечно-сосудистые заболевания (ССЗ) в зависимости от возраста: стратификация 100 пациентов D. Hosmer, S. Lemeshow [5] на 10 страт с равным числом пациентов в страте; обозначения см. на рис. 2.

Скачать (54KB)
5. Рис. 4. Данные о сердечно-сосудистых заболеваниях (ССЗ) по результатам расчёта скользящего среднего в зависимости от среднего возраста в стратах, окно усреднения nW=10 (открытые кружки): а — вероятность W, b — значения logit(W). Сплошные кружки — расчёты методом логистической регрессии.

Скачать (117KB)
6. Рис. 5. Данные о сердечно-сосудистых заболеваниях (ССЗ) по результатам стратификации 820 работников на 10 страт с равным числом работников в страте в зависимости от индекса массы тела (ИМТ): a — вероятность W, b — значения logit(W), обозначения см. на рис. 2.

Скачать (101KB)
7. Рис. 6. Функция кумулятивной вероятности для сердечно-сосудистых заболеваний (ССЗ) в зависимости от индекса массы тела (ИМТ): a — для 820 работников, b — начальный участок для значений ИМТ, меньше 26 кг/м2.

Скачать (110KB)
8. Рис. 7. Вероятности W сердечно-сосудистых заболеваний (ССЗ) по результатам стратификации, показанной в табл. 1.

Скачать (53KB)
9. Рис. 8. Данные о заболеваниях щитовидной железы (ЩЖ): a — вероятность W по результатам стратификации 100 пациенток на 10 страт (открытые кружки), сплошные кружки – расчёт методом логистической регрессии, b — связь вероятности W с индексом массы тела (ИМТ) для данных скользящего среднего (окно скользящего среднего — 21, всего 80 страт).

Скачать (91KB)

© Эко-Вектор, 2025

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
 


Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).