Technologies for calculating and visualizing statistics on prevalence and incidence on the example of information about polypous rhinosinusitis in the Samara region

Cover Page

Cite item

Full Text

Abstract

Aim – to statistically determine the distribution of chronic diseases in the chronology of observations; to show the specifics of methods for testing hypotheses in the quantitative and probabilistic prediction of the prevalence of polypous rhinosinusitis.

Material and methods. The outpatient data for the period of 2017–2021 and quantitative information about the cases with polypous rhinosinusitis as main or concomitant diagnosis registered by medical organizations of 25 districts of the Samara region were used in the study.

Results. The synthesis of the initial data statistics, which amounted to the volume of the numerical expansion of primary indicators in the following ratio: categories 15.8%, counting data 26.3%; quantitative values 21.1%; 26.7% – relative incidence and prevalence data. The rest of the data is the descriptive statistics and indicators in the form of tables of correlation coefficients. For extensions of the synthesized data, distributions were evaluated and hypotheses tested using statistical criteria.

Conclusion. The count of the number of chronic diseases is approximated by the density of atypical distributions. Approximately 58% of samples for diagnoses are not confirmed as obeying the law of distribution. In such a situation, when preparing a forecast for the transition to a time series, it is necessary to solve the problem of obtaining sequences with stationary characteristics. In machine learning, data in predictive calculations must be checked for probabilistic confirmation of the coincidence of related sample parameter distributions. The results of the forecast should be taken as a probabilistic conclusion at the level of an unrejected hypothesis.

About the authors

Svetlana A. Palevskaya

Samara State Medical University

Email: s.a.palevskaya@samsmu.ru
ORCID iD: 0000-0001-9263-9407

PhD, MBA, Director of the Institute of Postgraduate Education

Russian Federation, Samara

Andrei V. Gushchin

Samara State Medical University

Author for correspondence.
Email: a.v.guschin@samsmu.ru
ORCID iD: 0000-0002-6128-2334

PhD, Associate professor of the Department of Management, Institute of the Postgraduate Education

Russian Federation, Samara

Mikhail K. Blashentsev

Samara State Medical University

Email: mblashentsev@gmail.com
ORCID iD: 0000-0002-9820-4292

a postgraduate student of the Department of Otorhinolaryngology n.a. Academician of the Russian Academy of Sciences I.B. Soldatov, assistant of the FAC

Russian Federation, Samara

References

  1. You J, Tulpan D, Malpass MC, et al. Using machine learning regression models to predict the pellet quality of pelleted feeds. Animal Feed Science and Technology. 2022;293:115443. doi: 10.1016/j.anifeedsci.2022.115443
  2. Hu Y, Xia X, Fang J, et al. A Multivariate Regression Load Forecasting Algorithm Based on Variable Accuracy Feedback. Energy Procedia. 2018;152:1152-1157. doi: 10.1016/j.egypro.2018.09.147
  3. Kumari Kh, Yadav S. Linear regression analysis study. Curriculum in cardiology – statistics. 2018;4(1):33-36. doi: 10.4103/jpcs.jpcs_8_18
  4. Almalik O. Combining dependent p-values resulting from multiple effect size homogeneity tests in meta-analysis for binary outcomes. Journal of Medical Statistics and Informatics. 2021;1. doi: 10.7243/2053-7662-10-1
  5. Hart J. Comparison of p-value results between one versus two sample t testing: A case study. Journal of Medical Statistics and Informatics. 2021;10. doi: 10.7243/2053-7662-9-1
  6. Iftikhar S. Modification in inter-rater agreement statistics-a new approach. Journal of Medical Statistics and Informatics. 2020;8(1):2. doi: 10.7243/2053-7662-8-2
  7. Basu A. Does a country’s scientific ‘productivity’ depend critically on the number of country journals indexed? Scientometrics. 2010;3. doi: 10.1007/slll92-010-0186-8
  8. Almalki A. Regression Analysis for COVID-19 Infections and Deaths Based on Food Access and Health Issues. Healthcare. 2022;10(2):324. doi: 10.3390/healthcare10020324
  9. Silhavy R, Silhavy P, Prokopova Z. Analysis and selection of a regression model for the Use Case Points method using a stepwise approach. Journal of Systems and Software. 2017;125:1-14. doi: 10.1016/j.jss.2016.11.029
  10. Trubiani C, Ghabi A, Egyed A. Exploiting traceability uncertainty between software architectural models and extra-functional results. Journal of Systems and Software. 2017;125:15-34. doi: 10.1016/j.jss.2016.11.032
  11. García-Floriano A, López-Martín C, Yáñez-Márquez C, et al. Support vector regression for predicting software enhancement effort. Information and Software Technology. 2018;97:99-109. doi: 10.1016/j.infsof.2018.01.003
  12. Bach P, Wallisch Ch, Klein N, et al. Systematic review of education and practical guidance on regression modeling for medical researchers who lack a strong statistical background: Study protocol. National Library of Medicine, 2020;21;15(12). doi: 10.1371/journal.pone.0241427
  13. Rambotti S, Breiger RL. Extreme and Inconsistent: A Case-Oriented Regression Analysis of Health, Inequality, and Poverty. Sage. 2020;18. doi: 10.1177/2378023120906064
  14. Crabtree BF, Ray SC, Schmidt PM, et al. The individual over time: Time series applications in health care research. Journal of Clinical Epidemiology. 1990;43(3):241-260. doi: 10.1016/0895-4356(90)90005-A
  15. Festag S, Denzler J, Spreckelsen C. Generative adversarial networks for biomedical time series forecasting and imputation. Journal of Biomedical Informatics. 2022;129:104058. doi: 10.1016/j.jbi.2022.104058
  16. Morid MA, Sheng Ol, et al. Time Series Prediction Using Deep Learning Methods in Healthcare. Transactions on Management Information Systems. 2023;14(1):1-29. doi: 10.1145/3531326

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Figure 1. Estimation of the density of distribution of cases with J33.0 diagnosis by districts for the period 2017–2021: a – a kernel estimate of the density of positive values; b – interquartile range (box, 50% of the realizations of the random variable with the highest density), median (vertical line separating the box), spread (limited segments to the right and left of the box) and individual outliers (points behind the line segments), which can be perceived as atypical values for a given distribution.

Download (765KB)
3. Figure 2. Line graphs of pairwise comparison of the number of diseases in men and women by years, ‖∙‖ – relative distance between pairs of normalized lines: a – diagnosis J33.0, ‖∙‖=0.00036; b – diagnosis J33.1, ‖∙‖=0.1118; c – diagnosis J33.8, ‖∙‖=0.0104; d – diagnosis J33.9, ‖∙‖=0.0090.

Download (954KB)
4. Figure 3. Estimation of distribution density for J33.0 by districts for the period 2017–2021 (visual evaluation for argument sign > 0); the vertical solid line is the distribution median; vertical dotted line – average estimate: Mx – average, max – the maximum number taken into account when approximating the density: a – incidence; b – prevalence.

Download (816KB)
5. Figure 4. Regression and prediction of disease prevalence, diagnosis J33.0.

Download (830KB)
6. Figure 5. Regression and prognosis of the primary prevalence of the disease, diagnosis J33.0.

Download (822KB)

Copyright (c) 2023 Palevskaya S.A., Gushchin A.V., Blashentsev M.K.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».