INTELLIGENT DATA ANALYSIS IN BIOMEDICAL RESEARCH: CLASSIFICATION TREES

Cover Page

Cite item

Full Text

Abstract

Modern analytical tasks in biomedical research require increasingly sophisticated methods of data analysis. In recent years, the term data analysis is not only related to classical statistical tests for hypothesis testing and correlation analysis for studying associations between variables. Classification tree or decision tree analysis is getting more and more frequently used in biomedical research. In this paper we present the use of classification trees in biomedical research and provide examples of their construction in the most commonly used statistical programs. The article is constructed as a problem solving exercise using classification trees with an example of a data set for creation of classification trees and description of how to build a classification tree model in IBM SPSS Statistics and StatSoft Statistica software. Moreover, we provide recommendations on how the results of this analysis should be presented in a scientific article. The use of the classification trees has a potential to contribute to better understanding of the factors behind the observed phenomena in medicine and biology.

About the authors

A. N. Narkevich

Voino-Yasenetsky Krasnoyarsk State Medical University

Email: narkevichart@gmail.com
доктор медицинских наук, зав. лабораторией медицинской кибернетики и управления в здравоохранении, зав. кафедрой медицинской кибернетики и информатики Krasnoyarsk, Russia

K. A. Vinogradov

Voino-Yasenetsky Krasnoyarsk State Medical University

Krasnoyarsk, Russia

A. M. Grjibovski

Northern State Medical University; West Kazakhstan Marat Ospanov Medical University; Al-Farabi Kazakh National University; M. K. Ammosov North-Eastern Federal University

Arkhangelsk, Russia

References

  1. Гржибовский А. М., Иванов С. В., Горбатова М. А. Однофакторный линейный регрессионный анализ с использованием программного обеспечения Statistica и SPSS // Наука и здравоохранение. 2017. № 2. С. 5-33
  2. Калагина Л. С., Сморкалова В. М., Зобкова Т. И. Деревья классификации в прогнозировании исходов гепатита Аудетей // Медицинский альманах. 2011. № 4. С. 207-210
  3. Калагина Л. С., Сморкалова В. М., Зобкова Т. И. Математическая модель прогнозирования исходов легкой формы гепатита B у детей // Педиатрия. Журнал им. Г. Н. Сперанского. 2012. Т. 91, № 4. С. 156-159
  4. Кондрова Н. С., Зулькарнаев Т. Р., Франц М. В. Потенциал здоровья работников как компонент человеческого потенциала организации // Гигиена и санитария. 2018. Т. 97, № 2. С. 164-171
  5. Константинова Е. Д., Вараксин А. Н., Жовнер И. В. Определение основных факторов риска развития неинфекционных заболеваний: метод деревьев классификации // Гигиена и санитария. 2013. Т. 92, № 5. С. 69-72
  6. Наркевич А. Н., Виноградов К. А. Настольная книга автора медицинской диссертации: пособие. М.: Инфра-М, 2019. 454 с
  7. Наркевич А. Н, Виноградов К. А., Корецкая Н. М., Наркевич А. А. Использование прогностических математических моделей для выявления больных туберкулезом легких // Туберкулез и болезни легких. 2014. № 9. С. 44-45
  8. Фомина Е. Е. Возможности метода деревьев классификации при обработке социологической информации // Гуманитарный вестник. 2018. № 11. С. 5
  9. Халафян А. А., Виноградов Р. А., Акиньшина В. А., Кошкаров А. А. Система поддержки принятия решений при выборе тактики коррекции стеноза внутренних сонных артерий // Врач и информационные технологии. 2018. № 2. С. 29-38
  10. Харевич О. Н., Лаптева И. М., Лаптева Е. А., Королева Е. Г. Клинические фенотипы тяжелой астмы (по результатам кластерного анализа) // Вестник Санкт-Петербургского университета. Медицина. 2015. № 2. С. 28-39
  11. Шарашова Е. Е., Холматова К. К., Горбатова М. А., Гржибовский А. М. Применение множественного логистического регрессионного анализа в здравоохранении с использованием пакета статистических программ SPSS // Наука и здравоохранение. 2017. № 4. С. 5-26
  12. Bamber J. H., Evans S. A. The value of decision tree analysis in planning anaesthetic care in obstetrics. International Journal of Obstetric Anesthesia. 2016. 27, pp. 55-61. doi: 10.1016/j.ijoa.2016.02.007.
  13. Ben-Gal I., Dana A., Shkolnik N., Singer G. Efficient Construction of Decision Trees by the Dual Information Distance Method. Quality Technology & Quantitative Management. 2014, 11 (1), pp. 133-147.
  14. Bewick V, Cheek L., Ball J. Statistics review 14: Logistic regression. Critical Care. 2005, 9 (1), pp. 112-118.
  15. Bewick V, Cheek L., Ball J. Statistics review 7: Correlation and regression. Critical Care. 2003, 7 (6), pp. 451-459.
  16. Deng H., Runger G., Tuv E. Bias of importance measures for multi-valued attributes and solutions. Proceedings of the 21st International Conference on Artificial Neural Networks (ICANN). 2011, pp. 293-300.
  17. Distinguin L., Blanchard M., Rouillon I., Parodi M., Loundon N. Pediatric cochlear reimplantation: Decision-tree efficacy. European Annals of Otorhinolaryngology, Head and Neck Diseases. 2018, 135 (4), pp. 243-247. DOI: 10.1016/j. anorl.2018.05.002.
  18. Garonzik-Wang J. M., Majella Doyle M. B. Decision Tree for Liver Resection for Hepatocellular Carcinoma. JAMA Surgery. 2016, 151 (9), pp. 853-854. DOI: 10.1001/ jamasurg.2016.1 149.
  19. Laurent H., Rivest R. L. Constructing Optimal Binary Decision Trees is NP-complete. Information Processing Letters. 1976, 5 (1 ), pp. 15-17. doi: 10.1016/0020-0190(76)90095-8.
  20. Schneider A., Hommel G., Blettner M. Linear Regression Analysis. Part 14 of a Series on Evaluation of Scientific Publications. Deutsches Ärzteblatt International. 2010, 107 (44), pp. 776-782.
  21. Suzuki S., Ukiya T., Kawauchi Y., Ishii H., Sugihara N. Decision tree analysis for factors associated with dental caries in school-aged children in Japan. Community Dental Health Journal. 2018, 35 (4), pp. 247-251. DOI: 10.1922/ CDH_4409Suzuki05.
  22. Tayefi M., Esmaeili H., Saberi Karimian M., Amirabadi Zadeh A., Ebrahimi M., Safarian M., Nematy M., Parizadeh S. M. R., Ferns G. A., Ghayour-Mobarhan M. The application of a decision tree to establish the parameters associated with hypertension. Computer Methods and Programs in Biomedicine. 2017, 139, pp. 83-91. DOI: 10.1016/j. cmpb.2016.10.020.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2021 Narkevich A.N., Vinogradov K.A., Grjibovski A.M.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
 


Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).