Проверка гипотез исследования с использованием языка R

Обложка

Цитировать

Аннотация

Для современных учёных становятся всё более важными компетенции в области статистической обработки данных. Очевидными преимуществами открытого программного обеспечения (open-source software) для статистического анализа являются доступность и многофункциональность. Наиболее широкими возможностями среди бесплатных решений обладают язык программирования и соответствующее программное обеспечение R, доступное в виде минималистичного консольного интерфейса или полноценной среды разработки RStudio/Posit.

Предлагаем вашему вниманию практическое руководство по сравнению двух групп с помощью инструментов языка R на примере сопоставления эффективной дозы, полученной при проведении стандартной компьютерной и низкодозной компьютерной томографии при COVID-19, в котором кратко обобщены теоретические подходы к обработке медицинских данных, а также рекомендации по корректной формулировке задач исследования и выбора оптимальных методов статистического анализа.

Основная задача практического руководства ― познакомить читателя с интерфейсом Posit и базовым функционалом языка R на практическом примере решения реальной медицинской задачи. Представленный материал может быть полезен на начальном этапе освоения статистического анализа с помощью инструментов языка R.

Об авторах

Иван Андреевич Блохин

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: i.blokhin@npcmr.ru
ORCID iD: 0000-0002-2681-9378
SPIN-код: 3306-1387
Россия, Москва

Мария Романовна Коденко

Научно-практический клинический центр диагностики и телемедицинских технологий; Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)

Email: KodenkoMR@zdrav.mos.ru
ORCID iD: 0000-0002-0166-3768
SPIN-код: 5789-0319
Россия, Москва; Москва

Юлия Федоровна Шумская

Научно-практический клинический центр диагностики и телемедицинских технологий; Первый Московский государственный медицинский университет имени И.М. Сеченова (Сеченовский Университет)

Email: ShumskayaYF@zdrav.mos.ru
ORCID iD: 0000-0002-8521-4045
SPIN-код: 3164-5518
Россия, Москва; Москва

Анна Павловна Гончар

Научно-практический клинический центр диагностики и телемедицинских технологий

Email: a.gonchar@npcmr.ru
ORCID iD: 0000-0001-5161-6540
SPIN-код: 3513-9531
Россия, Москва

Роман Владимирович Решетников

Научно-практический клинический центр диагностики и телемедицинских технологий

Автор, ответственный за переписку.
Email: r.reshetnikov@npcmr.ru
ORCID iD: 0000-0002-9661-0254
SPIN-код: 8592-0558

к.ф.-м.н.

Россия, Москва

Список литературы

  1. Emerson J.D., Colditz G.A. Use of statistical analysis in the New England Journal of Medicine // New Engl J Med. 1983. Vol. 309, N 12. P. 709–713. doi: 10.1056/NEJM198309223091206
  2. Ali Z., Bhaskar S.B. Basic statistical tools in research and data analysis // Indian J Anaesth. 2016. Vol. 60, N 9. P. 662–669. doi: 10.4103/0019-5049.190623
  3. Mishra P., Pandey C.M., Singh U., et al. Selection of appropriate statistical methods for data analysis // Ann Card Anaesth. 2019. Vol. 22, N 3. P. 297–301. doi: 10.4103/aca.ACA_248_18
  4. Dwivedi A.K., Shukla R. Evidence-based statistical analysis and methods in biomedical research (SAMBR) checklists according to design features // Cancer Rep (Hoboken). 2020. Vol. 3, N 4. P. e1211. doi: 10.1002/cnr2.1211
  5. Rigby P.C., German D.M., Cowen L,. et al. Peer review on open-source software projects: Parameters, statistical models, and theory // ACM Trans Softw Eng Methodol. 2014. Vol. 23, N 4. P. 35.
  6. Culpepper S.A., Aguinis H. R is for revolution: A cutting-edge, free, open source statistical package // Organizational Research Methods. 2011. Vol. 14, N 4. P. 735–740.
  7. Ihaka R., Gentleman R. R: A language for data analysis and graphics // J Computational Graphical Statistics. 1996. Vol. 5, N 3. P. 299–314. doi: 10.1080/10618600.1996.10474713
  8. Niu G., Segall R.S., Zhao Z., et al. A survey of open source statistical software (OSSS) and their data processing functionalities // Int J Open Source Software Processes. 2021. Vol. 12, N 1. P. 1–20. doi: 10.4018/IJOSSP.2021010101
  9. Shatenok M.P., Ryzhov S.A., Lantukh Z.A., et al. Patient dose monitoring software in radiology // Digital Diagnostics. 2022. Vol. 3, N 3. P. 212–230. doi: 10.17816/DD106083
  10. Druzhinina U.V., Ryzhov S.A., Vodovatov A.V., et al. Coronavirus Disease-2019: Changes in computed tomography radiation burden across Moscow medical facilities // Digital Diagnostics. 2022. Vol. 3, N 1. P. 5–15. doi: 10.17816/DD87628
  11. Gombolevskiy V., Morozov S., Chernina V., et al. A phantom study to optimise the automatic tube current modulation for chest CT in COVID-19 // Eur Radiol Exp. 2021. Vol. 5, N 1. P. 21. doi: 10.1186/s41747-021-00218-0
  12. Blokhin I., Gombolevskiy V., Chernina V., et al. Inter-observer agreement between low-dose and standard-dose CT with soft and sharp convolution kernels in COVID-19 pneumonia // J Clin Med. 2022. Vol. 11, N 3. P. 669. doi: 10.3390/jcm11030669
  13. Blokhin I.A., Gonchar A.P., Kodenko M., et al. Impact of body mass index on the reliability of the CT0–4 grading system: A comparison of computed tomography protocols: 2 // Digital Diagnostics. 2022. Vol. 3, N 2. P. 108–118. doi: 10.17816/DD104358
  14. Kennedy-Shaffer L. Before p<0.05 to beyond p<0.05: Using history to contextualize p-values and significance testing // Am Stat. 2019. Vol. 73, Suppl. 1. P. 82–90. doi: 10.1080/00031305.2018.1537891
  15. Romão X., Delgado R., Costa A. An empirical power comparison of univariate goodness-of-fit tests for normality // J Statist Computation Simulat. 2010. Vol. 80, N 5. P. 545–591. doi: 10.1080/00949650902740824
  16. Lumley T., Diehr P., Emerson S., Chen L. The importance of the normality assumption in large public health data sets // Ann Rev Pub Health. 2002. Vol. 23, N 1. P. 151–169. doi: 10.1146/annurev.publhealth.23.100901.140546
  17. Mishra P., Pandey C.M., Singh U., et al. Descriptive statistics and normality tests for statistical data // Ann Card Anaesth. 2019. Vol. 22, N 1. P. 67–72. doi: 10.4103/aca.ACA_157_18

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Интерфейс программы Posit с указанием областей консоли, окружения и файлового менеджера.

Скачать (207KB)
3. Рис. 2. Интерфейс Posit после импорта файла: в левом верхнем квадранте экрана появилось окно с загруженными столбцами набора данных, а в правом верхнем квадранте указано количество столбцов (variables) и строк (obs., от англ. observations ― наблюдения).

Скачать (253KB)
4. Рис. 3. Создание отдельной переменной для эффективной дозы компьютерной томографии с указанием функции каждого элемента команды.

Скачать (141KB)
5. Рис. 4. Окно Posit после импорта файла и присвоения значений переменным: в правом верхнем квадранте появились новые переменные с предпросмотром первых пяти значений в каждой, в левом нижнем квадранте ― консольный интерфейс для выполнения команд.

Скачать (217KB)
6. Рис. 5. Область с консольным интерфейсом Posit. Проверка нормальности распределения данных тестом Шапиро–Уилка.

Скачать (190KB)
7. Рис. 6. Проведение теста Уилкоксона с указанием функции каждого элемента команды.

Скачать (124KB)
8. Рис. 7. Проверка нулевой гипотезы исследования с помощью критерия Уилкоксона.

Скачать (128KB)

© Эко-вектор, 2023

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».