Прогнозирование и анализ прогулов студентов с использованием алгоритма машинного обучения

Обложка


Цитировать

Полный текст

Аннотация

Введение. Целью данного исследования является прогнозирование, анализ и оценка возможных причин прогулов студентов с использованием алгоритмов машинного обучения. Применяемые алгоритмы эффективны при анализе данных, полученных в результате опросов студентов.

Материалы и методы. Для изучения проблемы было проведено анкетирование, в котором приняли участие 500 студентов в возрасте 18–25 лет. Исследование проводилось на основе количественного метода сбора данных, при котором были получены числовые и стандартизированные значения, что привело к установлению взаимосвязей и тенденций на основе научных материалов. На втором этапе такой алгоритм использовался для анализа полученных результатов.

Результаты исследования. Определены факторы, влияющие на пропуск занятий: занятость студентов, территориальная удаленность от вуза, проблемы со здоровьем. Для решения указанных проблем авторами даны рекомендации руководителям вузов. Результаты исследования подтвердили, что использование методов классификации и конкретных анализируемых алгоритмов служит хорошим инструментом для анализа поставленных задач.

Обсуждение и заключение. Представленная в статье анкета может широко применяться в любом учебном заведении. Однако результаты данного исследования нельзя обобщать на студенческое и молодежное население других регионов или стран. Материалы статьи будут полезны для совершенствования учебно-воспитательного процесса в вузе.

Об авторах

Линдита Мукли

Университет Александра Моисиу Дурреса

Автор, ответственный за переписку.
Email: linditamukli@uamd.edu.al
ORCID iD: 0000-0003-4472-0053

декан факультета информационных технологий, преподаватель кафедры математики, доктор философии, доцент

Албания, Дуррес

Амарилдо Риста

Университет Александра Моисиу Дурреса

Email: amrildorista@gmail.com
ORCID iD: 0000-0001-9471-4749

преподаватель кафедры информационных технологий 

Россия, Дуррес

Список литературы

  1. Larabi-Marie-Sainte S., Jan R., Al-Matouq A., Alabduhadi S. The Impact of Timetable on Student’s Absences and Performance. Plos one. 2021;16(6):e0253256. doi: https://doi.org/10.1371/journal.pone.0253256
  2. Marsh H.W. Students’ Evaluations of University Teaching: Research Findings, Methodological Issues, and Directions for Future Research. International Journal of Educational Research. 1987;11(3):253–388. doi: https://doi.org/10.1016/0883-0355(87)90001-2
  3. Paulsen M.B. Evaluating Teaching Performance. New Directions for Institutional Research. Special Issue: Evaluating Faculty Performance. 2002;(114):5–18. doi: https://doi.org/10.1002/ir.42
  4. Richardson J.T. Instruments for Obtaining Student Feedback: A Review of the Literature. Assessment & Evaluation in Higher Education. 2005;30(4):387–415. doi: https://doi.org/10.1080/02602930500099193
  5. Childs J., Lofton R. Masking Attendance: How Education Policy Distracts from the Wicked Problem (s) of Chronic Absenteeism. Educational Policy. 2021;35(2):213–234. doi: https://doi.org/10.1177/0895904820986771
  6. Bahadori M.H., Salari A., Alizadeh I., Moaddab F., Rouhi Balasi L., et al. The Root Causes of Absenteeism in Medical Students: Challenges and Strategies Ahead. Educational Research in Medical Sciences. 2020;9(2):e107120. doi: http://dx.doi.org/10.5812/erms.107120
  7. Özcan M. Student Absenteeism in High Schools: Factors to Consider. Journal of Psychologists and Counsellors in Schools. 2020. p. 1–17. doi: https://doi.org/10.1017/jgc.2020.22
  8. Balkis M., Arslan G., Duru E. The School Absenteeism among High School Students: Contributing Factors. Educational Sciences: Theory and Practice. 2016;16(6):1819–1831. doi: https://doi.org/10.12738/estp.2016.6.0125
  9. Dey I. Class Attendance and Academic Performance: A Subgroup Analysis. International Review of Economics Education. 2018;28:29–40. doi: https://doi.org/10.1016/j.iree.2018.03.003
  10. Kassarnig V., Bjerre-Nielsen A., Mones E., Lehmann S., Lassen D.D. Class Attendance, Peer Similarity, and Academic Performance in a Large Field Study. PloS ONE. 2017;12(11):0187078. doi: https://doi.org/10.1371/journal.pone.0187078
  11. Wadesango N., Machingambi S. Causes and Structural Effects of Student Absenteeism: A Case Study of Three South African Universities. Journal of Social Sciences. 2011;26(2):89–97. doi: https://doi.org/10.1080/09718923.2011.11892885
  12. Young B.N., Benka-Coker W.O., Weller Z.D., Oliver S., Schaeffer J.W., Magzamen S. How Does Absenteeism Impact the Link between School’s Indoor Environmental Quality and Student Performance? Building and Environment. 2021;203:108053. doi: https://doi.org/10.1016/j.buildenv.2021.108053
  13. Helm J.M., Swiergosz A.M., Haeberle H.S., Karnuta J.M., Schaffer J.L., Krebs V.E., Ramkumar P.N. Machine Learning and Artificial Intelligence: Definitions, Applications, and Future Directions. Current Reviews in Musculoskeletal Medicine. 2020;13(1):69–76. doi: https://doi.org/10.1007/s12178-020-09600-8
  14. Schuh G., Reinhart G., Prote J.P., Sauermann F., Horsthofer J., Oppolzer F., Knoll D. Data Mining Definitions and Applications for the Management of Production Complexity. Procedia CIRP. 2019;81:874–879. doi: https://doi.org/10.1016/j.procir.2019.03.217
  15. Kantardzic M. Data Mining: Concepts, Models, Methods, and Algorithms. 3rd ed. John Wiley & Sons; 2019. doi: https://doi.org/10.1002/9781119516057
  16. Niedermayer D. An Introduction to Bayesian Networks and Their Contemporary Applications. In: Holmes D.E., Jain L.C. (eds.) Innovations in Bayesian Networks. Studies in Computational Intelligence. Springer, Berlin, Heidelberg; 2008. Vol. 156. p. 117–130. doi: https://doi.org/10.1007/978-3-540-85066-3_5
  17. Bramer M. Principles of Data Mining. 3rd ed. London; 2016. doi: https://doi.org/10.1007/978-1-4471-7307-6
  18. Maalouf M. Logistic Regression in Data Analysis: An Overview. International Journal of Data Analysis Techniques and Strategies. 2011;3(3):281–299. doi: https://doi.org/10.1504/IJDATS.2011.041335
  19. Biau G., Scornet E. Rejoinder on: A Random Forest Guided Tour. TEST. 2016;25(2):264–268. doi: https://doi.org/10.1007/s11749-016-0488-0
  20. Pfahringer B., Holmes G., Kirkby R. New Options for Hoeffding Trees. In: Orgun M.A., Thornton J. (eds.) AI 2007: Advances in Artificial Intelligence. AI 2007. Lecture Notes in Computer Science. Vol. 4830. Berlin, Heidelberg: Springer; 2007. doi: https://doi.org/10.1007/978-3-540-76928-6_11
  21. Kalmegh S. Analysis of Weka Data Mining Algorithm Reptree, Simple Cart and Randomtree for Classification of Indian News. International Journal of Innovative Science, Engineering & Technology. 2015;2(2):438–446. Available at: http://ijiset.com/vol2/v2s2/IJISET_V2_I2_63.pdf (accessed 21.12.2021).
  22. Mathuria M. Decision Tree Analysis on J48 Algorithm for Data Mining. International Journal of Advanced Research in Computer Science and Software Engineering. 2013;3(6). Available at: https://www.academia.edu/4375403/Decision_Tree_Analysis_on_J48_Algorithm_for_Data_Mining (accessed 21.12.2021).
  23. Mohamed W.N.H.W., Salleh M.N.M., Omar A.H. A Comparative Study of Reduced Error Pruning Method in Decision Tree Algorithms. In: 2012 IEEE International Conference on Control System, Computing and Engineering. 2012. p. 392–397. doi: https://doi.org/10.1109/ICCSCE.2012.6487177
  24. Srivastava S. Weka: A Tool for Data Preprocessing, Classification, Ensemble, Clustering and Association Rule Mining. International Journal of Computer Applications. 2014;88(10):26‒29. Available at: https://research.ijcaonline.org/volume88/number10/pxc3893809.pdf (accessed 21.12.2021).
  25. Powers D.M. Evaluation: From Precision, Recall and F-measure to ROC, Informedness, Markedness and Correlation. arXiv preprint arXiv. 2020;2010:16061. doi: https://doi.org/10.48550/arXiv.2010.16061
  26. Arlot S., Celisse A. A Survey of Cross-Validation Procedures for Model Selection. Statistics Surveys. 2010;4:40–79. doi: https://doi.org/10.1214/09-SS054

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Мукли Л., Риста А., 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Журнал "Интеграция образования" основан в 1996 году.
Реестровая запись ПИ № ФС 77-70142 от 16 июня 2017 г.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».