Алгоритмы координатного индексирования с учетом классификационных признаков-терминов по предметной области

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Библиотеки и лица, осуществляющие поиск в Интернете, все больше разочаровываются в результатах тематического доступа, отчасти из-за неуправляемости широкими наборами поисковых систем. Необходимость повышения точности и ограничения размеров поисковых запросов стала основным мотивом для написания этой работы. Цель этой статьи - исследовать алгоритмы координатного индексирования с учетом классификационных признаков-терминов по предметной области. Работа писалась с использованием метода материального моделирования. Использовались уже существующие модели, которые предлагают частичную координацию как основополагающую для подтверждения их эффективности на практике. Для анализа численных результатов использовался метод измерения. В представленном исследовании были представлены особенности и характеристики частичной координации. Кроме того, были изучены преимущества частичной координации. Предлагаемая авторами методология фокусируется на преимуществах «умного» запроса, который может быть выполнен в среде OPAC без дальнейших усилий со стороны пользователя; пользователь вводит свои ключевые слова, как и раньше, но «умное» координации ключевых слов в документах позволяет избежать неподходящих частичных совпадений. Порядок ранжирования документов по вопросу должен быть одинаково включен с теми непроверенными записями, в которых отсутствует частичная координация частичных документов.

Об авторах

Дархан Оракбаевич Жаксыбаев

Евразийский национальный университет имени Л.Н. Гумилева

Email: zhaxybayev6717-1@murdoch.in
докторант кафедры информационных систем Новосибирск, Российская Федерация

Владимир Борисович Барахнин

Федеральный исследовательский центр информационных и вычислительных технологий; Новосибирский государственный университет

Email: barakhnin@nanyang-uni.com
доктор технических наук; доцент лаборатории цифровых двойников и анализа больших данных; доцент кафедры математического моделирования механико-математического факультета Новосибирск, Российская Федерация

Список литературы

  1. Armitage J.E., Lynch M.F. Some structural characteristics of articulated subject indexes // Information Storage and Retrieval. 1968. Vol. 4. Pp. 101-111.
  2. Barash Y., Guralnik G., Tau N. et al. Comparison of deep learning models for natural language processing-based classification of non-English head CT reports // Neuroradiology. 2020. Vol. 62. No. 10. Pp. 1247-1256.
  3. Beaulieu M., Borgman C.L. A new era for OPAC research: Introduction to the special topics issue on current research in online public access systems // Journal of the American Society for Information Science. 1996. Vol. 47. No. 7. Pp. 491-492.
  4. Chakraborty A., Pawar A., Jang H. et al. A real-time feature indexing system on live video streams // 44th IEEE Annual Computers, Software, and Applications Conference. Madrid: Institute of Electrical and Electronics Engineers Inc. 2020. Pp. 42-50.
  5. Croft W.B. Approaches to intelligent information retrieval // Information Processing & Management. 1987. Vol. 23. No.4. Pp. 249-254.
  6. Endres T., Kranzdorf L., Schneider V., Renkl A. It matters how to recall - task differences in retrieval practice // Instructional Science. 2020. Vol. 48. No. 6. Pp. 699-728.
  7. Gavit B.K. Web based library services // Library Philosophy and Practice. 2019. Vol. 2019. P. 2931.
  8. Guo J., Fan Y., Pang L. et al. A deep look into neural ranking models for information retrieval // Information Processing and Management. 2020. Vol. 57. No. 6. P. 102067.
  9. Gupta D., Berberich K. Optimizing hyper-phrase queries // 10th International Conference on the Theory of Information Retrieval. New York: Association for Computing Machinery. 2020. Pp. 41-48.
  10. Hosey C., Vujovic L., St. Thomas B. et al. Just give me what I want: How people use and evaluate music search // Conference on Human Factors in Computing Systems. Glasgow: Association for Computing Machinery. 2019. P. 147770.
  11. Ioannakis G., Koutsoudis A., Pratikakis I., Chamzas C. RETRIEVAL - an online performance evaluation tool for information retrieval methods // IEEE Transactions on Multimedia. 2018. Vol. 20. No. 1. Pp. 119-127.
  12. Jiang J., Han R., Meng X., Li K. TSASC: Tree-seed algorithm with sine-cosine enhancement for continuous optimization problems // Soft Computing. 2020. Vol. 24. No. 24. Pp. 18627-18646.
  13. Kalinauskaite D. Detecting information-dense texts: Towards an automated analysis // International Conference on Information Technologies. 2018. Vol. 2145. Pp. 95-98.
  14. Kanev A.I., Terekhov V.I. Evaluation issues of query result ranking for semantic search // 7th International Young Scientists Conference on Information Technology. 2020. Vol. 1694. No. 1. P. 012004.
  15. Kiss A.N., Libaers D., Barr P.S. et al. CEO cognitive flexibility, information search, and organizational ambidexterity // Strategic Management Journal. 2020. Vol. 41. No. 12. Pp. 2200-2233.
  16. Kumar R., Singh J., Singh B., Rana M.K. Usability of OPAC in university libraries // Library Philosophy and Practice. 2018. Vol. 1. Pp. 1-11.
  17. Li W., Zhang S., Qi G. A graph-based approach for resolving incoherent ontology mappings // Web Intelligence. 2018. Vol. 16. No. 1. Pp. 15-35.
  18. Liu C., Huai H. An improved full-text retrieval for elementary education resource database system // Journal of Physics: Conference Series. 2020. Vol. 1693. No. 1. P. 012053.
  19. Luong D.D., Phuong V.Q., Tung H.D.T. A new indexing technique XR+ tree for bio informatics XML data compression // International Journal of Engineering and Advanced Technology. 2019. Vol. 8. No. 5. Pp. 1168-1173.
  20. Mehta K., Foster I., Klasky S. et al. A codesign framework for online data analysis and reduction // The International Conference for High Performance Computing, Networking, Storage and Analysis. Denver: Institute of Electrical and Electronics Engineers Inc, 2019. Pp. 11-20.
  21. Moffat A., Scholer F., Yang Z. Estimating measurement uncertainty for information retrieval effectiveness metrics // Journal of Data and Information Quality. 2018. Vol. 10. No. 3. P. 10.
  22. Murzin F., Perfliev A., Shmanina T. Methods of syntactic analysis and comparison of constructions of a natural language oriented to use in search systems // Bulletin of the Novosibirsk Computing Center, Series: Computer Science. 2010. No. 31. Pp. 91-109.
  23. Nori R., Palmiero M., Giusberti F. et al. Web searching and navigation: Age, intelligence, and familiarity // Journal of the Association for Information Science and Technology. 2020. Vol. 71. No. 8. Pp. 902-915.
  24. Steinberg D., Metz P. User response to and knowledge about an online catalog // College & Research Libraries. 1984. Vol. 45. No. 1. Pp. 66-70.
  25. Thomas P., Billerbeck B., Craswell N., White R.W. Investigating searchers’ mental models to inform search explanations // ACM Transactions on Information Systems. 2019. Vol. 38. No. 1. P. 10.
  26. Yi L., Yuan R., Long S., Xue L. Expert information automatic extraction for IoT knowledge base // Procedia Computer Science. 2019. Vol. 147. Pp. 288-294.
  27. Бахтурина Т.А., Сукиасян Э.Р. Современная каталогизационная терминология. М.: Москва, 1992.
  28. Лезин Г.В., Тузов В.А. Семантический анализ текста на русском языке: семантико-синтаксическая модель предложения // Экономико-математические исследования: математические модели и информационные технологии. СПб.: Наука, 2003.
  29. Некрестьянов И.C. Тематико-ориентированные методы информационного поиска. СПб.: Санкт-Петербургский гос. ун-т, 2000.
  30. Ножов И.М. Морфологическая и синтаксическая обработка текста (модели и программы). М.: Москва, 2003.
  31. Широков А.В. Разработка модели информационного портрета пользователя для персонифицированного поиска // Отчеты конкурса научных проектов в области информационного поиска «Интернет-математика» [Электронный ресурс]. URL: http://company.yandex.ru/academic/grant/report2007.xml (дата обращения: 26.12.2020).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».