Моделирование товарооборота кофеен на основе пространственных данных

Обложка
  • Авторы: Иванов И.Д.1, Аблязина Н.Х.2, Гринева Н.В.3
  • Учреждения:
    1. ООО «БСТ Диджитал»
    2. Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации
    3. Финансовый университет при Правительстве Российской Федерации
  • Выпуск: Том 19, № 3 (2023)
  • Страницы: 167-178
  • Раздел: Математические, статистические и инструментальные методы в экономике
  • URL: https://bakhtiniada.ru/2541-8025/article/view/145614
  • EDN: https://elibrary.ru/MFRRXN
  • ID: 145614

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Актуальность статьи заключается в важности задачи размещения для экономических показателей организаций и росте в последние годы интереса к применению пространственных данных в системах поддержки принятия решений. Целью работы является моделирование оценки влияния значимых пространственных факторов для прогнозирования товарооборота кофеен. В рамках статьи проанализированы некоторые подходы, где сочетаются пространственные данные с машинным обучением для решения задачи размещения. Осуществлен корреляционный анализ пространственных данных. Произведен многоступенчатый отбор факторов для двух наборов, релевантных для разных типов моделей. Произведен подбор гиперпараметров для выбранных методов моделирования (линейная регрессия, решающее дерево, случайный лес, градиентный бустинг) и проведено построение моделей. Главными инструментами стали язык программирования Python и его библиотеки pandas, sklearn, XGBoost, hyperopt, shap, boostaroota. Проведен анализ полученных результатов и выделена модель на основе градиентного бустинга как оптимальная с точки зрения точности и интерпретации. Результатом работы является созданный подход к моделированию экономических показателей компании при помощи машинного обучения на основе пространственных данных.

Об авторах

Иван Дмитриевич Иванов

ООО «БСТ Диджитал»

Email: ivanzivanov@yandex.ru
ORCID iD: 0009-0007-7496-3212

руководитель

Россия, Москва

Наиля Хамитовна Аблязина

Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации

Email: nellykluchkovskaya@gmail.com
ORCID iD: 0009-0007-2208-3782
SPIN-код: 1145-0772

Институт ЭМИТ

Россия, Москва

Наталья Владимировна Гринева

Финансовый университет при Правительстве Российской Федерации

Автор, ответственный за переписку.
Email: ngrineva@fa.ru
ORCID iD: 0000-0001-7647-5967
SPIN-код: 1140-9636

кандидат экономических наук, доцент, доцент Департамента анализа данных и машинного обучения

Россия, Москва

Список литературы

  1. Ананьев А. Ю., Гаевой С. В., Островский А. А. Применение геоэкономического имитационного моделирования для решения задач малого и среднего бизнеса // Известия Волгоградского государственного технического университета. —2011. —№. 11. —С. 73–76.
  2. Булычев Д. М. Прогнозирование результатов экспертного оценивания точек продаж с помощью нейронной сети // Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление. —2019. —№. 4. —С. 65–74.
  3. Калинкина Г. Е., Маратканов С. В., Габдуллин В. М. Количественная оценка спроса в целях поиска максимально эффективных мест расположения предприятий торговли с помощью геомаркетинга // Вестник Ижевского государственного технического университета. —2012. —№. 4. —С. 57–60.
  4. Наумов А. С., Рубанов И. Н., Аблязина Н. Х. Новые подходы к типологии сельских территорий России //Вестник Московского университета. Серия 5. География. —2021. —№. 4. —С. 12–24.
  5. Тахтаров И. А., Сергеев А. В. Разработка и исследование технологии геомаркетинга на основе транспортных факторов и нелинейной регрессионной модели // Сборник трудов III международной конференции и молодежной школы «Информационные технологии и нанотехнологии» (ИТНТ-2017). —Самара: Новая техника. —2017. —С. 702–706.
  6. ЦИАН. URL: https://www.cian.ru/ (дата обращения: 20.09.2022).
  7. Яндекс.Карты. URL: https://yandex.ru/maps/ (дата обращения: 25.05.2022).
  8. Burges C. et al. Learning to rank using gradient descent // Proceedings of the 22nd international conference on Machine learning. —2005. —С. 89–96.
  9. Karamshuk D. et al. Geo-spotting: mining online location-based services for optimal retail store placement // Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. —2013. —С. 793–801.
  10. Kursa M. B., Rudnicki W. R. Feature selection with the Boruta package // Journal of statistical software. —2010. —Т. 36. —С. 1–13.
  11. Liu Y. et al. DeepStore: An interaction-aware wide&deep model for store site recommendation with attentional spatial embeddings // IEEE Internet of Things Journal. —2019. —Т. 6. —№. 4. —С. 7319–7333.
  12. Yin H. et al. LCARS: a location-content-aware recommender system // Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. —2013. —С. 221–229.
  13. Revealing the ‘Where’ of Business Intelligence using Location Analytics / Esri. 2012. URL: https://www.esri.com/content/dam/esrisites/sitecore-archive/Files/Pdfs/library/whitepapers/pdfs/business-intelligence-location-analytics.pdf (дата обращения: 21.05.2022).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Значения корреляций целевой переменной с различными факторами, со значением корреляции по модулю больше 0,4

Скачать (63KB)
3. Рис. 2. Взаимосвязь фактора «Суммарный мобильный трафик по средней доходной группе в радиусе 700 м» с целевой переменной

Скачать (37KB)
4. Рис. 3. Взаимосвязь фактора «Пешеходный трафик в радиусе 140 м» с целевой переменной

Скачать (33KB)
5. Рис. 4. Взаимосвязь фактора «Средняя цена квадратного метра в радиусе 300 м» с целевой переменной

Скачать (32KB)
6. Рис. 5. Взаимосвязь фактора «Рейтинг покупательской активности объектов в категории «Косметика» в радиусе 500 м» с целевой переменной

Скачать (40KB)
7. Рис. 6. Взаимосвязь фактора «Суммарное количество объектов в категории «ВУЗы» в радиусе 500 м» с целевой переменной

Скачать (44KB)
8. Рис. 7. Взаимосвязь фактора «Среднее количество объектов в категории «Пункты выдачи» в радиусе 5 м» с целевой переменной

Скачать (37KB)
9. Рис. 8. Взаимосвязь фактора «Утренний автомобильный трафик работающих в радиусе 300 м» с целевой переменной

Скачать (46KB)
10. Рис. 9. Алгоритм предсказания моделью решающего дерева

Скачать (30KB)
11. Рис. 10. Интерпретация модели случайного леса

Скачать (65KB)
12. Рис. 11. Интерпретация модели градиентного бустинга

Скачать (76KB)


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».