Использование семантического анализа для автоматизированного выявления хайповых технологий
- Авторы: Логинова И.В.1, Пиекалнитс А.С.1, Соколов А.В.1
-
Учреждения:
- Институт статистических исследований и экономики знаний НИУ «Высшая школа экономики»
- Выпуск: Том 38, № 1 (2025)
- Страницы: 17-26
- Раздел: Статьи
- URL: https://bakhtiniada.ru/0236-235X/article/view/290491
- DOI: https://doi.org/10.15827/0236-235X.149.017-026
- ID: 290491
Цитировать
Полный текст
Аннотация
Предметом проведенного исследования являются завышенные общественные ожидания от новых технологий (хайпов). В статье представлены результаты разработки и апробации методики автоматизированного выявления хайпов среди технологических тематик на основе их текстового следа на примере сферы цифровых технологий. Количество новых технологических разработок в мире постоянно растет, однако реальный потенциал их практического применения может сильно различаться. Важно понимание надежных факторов, позволяющих отличать тренды от хайпов. К числу возможных признаков хайпов отраслевые и технологические эксперты предлагают относить, как правило, отсутствие устойчивой бизнес-модели, несформированный или заведомо ограниченный потребительский рынок, большое количество более эффективных альтернатив. Выявление хайпов в технологической повестке было и остается сложной аналитической задачей. Это обусловлено несогласованностью терминологического аппарата, экспертной природой задачи, недостаточно развитыми методологическими подходами, отсутствием конкретных технических инструментов. Описываемая в статье методика включает извлечение методами обработки естественного языка и компьютерной лингвистики из нескольких десятков миллионов текстовых документов различных типов (научные публикации, патенты, рыночная аналитика) терминов, означающих технологии, расчет объективной меры хайповости каждой технологии, а также построение визуальной карты – наглядного представления ландшафта технологий, позволяющего отделить устойчивые тренды от потенциальных хайпов (тематик с высоким значением показателя хайповости). Хайп-карты в комплексе с другими аналитическими результатами могут использовать лица, принимающие решения, в задачах выявления приоритетных направлений развития, анализа текущих и прогнозирования будущих трендов, риск-менеджмента.
Ключевые слова
Полный текст
Введение. Потребность в выработке прикладных решений, направленных на автоматизацию задач технологической и стратегической аналитики, обусловлена рядом вызовов. Риски управленческих ошибок при стратегически значимом выборе велики, поэтому аналитика данных как процесс информационного обеспечения принятия стратегических решений должна опираться на полные и достоверные источники сведений, носить объективный и доказательный характер, а обеспечение информацией лица, принимающего решения, должно быть своевременным и релевантным (сфокусированным). Значительное влияние на деятельность технологических компаний, в частности, на формирование их научно-технологических и продуктово-рыночных стратегий, инвестиционные решения, управление ресурсами, оказывают хайпы, что повышает потребность в разработке надежных подходов для их выявления.
Хайп в контексте данной статьи означает повышенный ажиотаж к определенной теме, продукту, явлению, событию и др. [1]. Нередко в литературе под хайпом понимается избыточный, чрезмерно высокий интерес к чему-либо, за которым так или иначе следует снижение шумихи, а часто – разочарование [2, 3]. Данный феномен особенно ярко выражен в сфере технологий, где инновации проходят через несколько фаз хайпа, характеризующихся первоначальным повышенным вниманием, последующим снижением ажиотажа и окончательной стабилизацией – восстановлением или падением интереса.
Концепция хайп-цикла, или хайп-кривой, разработанная компанией Gartner, иллюстрирует такую динамику, показывая, как технологии проходят через определенные стадии хайпа: триггер инновации, пик завышенных ожиданий, дно разочарований, склон просветления и плато продуктивности (https://www.gartner.com/en/research/methodologies/gartner-hype-cycle). В литературе выделяется ряд ограничений хайп-цикла как инструмента оценки технологической зрелости, обусловленных методологическими изъянами [4], однако критики модели Gartner замечают, что сама концепция хайпа остается перспективной для применения в задачах технологического прогнозирования [4, 5]. Кроме того, хайп-цикл как продукт является источником данных для того, чтобы сделать технологическое прогнозирование более контролируемым, повторяемым и проверяемым, что подтверждается экспериментами по обучению модели машинного обучения (модели ML – Machine Learning) для решения задачи предсказания потенциально разрушительных технологий [6].
В настоящей статье хайп рассматривается как первая стадия формирования устойчивого во времени тренда, являющего собой накопленный концентрированный общественный запрос на решение какой-то конкретной задачи (https://lab-w.com/method_meetup/trendwatching). При этом хайп проявляет себя посредством различных сигналов, часть из которых характеризуются изначально высокой популярностью в результате высокого резонанса обсуждений в СМИ.
Возможности автоматизации аналитической задачи по выявлению хайпов часто оцениваются критически из-за необходимости учитывать контекстуальные и психологические факторы данного явления. Частичная автоматизация задачи выявления хайпов подразумевает определение хайпа в терминах фактической высокой упоминаемости явления в СМИ/новостных источниках на фоне умеренной или низкой представленности этого же явления в научно-технической документации. Таким образом, кроме классических методов автоматизации (в первую очередь машинное обучение, предиктивные модели, временные ряды и др.) применительно к выявлению хайпов, необходимо подключать аналитику больших данных из специфичных для этой цели источников текстов (прежде всего социальных сетей, но также новостных сайтов, блогов, поисковых систем и т.п.), сентимент-анализ как инструмент выявления преобладающего общественного мнения. Такой комплексный инструментарий, тем не менее, будет направлен на реализацию аналитического сценария, в рамках которого исследователь работает с некоторым перечнем гипотез относительно хайпов и по результатам объективного анализа больших текстовых данных принимает решение по каждой технологии, к которой она тяготеет, – к хайпу или к обоснованной разработке. Таким образом, автоматический инструментарий, основанный на анализе текстового следа (текстовой статистики) направлений, нацелен на получение объективных оценок, которые могут быть использованы в качестве информационно-аналитической поддержки решения данной задачи. Однако эффективный подход требует сочетания автоматизированных систем с экспертным анализом для получения более точных результатов.
Обзор существующих подходов
Особое влияние на проблематику выявления и анализа хайпов оказывает стремительное развитие технологий искусственного интеллекта (ИИ). Современные генеративные языковые модели могут создавать правдоподобные синтетические тексты, которые способны влиять на общественное мнение, несмотря на свое искусственное происхождение [7]. В некоторых работах отмечается, что чат-боты, использующие передовые ИИ-технологии, могут применяться для распространения дезинформации (например, генерировать фальшивые новостные статьи, выдавая их за написанные авторитетными источниками) с минимальными затратами. Это способствует усилению эффекта хайпа вокруг технологий, оказывая негативное влияние на результаты аналитики [8].
К рискам, связанным с ИИ и использованием хайпов в задачах технологического прогнозирования, относятся появление и распространение фейков и дипфейков, применяющих такие технологии, как, например, генеративно-состязательные сети для создания реалистичного, но сфабрикованного текстового, аудио- и видеоконтента. Исследования показывают, что фейки в обозримом будущем будут оказывать воздействие, подрывающее доверие к информационным источникам, и стимулировать распространение ложных нарративов [9]. При этом современные технологии их распознавания все еще находятся на недостаточном уровне развития и требуют инвестиций в большее число фундаментальных исследований в данной области, хотя некоторые из предлагаемых методологий и достигают относительно высокой точности [10–12]. Таким образом, в условиях бурного развития технологий генеративного ИИ использование хайпов как источников данных для технологического прогнозирования и стратегической аналитики может искажать результаты и приводить к ошибочным выводам из-за наличия в данных отчасти или полностью сфальсифицированных элементов.
Поскольку хайпы зачастую связаны с неоправданно завышенными ожиданиями и подвергаются искажению за счет использования технологий ИИ, актуальна задача выявления потенциальных хайпов при проведении технологической аналитики и исключения таких хайповых тем при принятии стратегических решений. Для ее решения могут применяться как количественные, так и качественные инструменты, наиболее известным из которых является ранее упомянутый хайп-цикл Gartner, позволяющий разграничивать технологии, находящиеся на пике завышенных ожиданий и менее подверженные влиянию хайпа. Однако в силу того, что экспертная методология Gartner имеет свои ограничения, далее рассматриваются перспективные альтернативы, позволяющие более объективно выявлять и исключать хайпы на основе данных. Например, исследователи рассматривают возможности использования комплексной системы метрик, отражающих интерес к новым технологиям в различных источниках, для оценки местоположения технологий на хайп-кривой Gartner [13]. Возможность автоматизированного моделирования хайп-цикла также подтверждается в работе [14], где авторы при помощи методов машинного обучения проводят анализ текстовых данных (научных статей и патентов) для определения динамики местоположения на кривой Gartner такой технологии, как квантовый компьютер.
Наряду с описанными рассматриваются и альтернативные методики, например, структурированный качественный подход, основанный на применении критического реализма, для определения факторов, которые действительно влияют на успешное внедрение технологий. Для выявления и разграничения обоснованных прогнозов и чрезмерно оптимистичных ожиданий предлагается фокусироваться на оценке реальных, измеримых эффектов, которые могут последовать за внедрением определенной технологии: эффектах автоматизации, информационных (улучшение координации и принятия решений), а также трансформационных эффектах (трансформация рынков). Еще один пример использования качественного анализа для выявления и отделения хайпов от научно-обоснованной информации можно найти в методологии Grounded Theory (GT). Она применяется для систематического анализа литературы, субъективность которого сводится к минимуму, по блокчейн-технологиям. Обширный корпус литературы (включающий как научные, так и научно-популярные материалы) кодируется и категоризируется, после чего содержимое полученных категорий анализируется (в том числе на предмет обоснованности) и интерпретируется, позволяя выявлять хайпы в массиве текстовых данных.
Известна и смешанная методология, сочетающая применение модели ARIMA (интегрированной модели авторегрессии – скользящего среднего) и семантических сетей для выявления зарождающегося хайпа в текстовых медиа (блогах и газетах). Успешное применение подобного подхода говорит о возможности идентификации аномальных всплесков интереса в данных, в том числе и в области исследования технологий. Так, в работе [15] исследуются поведение розничных инвесторов на российском фондовом рынке, а также их склонность к иррациональным действиям под влиянием социальных сетей и хайпов вокруг определенных ценных бумаг. Авторы вводят понятие индикатора хайпа, который интегрирует рассчитываемые при помощи методов машинного обучения метрики внимания (частота упоминаний компании) и настроения (позитивная или негативная тональность сообщений в отношении компании) на основе текстовой информации из социальных сетей. По результатам исследования индикатор хайпа продемонстрировал способность выявлять необоснованные ожидания инвесторов и способствовать построению прибыльных инвестиционных стратегий. Таким образом, подобный подход позволил не только идентифицировать компании, вокруг которых формируется необоснованный ажиотаж на фондовом рынке, но и сигнализировать о возможности построения аналогичных индикаторов хайпа для технологической сферы с целью эффективного автоматизированного выявления ажиотажа вокруг технологий.
Таким образом, хайпы, зачастую оказывающиеся продуктом преувеличенных ожиданий (влиять на которые также могут манипуляции общественным сознанием при помощи и технологий ИИ), способны искажать результаты технологической аналитики, создавая ложные представления о возможностях и перспективах развития технологий. Это, в свою очередь, может нести риски для процесса принятия решений. В литературе предлагаются различные инструменты для выявления хайпов в данных с помощью как качественного анализа, так и автоматизированных количественных методологий. Отделение хайпов от обоснованной информации в условиях роста объемов данных является нелинейной в решении задачей и требует комплексных подходов к выявлению чрезмерно завышенных ожиданий. Сочетание методов анализа больших данных, реализуемых в системе iFORA, и экспертного знания помогает выявлять подозрительные явления по временным всплескам ажиотажа, разграничивать их от устойчивых трендов, а также подтверждать или опровергать соответствующие гипотезы в задачах стратегического планирования.
Методика анализа больших текстовых данных для автоматизированного выявления хайповых технологий
Подход к автоматизированному выявлению хайпов на основе данных реализован в Институте статистических исследований и экономики знаний НИУ ВШЭ с использованием собственной разработки – системы интеллектуального анализа больших данных iFORA. Это уникальная коллекция, включающая более 800 млн документов из различных источников: научные публикации, патенты, документы рыночной аналитики и профессиональных СМИ, гранты и заявки на них, аналитические и стратегические документы, вакансии, образовательные программы и др. Ключевые типы документов представлены на русском, английском и китайском языках. Семантический анализ данных основан на технологиях глубокой обработки естественного языка, интегрирующих передовые методы машинного обучения и инструменты ИИ. Система основана на модульном подходе и позволяет комбинировать специализированные блоки в зависимости от решаемых аналитических задач для поддержки принятия управленческих решений в сфере науки, технологий и инноваций. Одним из таких блоков является хайп-анализ, который включает извлечение из больших массивов текстов тематик, обозначающих в большинстве случаев технологии или технологические направления, а также выявление среди них технологий, подверженных рискам завышенных ожиданий, то есть хайпов.
Извлечение технологических тематик.
Надежное извлечение из больших массивов неструктурированных текстов терминов, обозначающих технологии и технологические направления, является результатом разработки специальных языковых (эмбеддинговых) моделей, пригодных для выделения из терминологических полей высокоспециализированных терминов (обозначающих не только технологии, но в общем случае и произвольные заданные артефакты). Извлечение терминов предполагает работу с предварительно структурированными текстовыми документами, для чего каждый документ разделяется на отдельные предложения, слова и словосочетания с различными лингвистическими характеристиками. Сами документы отбираются из БД iFORA с использованием специально заданного поискового условия (набора понятий, в достаточной мере описывающих анализируемую тематическую область) и алгоритмов «умного» семантического поиска, учитывающего контекст употребления релевантной лексики в документах. Синтаксический анализ связей между словами в предложениях таких документов позволяет выявить зависимости слов (где одно слово является управляющим, а другое зависимым) и тип их связи, основанный на контексте. Далее для отдельных слов и словосочетаний вычисляются универсальные числовые характеристики в целях перехода от лингвистического аппарата к статистическому и наоборот, что позволяет отделить термины, содержащие информацию об объекте изучения, от лингвистического шума. Наиболее часто используемыми и эффективными показателями для определения высокоинформативных терминов являются частота слов, C-value, T-score и т.д. Также о высоком качестве результатов свидетельствует такой показатель, как поточечная взаимная информация. Это относительно простая логарифмическая линейная функция, типичная для использования в нейронных сетях с целью создания высококачественных векторных представлений терминов на больших корпусах данных.
Выявление хайпов.
К извлеченным из текстов технологическим тематикам далее применяется хайп-анализ, который позволяет разделять исследуемые тематики на две категории: обоснованные тренды/технологии и хайпы, не имеющие под собой значимой научно-технической базы исследований и разработок. Другими словами, хайп-анализ служит инструментом для разграничения устойчивых трендов и кратковременных всплесков необоснованного общественного интереса к определенным темам, которые становятся излишне популярными в медиапространстве. Результаты хайп-анализа визуализируются в виде хайп-карты (рис. 1).
Рис. 1. Пример хайп-карты
Fig. 1. Example of a hype map
Хайп-карта представляет собой диаграмму рассеяния тематик, расположенных в пространстве двух осей по рассчитанным для них значениям семантических показателей значимости в двух источниках – научных публикациях/патентах и документах рыночной аналитики и профессиональных СМИ. Значимость (freqi) отражает интенсивность упоминаемости тематики в документах источника за выбранный период с учетом размера анализируемого корпуса документов:
(1)
где 𝑛i – встречаемость термина в 𝑖-й год; 𝑁i – размер корпуса документов в 𝑖-й год.
Отдельные тематики отражаются на хайп-карте круговыми значками. Высокий показатель значимости тематики указывает на ее сильную представленность в массиве документов. По оси абсцисс на хайп-карте представляются относительные показатели значимости тематик в научной или технологической повестке (рассчитываются на основе анализа научных публикаций или патентов соответственно, в отдельных случаях – по совокупному значению научных публикаций и патентов), по оси ординат – в медиаповестке (на основе анализа документов рыночной аналитики и профессиональных СМИ). За счет такого сравнения одни тематики могут быть определены как устойчивые тренды/технологии, а другие – как потенциальные хайпы.
При интерпретации данной визуализации к хайпам могут быть отнесены тематики с относительно высокой значимостью в медиапространстве и низкой в научных публикациях/патентах.
Такие тематики характеризуются высоким показателем хайповости (H), рассчитываемым как отношение значимости в двух анализируемых источниках (как правило, рассматривается отношение fregm – значимости тематики в документах рыночной аналитики и профессиональных СМИ к fregs – значимости в научных публикациях):
(2)
Чем выше данный показатель, тем с большей вероятностью ту или иную тематику можно отнести к категории хайпов. В пространстве двух осей такие тематики обычно расположены в левой верхней части хайп-карты. Размер и цвет фигурных значков могут быть одинаковыми, а могут задаваться в системе экспертно и отражать различные семантические показатели для углубленной аналитики. Таким образом, хайп-карты наглядно визуализируют отличия в уровне значимости тематик в разных источниках данных. Показатель хайповости и расположение тематик на визуализации предоставляют исследователям информацию об их относительно большей популярности в медиаповестке по сравнению с научной/технологической. Такое сравнение по типам источников позволяет выявлять гипотезы о тематиках-хайпах, вызывающих необоснованно высокий интерес. При этом целесообразно проведение дополнительного анализа хайпов для формирования более надежных выводов о причинах и предполагаемых последствиях их возникновения.
Подход к автоматизированному выявлению хайпов с использованием системы iFORA апробирован на массиве текстовых данных по направлениям исследований и разработок в сфере цифровых технологий. В рамках проведенного исследования были использованы два типа источников информации на английском языке за 2017–2022 гг., в т.ч. база научных публикаций Microsoft Academic Graph и агрегированная база зарубежных отраслевых профессиональных СМИ и рыночной аналитики.
Полученная хайп-карта представлена на рисунке 2.
Рис. 2. Хайп-карта по 50 направлениям исследований и разработок в сфере цифровых технологий
Fig. 2. Hype map for 50 research and development areas in the field of digital technologies
Направления исследований и разработок обозначены на визуализации числами от 1 до 50 и отражены в таблице. Для каждой тематики в ней также представлен рассчитанный показатель хайповости, таблица отсортирована по убыванию данного показателя.
Обозначение направлений исследований и разработок в сфере цифровых технологий, редставленных на хайп-карте
Noting research and development areas in the field of digital technologies on the hype map
Лейбл кругового значка на хайп-карте – Соответствующее направление исследований и разработок | Показатель хайповости | Лейбл кругового значка на хайп-карте – Соответствующее направление исследований и разработок | Показатель хайповости |
30 – Приложения метавселенных | 888,615 | 43 – Биометрические технологии | 3,704 |
42 – Цифровые аватары | 367,054 | 22 – Облачные технологии | 3,340 |
33 – Бескодовая разработка программного обеспечения (low-code / no-code) | 283,994 | 14 – Сенсорные системы | 2,995 |
32 – Цифровые финансовые активы | 94,551 | 11 – Интернет вещей | 2,968 |
06 – Речевая аналитика | 70,846 | 15 – Промышленная робототехника | 2,965 |
23 – Децентрализованные финансовые сервисы (DeFi) | 28,375 | 12 – Умный город | 2,841 |
01 – Интеллектуальный анализ данных | 25,276 | 04 – Системы автоматического принятия решений | 2,638 |
21 – Кибербезопасность | 22,544 | 49 – Аддитивные технологии | 2,110 |
18 – Беспилотная агротехника | 18,718 | 35 – Технологии представления и доставки образовательного материала | 1,982 |
16 – Беспилотный наземный транспорт (автомобили и общественный транспорт) | 17,604 | 26 – Системы хранения разнородных больших данных | 1,919 |
40 – Спутниковые системы связи | 16,577 | 36 – Квантовые вычисления | 1,839 |
44 – Интеллектуальные голосовые помощники | 11,925 | 41 – Системы позиционирования и навигации | 1,188 |
19 – Высокоскоростные технологии беспроводной передачи данных на малых дистанциях (WiFi, Bluetooth и др.) | 11,382 | 05 – Анализ и обработка естественного языка | 1,012 |
24 – Технологии распределенного реестра | 9,120 | 08 – Автоматизированные системы медицинской диагностики | 0,998 |
34 – Технологии управления жизненным циклом продукта | 9,026 | 25 – Распределенные вычисления | 0,884 |
17 – Технологии беспроводной передачи данных (5G, 6G и др.) | 8,719 | 29 – Преобразование и кодирование данных | 0,781 |
13 – Коллаборативные технологии | 7,249 | 37 – Квантовые коммуникации | 0,752 |
45 – Автоматическая идентификация и сбор данных | 6,491 | 03 – Компьютерное зрение | 0,734 |
21 – Цифровые двойники физических процессов | 5,317 | 47 – Технологии управления образованием | 0,589 |
10 – Когнитивные вычисления | 5,110 | 07 – Системы идентификации и анализа звукового контента | 0,465 |
28 – Системы аутентификации пользователей | 4,396 | 46 – Технологии человеко-машинного взаимодействия | 0,444 |
09 – Телемедицина | 4,314 | 38 – Фотоника | 0,354 |
50 – Адаптивное производство | 4,204 | 02 – Обучение нейросетей | 0,326 |
48 – Цифровые фабрики | 3,914 | 39 – Геоинформационные системы | 0,255 |
31 – Технологии виртуальной и дополненной реальности | 3,858 | 20 – Имитационное моделирование | 0,115 |
Кроме табличных данных о степени хайповости исследованных тематик (и связанном с нею местоположении тематики на карте), данный показатель иллюстрируется цветами круговых значков, обозначающих тематики: градиентная цветовая маркировка круговых значков указывает на степень хайповости тематик, а также позволяет визуально сравнить их между собой. Круговые значки, обозначающие тематики с высоким индексом хайповости, тяготеют к фиолетовому цвету, с низким – к серому. Размер фигурных значков отражает показатель векторной центральности тематик (усредненной семантической близости тематики со всеми другими тематиками, включенными в анализ).
По результатам проведенного анализа определены направления исследований и разработок в сфере цифровых технологий, относящиеся к устойчивым трендам (среди которых имитационное моделирование (№ 20), геоинформационные системы (№ 39), обучение нейросетей (№ 2), фотоника (№ 38), технологии человеко-машинного взаимодействия (№ 46) и др.), а также выявлены гипотезы о хайповых направлениях. К топ-6 тематикам с наибольшим показателем хайповости отнесены следующие: приложения метавселенных (№ 30), цифровые аватары (№ 42), бескодовая разработка программного обеспечения (low-code / no-code, № 33), цифровые финансовые активы (№ 32), речевая аналитика (№ 6), децентрализованные финансовые сервисы (DeFi) (№ 23).
Высокий показатель хайповости указанных направлений исследований и разработок может быть обусловлен рядом факторов, связанных с недостаточной зрелостью потребительских рынков. Прежде всего к ним относятся отсутствие или низкая степень сформированности конечных рыночных продуктов, затрудняющие массовое внедрение технологий. Так, хотя отдельные решения в области метавселенных существуют, они крайне ограничены и не достигают массового пользователя, а сама технология остается на стадии концептуального развития. Это также касается технологии цифровых аватаров, которая, несмотря на потенциальные преимущества, в том числе в сферах образования и рекламы, пока не предлагает продукты, доступные для массового использования. В условиях высокой хайповости технологий компании могут делать значительные инвестиции в их развитие, опираясь на прогнозы о быстром возврате вложений. Тем не менее отсутствие реальных прикладных решений и их практической ценности может привести к неэффективности таких инвестиций и финансовым потерям. Кроме того, дефицит знаний у пользователей о возможностях и функциональности новых технологий является значительным препятствием для их распространения. Так, например, технологии бескодовой разработки могут позволить специалистам без профессиональных технических навыков создавать IT-продукты, но недостаток осведомленности о возможностях таких инструментов может препятствовать их активному внедрению в бизнес-процессы. В целях повышения конкурентоспособности компании могут интегрировать данные технологии в свои стратегии развития. Однако, если технологии окажутся временным хайпом, а не устойчивым трендом, возникнет необходимость пересмотра стратегий, что приведет к значительным финансовым потерям. Также следует отметить отсутствие четких регуляторных рамок в отношении хайповых технологий, что создает дополнительные барьеры для формирования полноценного рынка. Например, децентрализованные финансовые сервисы, открывающие доступ к широкому спектру финансовых инструментов, ограничены в использовании из-за неопределенности в отношении правовых аспектов их внедрения. Наряду с децентрализованными финансами цифровые финансовые активы также характеризуются невысокой практической применимостью, что может быть обусловлено недостаточной интеграцией в существующие финансовые системы и неопределенностью правовых аспектов их использования. Таким образом, ограниченность прикладных решений, дефицит знаний у пользователей и отсутствие четких регуляторных рамок могут способствовать высокой хайповости технологий. Данные факторы указывают на отсутствие или низкую зрелость массовых рынков, а активное медиаосвещение технологий может способствовать инвестициям в технологии, которые не будут реализованы в виде коммерческих продуктов.
Заключение
В настоящей работе рассмотрены возможности автоматизированного выявления хайпов среди трендов и технологий на основе анализа больших текстовых данных. Апробация предложенного подхода реализована в рамках семантического картирования направлений исследований и разработок на примере сферы цифровых технологий. С использованием системы iFORA проанализированы англоязычные научные публикации и документы отраслевой рыночной аналитики и профессиональных СМИ за 2017–2022 гг.
Результаты проведенного анализа позволили выделить как крупные системообразующие направления цифровых технологий, широко представленные в зарубежных научных публикациях, так и гипотезы о технологиях-хайпах, характеризующихся всплесками интереса в медиа. Так, к числу наиболее хайповых отнесены направления исследований и разработок, связанные с развитием метавселенных, цифровых аватаров и бескодовой разработки программного обеспечения. Направления, связанные с метавселенными и цифровыми аватарами, несмотря на значительное внимание со стороны общественности, к концу 2024 г. не демонстрируют устойчивость и масштабируемость, необходимые для трансформации в долгосрочные тренды. В то же время определение технологий бескодовой разработки программного обеспечения как хайпа в 2022 г. сегодня может быть интерпретировано как отражение обоснованно растущего общественного интереса, связанного с закономерным этапом развития технологии. Активная медийная поддержка данного направления подчеркивала перспективность и способствовала его становлению в качестве устойчивого тренда.
Таким образом, анализ больших текстовых данных можно рассматривать в качестве эффективного инструмента для частично автоматизированного выявления технологических хайпов. Для минимизации рисков, связанных с определением приоритетных направлений развития на основе их текстового следа, рекомендуется проводить углубленный анализ выявляемых хайповых трендов и технологий, учитывая их развитие в динамике. Такой подход позволит более точно различать краткосрочные всплески интереса от устойчивых тенденций, своевременно реагировать на изменения технологических рынков и принимать обоснованные решения относительно инвестиций и стратегического планирования.
Об авторах
Ирина Владимировна Логинова
Институт статистических исследований и экономики знаний НИУ «Высшая школа экономики»
Автор, ответственный за переписку.
Email: iloginova@hse.ru
заведующий отделом
Россия, г. Москва, 101000Анна Сергеевна Пиекалнитс
Институт статистических исследований и экономики знаний НИУ «Высшая школа экономики»
Email: apiekalnits@hse.ru
ведущий эксперт
Россия, г. Москва, 101000Александр Васильевич Соколов
Институт статистических исследований и экономики знаний НИУ «Высшая школа экономики»
Email: sokolov@hse.ru
профессор, заместитель директора
Россия, г. Москва, 101000Список литературы
- Logue D., Grimes M. Living up to the hype: How new ventures manage the resource and liability of future-oriented visions within the nascent market of impact investing. AMJ, 2022, vol. 65, no. 3, pp. 1055–1082. doi: 10.5465/amj.2020.1583.
- Intemann K. Understanding the problem of “hype”: Exaggeration, values, and trust in science. Canadian J. of Philosophy, 2022, vol. 52, no. 3, pp. 279–294. doi: 10.1017/can.2020.45.
- Yap J., McLellan B. A historical analysis of hydrogen economy research, development, and expectations, 1972 to 2020. Environments, 2023, vol. 10, no. 1, art. 11. doi: 10.3390/environments10010011.
- White G.R.T., Samuel A. Programmatic advertising: Forewarning and avoiding hype-cycle failure. TFSC, 2019, vol. 144, pp. 157–168. doi: 10.1016/j.techfore.2019.03.020.
- Shi Y., Herniman J. The role of expectation in innovation evolution: Exploring hype cycles. Technovation, 2023, vol. 119, no. 3, art. 102459. doi: 10.1016/j.technovation.2022.102459.
- Chen X., Han T. Disruptive technology forecasting based on gartner hype cycle. Proc. TEMSCON, 2019, pp. 1–6. doi: 10.1109/TEMSCON.2019.8813649.
- Kreps S., McCain R.M., Brundage M. All the news that’s fit to fabricate: AI-generated text as a tool of media misinformation. SSRN Electronic J., 2022, vol. 9, no. 1, pp. 104–117. URL: https://ssrn.com/abstract=3525002 (дата обращения: 23.06.2024). doi: 10.2139/ssrn.3525002.
- Shoaib M.R., Wang Z., Ahvanooey M.T., Zhao J. Deepfakes, misinformation, and disinformation in the era of frontier AI, generative AI, and large AI models. Proc. ICCA, 2023, pp. 1–7. doi: 10.1109/ICCA59364.2023.10401723.
- Nnamdi N., Oniyinde O.A., Abegunde B. An appraisal of the implications of deep fakes: The need for urgent international legislations. AJLG, 2023, vol. 8, no. 1, pp. 43–70. doi: 10.47672/ajlg.1540.
- Korshunov P., Marcel S. Vulnerability assessment and detection of deepfake videos. Proc. ICB, 2019, pp. 1–6. doi: 10.1109/ICB45273.2019.8987375.
- Burnaev E., Mironov E., Shpilman A., Mironenko M., Katalevsky D. Practical AI cases for solving ESG challenges. Sustainability, 2023, vol. 15, no. 17, art. 12731. doi: 10.3390/su151712731.
- Ikram S.T., Priya V., Chambial S., Sood D., Arulkumar V. A performance enhancement of deepfake video detection through the use of a hybrid CNN Deep learning model. IJECES, 2023, vol. 14, no. 2, pp. 169–178. doi: 10.32985/ijeces.14.2.6.
- Carbonell J., Sánchez-Esguevillas A., Carro B. Easing the assessment of emerging technologies in technology observatories. Findings about patterns of dissemination of emerging technologies on the internet. Technology Analysis & Strategic Management, 2018, vol. 30, no. 1, pp. 113–129. doi: 10.1080/09537325.2017.1337886.
- Kondo Y., Asatani K., Sakata I. Extending hype cycle prediction by applying graph network analysis. Proc. PICMET, 2022, pp. 1–9. doi: 10.23919/PICMET53225.2022.9882551.
- Teplova T., Tomtosov A., Sokolova T. A retail investor in a cobweb of social networks. PLoS ONE, 2022, vol. 17, no. 12, art. e0276924. doi: 10.1371/journal.pone.0276924.






