Components of Evoked Potentials in Frontal Cortex Areas Associated with Image Classification and Independent of Physical Characteristics of Stimuli

Cover Page

Cite item

Full Text

Abstract

Currently, there is a problem of increasing the objectivity of electrophysiological methods for assessment of visual acuity. The purpose of this work: to study the characteristics of cognitive evoked potentials associated with events in the frontal areas of the brain in the tasks of images classification of objects by semantic features. We used visual stimuli, divided into the following classes: by semantic features – into living and nonliving objects, and by spatial frequency ranges – into broadband contour images (white on a black background) and narrowband, in which the low-frequency or high-frequency ranges were isolated by digital filtration. The prepared images were presented to the subjects on the display. In each series of studies, the subjects were instructed to classify the images by the features of “living/nonliving” object, regardless of the physical characteristics of the stimuli. It was shown that the P200 component of evoked potentials in the ventrolateral areas of the frontal cortex depends on the semantic properties of the stimuli – images of animate and inanimate objects and does not depend on such physical characteristics as the presence/absence of high-frequency or low-frequency filtering. In this paper, as a result of the analysis of individual data in two series of studies, the results of measurements of the amplitudes and latent periods for the P200 component of evoked potentials for different (by semantics) classes of contour images with high-frequency and low-frequency filtering at selected several individual spatial frequencies and contour unfiltered images with different instructions to the subjects are presented. The obtained results may be used in the development of a new additional method for assessing visual acuity using visual evoked potentials.

Full Text

Категоризация (классификация) – фундаментальная когнитивная функция, которая имеет важное значение в жизни человека. Это механизм принятия решения об образе, который в ряде случаев осуществляется автоматически, независимо от выполняемой деятельности. Процесс классификации в настоящее время в основном является предметом как фундаментальных исследований процессов восприятия, дифференцирования, распознавания, так и прикладных задач с целью создания нейрокомпьютерных интерфейсов, систем автоматического управления, разработки медицинских диагностических методов различных заболеваний.

В серии различных исследований было выявлено, что существуют отличия в восприятии изображений объектов живой и неживой природы. На примере анализа характеристик компонент вызванных потенциалов (ВП) было показано, что существуют различия в реакции на осознаваемые и неосознаваемые стимулы, “нейтральные” и “эмоциональные” слова [1]. Проведены работы, в которых показано, что существуют отличия в восприятии изображений – объектов живой и неживой природы [2, 3]. Результаты психофизических исследований подтвердили, что объекты живой природы привлекают больше внимания и лучше запоминаются в сравнении с объектами неживой природы. Этот факт вполне объясним с точки зрения эволюционной значимости данной категории стимулов. Ряд исследователей отмечают, что такая особенность восприятия возникает, примерно, к возрасту семи месяцев [4, 5]. В работах Е.С. Михайловой, О.П. Марченко, Н.Ю. Герасименко и В.М. Верхлютова [6–9] с использованием метода ВП были исследованы особенности категоризации названий одушевленных и неодушевленных объектов. Показано влияние категориальной близости значимого и маскирующего изображений и обнаружено, что эффект преднастройки проявляется больше для категорий одушевленных, чем для категорий неодушевленных объектов [6–9]. В результате многочисленных исследований Ю.Д. Кропотовым и В.А. Пономаревым [10] был разработан стандартный Go/NoGo-тест, на основе которого выделяют компоненты ВП, связанные с процессами категоризации изображений объектов и их сравнения с образами, хранящимися в рабочей памяти, подготовки, выполнения и подавления ответной реакции, а также оценки результата действия. В данном тесте были использованы в качестве стимулов изображения животных и растений. Авторами было показано, что ранние компоненты потенциалов, связанных с событиями, такие как волны P1, N1 и P2, зависят от модальности предъявляемых стимулов, их физических характеристик и внимания к ним. На поздние составляющие ВП, такие как волны N2 и P3, физические свойства стимулов не оказывают существенного влияния, хотя эти волны зависят от ряда других факторов, например, от интервала между стимулами. Важно подчеркнуть, что при предъявлении первого стимула в паре, амплитуда волн P2, N2, P3 была значимо выше при предъявлении изображений именно животных, а не растений [10, 11].

Таким образом, существует большое количество работ, посвященных данной задаче. Однако проблема исследований механизмов категоризации изображений – объектов живой и неживой природы – все еще остается недостаточно изученной, до сих пор нет ясного описания того, как происходит процесс отнесения к классам и категориям. Известно, что при отнесении объекта к какой-либо категории наблюдатели могут использовать либо присущие данному объекту признаки, либо определять форму объекта в целом [12, 13]. Так, ранее были проведены исследования по оценке сложности контурных изображений и ее моделированию [14]. Оказалось, что эта оценка неоднозначна, зависит от алфавита изображений. Для контурных изображений оценки сложности были скоррелированы с количеством перегибов в изображениях [15]. Данная “криволинейность” в изображениях способна облегчить процесс категоризации контурных объектов живой и неживой природы [16–17]. Поэтому набор стимулов, представляющий из себя большую выборку контурных изображений, отличающихся по семантическим характеристикам, был подвергнут вейвлетной фильтрации избирательно в области высоких и низких пространственных частот [18–19]. В низкочастотных изображениях были подавлены локальные признаки, так как в спектре этих изображений убраны высокие пространственные частоты. В высокочастотных изображениях, наоборот, были подавлены глобальные признаки, так как были убраны низкие пространственные частоты. Инструкция на одном и том же наборе стимулов заключалась либо в классификации изображений по семантическому принципу, либо по физическому принципу размытый/не размытый объект.

Таким образом, выбранная нами методика пространственной фильтрации изображений позволила первоначально разделить изображения на высокочастотные и низкочастотные составляющие, получить такой же разделенный ответ в мозге и выделить в височных и лобных областях отклик на семантическое значение стимула при выполнении двух разных инструкций. Было показано, что классификация по значению “живой/неживой” происходит помимо задачи, которую выполняет оператор. Анализ латентных периодов и амплитуд компонентов ВП позволил выделить те области отведений, где ранние компоненты (до 170 мс) связаны с пространственно-частотными характеристиками изображений, области, где компоненты 170–200 мс отражают процесс категоризации, а поздние (300–500 мс) – отражают процессы детекции ошибок и организацию моторного ответа. Таким образом, разработанные методы позволили измерять перераспределение активности в нейронных сетях мозга при решении задач категоризации [18–19].

В работе А.Д. Чупрова [20] отмечено, что недостаток обследования с помощью метода зрительных ВП заключается в том, что при этом отражается весь зрительный путь. Ошибочно подобранный или некорректно проведенный тест не позволяет точно определить место дисфункции [20].

Для решения практических задач в офтальмологии важно исследование тех изменений в характеристиках ВП, которые помогут оценить более объективно остроту зрения с помощью специально подобранных тестов [21, 22]. Для оценки остроты зрения используется множество методов с различными оптотипами [23]. Нами была разработана своя методика оценки остроты зрения [24], но для ее усовершенствования необходимо было уточнить изменения характеристик зрительных ВП. Эти изменения могут быть связаны с механизмами, обеспечивающими категоризацию изображений инвариантно к их физическим характеристикам, что является важнейшим свойством зрительной системы. Поэтому в настоящей работе решили перепроверить инвариантность компонента P200 к признакам стимулов и проанализировать его точные временные характеристики в вентролатеральных областях префронтальной коры (отведения F7 и F8), поскольку в предыдущей работе [19] нам удалось установить, что в этих областях мозга происходит классификация изображений живой и неживой природы независимо от размеров стимулов. Когнитивная задача по классификации была выбрана, поскольку постановка задачи (инструкции) испытуемому задействует произвольное (cелективное или избирательное) внимание. А внимание, как известно, с остротой зрения тесно связаны [13].

Таким образом, цель настоящей работы заключалась в изучении характеристик (амплитуда и латентный период компонента P200) когнитивных ВП во фронтальных областях мозга (отведения F7 и F8) в задачах классификации изображений объектов, инвариантных к физическим характеристикам изображений наличие/отсутствие высокочастотной или низкочастотной фильтрации для того, чтобы по этим характеристикам оценивать остроту зрения.

МЕТОДИКА

Характеристика группы испытуемых. Было проведено две серии ЭЭГ-исследований на 35 здоровых испытуемых в возрасте 18–39 лет, праворуких, с нормальной и откорригированной до нормы остротой зрения с помощью очковых или контактных линз. В первой серии исследования принимали участие 21 испытуемый (17 женщин и 4 мужчины) в возрасте от 20 до 38 лет; во второй серии исследования принимали участие 14 испытуемых (4 мужчин и 10 женщин) в возрасте от 19 до 39 лет.

Стимулы. В настоящем исследовании использовали набор стимулов (90 изображений объектов с разными семантическими или физическими свойствами), предъявляемых в случайной последовательности, которые затем разделяли на классы при регистрации зрительных ВП и дальнейшей обработке полученных результатов.

Наборы стимулов включали контурные черно-белые изображения объектов живой и неживой природы (исходные изображения большого (3 угл. град) и маленького размеров (0.4 угл. град) и отфильтрованные на высоких и низких пространственных частотах) большого размера (3 угл. град). Изображения выбирали не только большого, но и малого размера, поскольку остроту зрения оценивают обычно по минимальному размеру нефильтрованных оптотипов (изображений стимулов) на пределе разрешения. В качестве изображений были предъявлены типичные представители животного мира и растений, а также предметы домашнего обихода и транспорта, легко узнаваемые и знакомые испытуемым с детства. Изображения живой и неживой природы представлены в соотношении 1 : 1, причем растения были отнесены к объектам живой природы.

Пример изображений:

– живые объекты (обезьяна, собака, яблоко, морковь);

– неживые объекты (машина, кружка, самолет, стол).

Испытуемому давали возможность самостоятельно принять решение о классификации предъявляемых объектов, при этом не ставили задачу определения одушевленности и неодушевленности объекта.

Для решения поставленных задач в первой серии исследования были отобраны стимулы, подвергнутые вейвлетной фильтрации избирательно в области высоких и низких пространственных частот. Фильтрацию производили путем свертки изображений с DoG-функцией (сокр. от Difference of Gaussians) – вейвлетом, представляющей собой разность двух двумерных функций Гаусса с различной полушириной. Для выделения высоких пространственных частот использовали фильтр с максимальным значением пропускания на частоте 10 цикл./град, низких частот – 1 цикл./град. Таким образом были получены четыре группы тестовых изображений: низкочастотные (нечеткие) изображения живых объектов (ЖНЧ), их же высокочастотные (четкие) изображения (ЖВЧ) и такие же группы для неживых объектов – (НЖНЧ) и (НЖВЧ). Тем самым из одного алфавита стимулов образовали четыре. Возможность использовать одни и те же изображения объектов живой и неживой природы, но в разном пространственно-частотном диапазоне позволяет в какой-то степени игнорировать роль отдельных физических свойств изображений и выделить их семантическое значение. Во второй серии исследования был использован исходный набор изображений (уменьшенный до 60 изображений) без предварительной вейвлетной фильтрации (Ж и НЖ), с размером изображений в 3 угл. град, которые не выходили за пределы фовеа (большие изображения) и изображения размера в 0.4 угл. град, которые соответствовали наименьшей части фовеолы (маленькие изображения). В двух сериях исследования испытуемые получали инструкцию классифицировать изображения по признакам “живой/неживой объект”. Испытуемые должны были отвечать нажатием на соответствующую кнопку мыши, которая была связана с определенным классом изображений.

Для демонстрации близости физических параметров данных категорий изображений (живых и неживых объектов) на рис. 1 показаны усредненные сечения их двумерных пространственно-частотных спектров. Для каждого изображения вычисляли амплитудный спектр, затем вычисляли сечения спектра в разной ориентации с шагом 3.6° от нуля до 360°. Эти сечения вычисляли для каждого из 90 изображений, используемых в экспериментах, затем они усреднялись (по отдельности для каждой категории изображений). Было установлено, что сечения спектров для живых и неживых объектов практически не отличаются.

 

Рис. 1. Методика проведения исследования. В первой серии исследования предъявляли изображения из одного набора стимулов, состоящие из объектов живой и неживой природы, которые были подвергнуты вейвлетной фильтрации в области низких (1 цикл./град) и высоких (10 цикл./град) пространственных частот (А). Во второй серии предъявляли изображения живой и неживой природы без предварительной вейвлетной фильтрации, размер изображений составил 3 и 0.4 угл. град (Б).

 

В первой и второй серии исследования изображения предъявляли на электронно-лучевом мониторе Mitsubishi Diamond Pro 740 SB (Япония) с кадровой частотой 100 Гц и разрешением экрана 1024 × 768. Для первой серии исследований отфильтрованные изображения предъявляли испытуемым дважды. Для второй серии исследований контурные неотфильтрованные изображения предъявляли испытуемым трижды. То есть для первой серии всего было сделано 360 предьявлений изображений стимулов, а для второй – 180. Испытуемый должен был отвечать нажатием соответствующей кнопки мыши на определенный класс изображений. Инструкция для испытуемых состояла в следующем: “К какому классу относятся предъявляемые изображения объектов? Классу живых или не живых? Ответ предоставьте как можно быстрее”. То есть инструкция состояла в классификации изображений по признаку “живой-неживой” объект.

Для точной передачи яркостного профиля изображений производили коррекцию нелинейных искажений, вносимых монитором (гамма-коррекция). Средняя яркость и контраст всех стимулов были одинаковы. Расстояние от монитора до глаз испытуемого составляло 1.5 м. Изображения предъявляли в случайном порядке, продолжительность демонстрации – 100 мс, интервал между предъявлениями – 1000 мс, включая время для ответа испытуемого. Структура (временного расписания) событий в пределах одной пробы (trial) представляла собой следующее.

Вначале на 100 мс предъявляли изображение стимула одного из двух классов, затем предъявляли фон на 1000 мс, период показа фона включал ожидания ответа испытуемого до 5000 мс. Такой временной интервал был выбран для того, чтобы после двигательного ответа испытуемым было дано некоторое время на подготовку к восприятию следующего стимула.

Длительность каждой серии экспериментов составляла ориентировочно 20 мин.

Регистрация и обработка ЭЭГ. Среднее время реакции испытуемых в первой серии исследований составило 661 ± 227 мс. Доля правильных ответов – 95 ± 3%.

Среднее время реакции во второй серии испытуемых оставило 1137 ± 540 мс, доля правильных ответов составила 97 ± 2% для исходного набора стимулов (для больших изображений).

Время реакции испытуемых составило 1210 ± 108 мс, доля правильных ответов — 87 ± 2% для исходного набора стимулов (для маленьких изображений).

Во всех сериях исследований для регистрации ВП использовали энцефалограф фирмы Мицар-ЭЭГ-202 (Россия) с частотой дискретизации 250 Гц и программу WinEEG. Электроды располагали по системе 10–20 c добавочным затылочным отведением Oz с референтными ушными электродами. Регистрировали ВП во всех областях мозга, но для детального анализа выбирали только фронтальные области мозга, поскольку они наименее изучены и представляют интерес для оценки остроты зрения с помощью когнитивных ВП.

Глазодвигательные артефакты удаляли с помощью метода независимых компонентов. Амплитуда компонента P200 во фронтальных областях мозга у отдельных испытуемых зависела от доминирующих ритмов во время проведенного ЭЭГ-исследования, глазодвигательных артефактов и артефактов кожно-гальванической реакции. Никогда нельзя полностью освободить ЭЭГ-данные от помех. Но поскольку можно случайно удалить из сигнала и информацию о процессах обработки информации, то было принято решение провести анализ только пиков латентных периодов и амплитуд этого компонента.

Полоса пропускания: фильтр высоких частот – 70 Гц, фильтр низких частот – 0.53 Гц, режекторный фильтр 45–55 Гц. Считалось, что проба содержит артефакты, если в ней наблюдаются: 1) потенциалы более 50 мкВ для электродов Fp1 и Fp2 и более 100 мкВ для остальных электродов; 2) медленные волны в диапазоне от 0.53 до 1 Гц, с амплитудой более 50 мкВ; 3) быстрые колебания сигнала в интервале частот от 20 до 35 Гц, с амплитудой более 35 мкВ. Эти пороговые значения были подобраны эмпирически, путем многократного выполнения обработки с различными параметрами и последующего визуального анализа результатов. Двигательные, глотательные и другие артефакты удаляли вручную. Измеряли характеристики (амплитуда и латентный период компонента P200) когнитивных ВП во фронтальных областях мозга (отведения F7 и F8), поскольку настоящая работа была направлена на создание методики оценки остроты зрения по этим областям [24]. Вызванные потенциалы усредняли по всем классам стимулов отдельно в двух сериях исследований. Все компоненты меняли свою точную латентность, поэтому для измерения их амплитуд выбирали более точный интервал на основании усредненных ВП отдельно для каждого исследования (Grande Average) с помощью автоматических маркеров в программе WinEEG для обработки ЭЭГ-данных. Длительность престимульного (baseline) интервала составила 300 мс, а постстимульного – 1300 мс.

Статистический анализ. Анализ данных для обеих серий исследований проводили с использованием двух- и трехфакторного дисперсионного анализа для зависимых переменных ANOVA RM (Reapeated Measures) c последующими апостериорными сравнениями после предварительной проверки распределений экспериментальных данных на отклонения от нормальности. Влияние факторов “отведение” (F7/F8), “изображение” (“живые/неживые”) и “частота” (“ВЧ/НЧ” или “четкие/нечеткие”) на амплитуды ВП при инструкциях “живые/неживые” и “ВЧ/НЧ” проверяли на основании трехфакторного дисперсионного анализа. Влияние факторов “отведение” (F7/F8) и “изображение” (“живые/неживые”) на амплитуды ВП при предъявлениях больших и маленьких изображений проверяли на основании двухфакторного дисперсионного анализа. Данные анализировали с использованием программы SPSS для статистической обработки данных. Измерения амплитуды и латентности пиков компонента Р200 ВП осуществляли с помощью программы WinEEG. Связанные с событиями вызванные потенциалы (ССП) или ВП вычисляли для всех ответов.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

На рис. 2 представлены данные с ВП, усредненные по группам с различиями между амплитудами компонента ВП, в интервале 150–250 мс после предъявления изображений объектов живой (светлая кривая) и неживой (темная кривая) природы в двух сериях исследований. Отдельно представлены различия в классификации изображений, подвергнутых фильтрации в области высоких (рис. 2, А), низких (рис. 2, Б) пространственных частот, а также без вейвлетной фильтрации (рис. 2, В). Из рис. 2 видно, что в амплитуде компонента P200 во всех сериях исследования существуют различия на предъявление изображений объектов живой и неживой природы.

 

Рис. 2. Сравнительный анализ значимых различий между амплитудами компонентов вызванных потенциалов (ВП) в отведении F7 на изображения объектов живой (а – светлая кривая) и неживой (б – темная кривая) природы в двух сериях исследований. А – при классификации изображений, подвергнутых вейвлетной фильтрации в области высоких пространственных частот. Б – при классификации изображений, подвергнутых вейвлетной фильтрации в области низких пространственных частот. В – при классификации изображений без вейвлетной фильтрации. Данные усреднены на группе испытуемых.

 

Ниже приведены более подробно характеристики: средние и стандартные отклонения (M ± SD) амплитуд и латентных периодов, соответствующих пикам компонента P200 в двух сериях исследований по отдельности во фронтальных (F7 и F8) отведениях мозга (табл. 1–2) для больших изображений (3 угл. град).

 

Таблица 1. Характеристики компонента P200 во фронтальных областях мозга (отведения F7 и F8) в первой серии ЭЭГ-исследования

1-я серия ЭЭГ-исследований

Отведение

ЛП ЖВЧ, мс

Амплитуда ЖВЧ, мкВ

ЛП НЖВЧ, мс

Амплитуда НЖВЧ, мкВ

ЛП ЖНЧ, мс

Амплитуда ЖНЧ, мкВ

ЛП НЖНЧ, мс

Амплитуда НЖНЧ, мкВ

F7

184 ± 3.46

3.313 ± 0.38

176 ± 2.92

2.377 ± 0.40

168 ± 2.38

2.922 ± 0.41

168 ± 3.24

2.146 ± 0.45

F8

184 ± 2.65

3.61 ± 0.41

176 ± 3.25

3.647 ± 0.39

168 ± 2.41

4.012 ± 0.44

168 ± 2.98

3.478 ± 0.40

Примечание: ЛП – латентный период. ЖВЧ – изображения живой природы, отфильтрованные на высоких пространственных частотах. НЖВЧ – изображения неживой природы, отфильтрованные на высоких пространственных частотах. ЖНЧ – изображения живой природы, отфильтрованные на низких пространственных частотах. НЖНЧ – изображения неживой природы, отфильтрованные на низких пространственных частотах.

 

Таблица 2. Характеристики компонента P200 во фронтальных областях мозга (отведения F7 и F8) во второй серии ЭЭГ-исследования

2-я серия ЭЭГ-исследований

Отведение

ЛП Ж, мс

Амплитуда Ж, мкВ

ЛП НЖ, мс

Амплитуда НЖ, мкВ

F7

204 ± 8.07

1.87 ± 0.67

186 ± 8.76

1.5 ± 0.61

F8

196 ± 5.75

1.95 ± 0.8

196 ± 7.62

1.66 ± 0.7

Примечание: ЛП – латентный период. Ж – изображения живой природы. НЖ – изображения неживой природы.

 

Проанализировав таблицы, основанные на анализе индивидуальных данных в двух сериях исследований, получили точные латентные периоды для компонента P200 вызванных потенциалов для разных классов контурных изображений с высоко- и низкочастотной фильтрацией и контурных неотфильтрованных больших изображений.

Результаты дисперсионного анализа 1 (инструкция “живые/неживые”, зависимая переменная – амплитуда). Получены значимые главные эффекты фактора “отведение” (F7 и F8) F(1, 20) = 28.8, p < 0.001, η2 = 0.590 и “вид изображения” (“живые/неживые”) F(1, 20) = 17.8, p < 0.001, η2 = 0.470. Главный эффект фактора (“четкие/нечеткие”) незначим, однако для отведения F7 получено значимо большее значение “неживые четкие” по сравнению с “неживые нечеткие”, p = 0.019.

Значения амплитуд F7 значимо ниже амплитуд F8, p < 0.001 для всех условий. Сравнение “живые/ неживые”: в отведениях F7 и F8 амплитуды “живые” и “неживые четкие” выше амплитуд “живые” и “неживые нечеткие” (F7 “четкие”, p = 0.019, “нечеткие”, p = 0.006, F8 “четкие”, p = 0.012 и “нечеткие”, p = 0.001).

Результаты дисперсионного анализа 2 (инструкция “четкие/нечеткие”, зависимая переменная – амплитуда). Получено значимое влияние на амплитуду фактора “вид изображения” (“живые/неживые”) F(1, 20) = 31.3, p < 0.001, η2 = 0.610, а также значимо взаимодействие факторов “отведение” (F7/F8) и “вид изображения” (“живые/неживые”): F(1, 20) = 5.2, p = 0.034, η2 = 0.205. Между отведениями F8 и F7 были получены только тенденции к различиям амплитуд для “четкие живые” и “четкие неживые”, p = 0.063 и p = 0.096 соответственно. Амплитуды для “живых” были везде выше, чем для “неживых”, p < 0.01.

Результаты дисперсионного анализа для второй серии экспериментов при предъявлении больших и маленьких изображений представлены ниже. Был проведен двухфакторный дисперсионный анализ для амплитуды ANOVA RM, факторы: “отведения” (F7/F8) и “изображения” (“живые/неживые”). В обоих предъявлениях, как больших, так и маленьких изображений, не было выявлено значимого влияния факторов “отведения” (F7/F8), но получено значимое влияние фактора “изображения” (“живые/неживые”): главные эффекты для предъявлений больших F(1, 13) = 14.58, p = 0.002, η2 = 0.529, и для демонстрации маленьких изображений F(1, 13) = 5.18, p = 0.040, η2 = 0.285.

Парные сравнения (апостериорные сравнения) показали значимо более высокие значения для изображений “живой природы” по сравнению с изображениями “неживой природы” при предъявлении больших в обоих отведениях: p = 0.005 и p = 0.004 соответственно тогда как при демонстрации маленьких, получены только тенденции к значимости (p = 0.054 и p = 0.079, соответственно).

Таким образом, в двух сериях исследованиях по результатам апостериорных парных сравнений были выявлены значимые различия в амплитуде компонента ВП по признакам “живые/неживые”.

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Цель настоящей работы заключалась в изучении характеристик когнитивных ВП Р200 во фронтальных областях мозга в задачах классификации изображений объектов, не зависящих от их физических характеристик для того, чтобы в дальнейшем создать методику по оценке остроты зрения с помощью методов ВП. Удалось показать, что компонент Р200 в вентролатеральной префронтальной коре не зависит от физических характеристик стимулов, таких как наличие/отсутствие цифровой фильтрации изображений, и, вероятно, связан с приходящим в эту часть мозга инвариантным описанием [22]. Полученные результаты важны для разработки дополнительного более объективного электрофизиологического метода оценки остроты зрения, так как в обычной клинической практике офтальмологи используют офтальмологические таблицы и электрофизиологические методы, которые имеют ряд своих недостатков, обусловленных большой субъективностью в полученных измеряемых показателях [23].

Исследование данного компонента представляет значительный интерес, так как в современной литературе отсутствует его четкая характеристика. Предполагают, что данный компонент, вероятно, модулируется большим количеством разнообразных когнитивных задач. Например, в исследованиях оценки статистических свойств сложных изображений (определении доминирующей ориентации в матрицах Габора) показана зависимость амплитуды компонента P200 от степени упорядоченности стимула [25]. В исследованиях Ю.Д. Кропотова и В.А. Пономарева [10] был выявлен тот же самый компонент ВП при категоризации изображений растений и животных. Амплитуда волн P200 была значимо выше при предъявлении изображений именно животных, а не растений [10]. В наших более ранних работах было показано, что компонент P200 ВП зависит от семантических свойств стимулов – изображений объектов живой и неживой природы и от таких физических характеристик, как наличие/отсутствие высокочастотной или низкочастотной фильтрации [19, 22] на выбранных нескольких отдельных пространственных частотах. В исследовании С. Козловского и др. [26] также выявлены достоверные отличия в характеристиках компонента с латентностью 200 мс во фронтальных отведениях головного мозга в задачах категоризации объектов живой и неживой природы.

Существует предположение, что изменение амплитуды данного компонента свидетельствует о его участии в процессах памяти. Например, в исследовании Е.С. Михайловой [27] показано, что при выполнении задач зрительной рабочей памяти процессы, разворачивающиеся в диапазоне 150 мс, отражают не только восприятие зрительного сигнала, но и его удержание и извлечение из памяти. Однако данный компонент в работе Е.С. Михайловой имеет пик ориентировочно на 150 мс, а в работе Г.А. Моисеенко и др. — на 200 мс [19, 22, 24]. Ранее показано, что на ход процесса категоризации в каждом отдельном случае влияет ряд факторов, среди которых можно отметить уровень внимания, тип задачи, выполняемой испытуемым, и контекст, предшествующий или совпадающий по времени со стимулом [24, 28, 29]. Но в данной работе мы не исследовали влияние эмоциональной и мотивационной сфер, личностных характеристик испытуемого, социальных и культурных факторов, когнитивных процессов, а также влияния пола и ряда других факторов на процесс классификации. Возможно, это могло повлиять на концентрацию внимания испытуемых к определенным деталям (признакам) изображений стимулов. В настоящем исследовании мы решали практическую задачу, результаты которой могут быть использованы в клинике с уменьшенным по сравнению с существующими методами влиянием индивидуальных особенностей испытуемых, а полностью избежать субъективности в измерении остроты зрения невозможно. Влияние пространственно-частотных характеристик в выбранных областях мозга в настоящей статье не будет обсуждаться, поскольку ЭЭГ-исследований по этой теме для конкретно поставленной нами задачи ранее не проводилось.

Следует отметить, что латентный период волн ВП (до 250 мс) был короче при предъявлении стимулов, отфильтрованных по низкой пространственной частоте, по сравнению с предъявлением высокочастотных изображений. Это вполне ожидаемо, так как низкочастотные характеристики необходимы для обнаружения изображений объектов (на основании глобальных признаков), а высокочастотные – для классификации изображений (на основании локальных ключевых признаков), которые являются составляющим звеном процесса распознавания объектов. Представляет интерес, что в условиях высокочастотной фильтрации латентный период был короче при предъявлении изображений – объектов неживой природы, в сравнении с изображениями – объектами живой природы, что противоречит полученным данным у других исследователей [13]. Так, в исследовании В.М. Верхлютова, В.Л. Ушакова и В.Б. Стрелец [9] было показано, что компонент N170 в центральных и центрально-теменных отведениях имеет латентность на 12 мс меньше при предъявлении изображений лиц, чем при предъявлении строений. Можно предположить, что полученный результат связан с особенностями алфавита стимулов. В большинстве исследований используются реалистичные или широкополосные контурные изображения. При этом, как было показано ранее, статистика изображений – объектов живой и неживой природы, значительно отличается, что могло оказать влияние на латентные периоды компонента ВП [8, 19, 22, 30]. В нашем исследовании в низкочастотных изображениях были подавлены локальные признаки, так как в спектре этих изображений убраны высокие пространственные частоты. В высокочастотных изображениях, наоборот, были подавлены глобальные признаки, так как были убраны низкие пространственные частоты. Все стимулы были выравнены по длине контура. Более длинный латентный период компонента P200 в ответ на изображения объектов живой природы, вероятно, связан с тем, что распознавание изображений объектов неживой природы – более простая задача в сравнении с классификацией изображений, объектов живой природы, когда требуется больше времени для распознавания локальных признаков эволюционно значимых стимулов.

Представляет также интерес тот факт, что различия в амплитуде компонента P200 на предъявление объектов живой и неживой природы во всех сериях исследования были выявлены в областях вентролатеральной префронтальной коры (отведениях F7 и F8). Это важно, так как ранее было показано, что основным центром категоризации объектов, которую обычно связывают с компонентом N170, является нижневисочная область мозга [31–33]. Причем большая активация в ответ на изображения объектов живой природы была выявлена в вентролатеральных, а на изображения объектов неживой природы – в медиальных областях нижневисочной коры. В то же время в современных исследованиях все больше акцент делается на роли фронтальной коры в задачах классификации и на разделении их на подобласти. Делается предположение, что роль префронтальной коры заключается в модулирующем влиянии, которое “настраивает” нижневисочную кору, повышая селективность определенных групп нейронов [24]. Известен ряд МРТ-исследований, в которых говорится о том, что в этих областях мозга есть нейроны, которые участвуют в категоризации лиц и неодушевленных объектов [31].

Важно отметить, что точная функциональная локализация областей фронтальной коры изучена недостаточно и результаты этих исследований разнятся [31–33]. Так, ранее были показаны наглядные различия активности нейронов между дорсолатеральной, медиальной и орбитофронтальной префронтальными областями коры головного мозга человека [34]. Наблюдения за пациентами с синдромом поражения лобной доли демонстрируют ведущую роль фронтальных отделов коры в категоризации на суперординатном уровне [32]. В работе [33] авторы разделяют вентролатеральную префронтальную кору в соответствии с функциями на левую, переднюю и нижнюю области. Сделано предположение, что левая вентролатеральная префронтальная область коры вносит вклад в когнитивный контроль памяти. Передняя ее часть поддерживает контролирующий доступ к сохранным концептуальным представлениям. Нижняя лобная извилина осуществляет общий процесс выбора предметной области, а также участвует в восприятии эмоциональных стимулов. Известно также, что вентролатеральная префронтальная область мозга является конечным звеном вентрального зрительного пути [32, 35]. Восприимчивость его нейронов повышается к сложности изображений, размеру рецептивных полей, инвариантности к зрительным трансформациям от затылочных к височным областям мозга [19] и реакциям на лица [31, 32]. Таким образом, можно предположить, что в вентролатеральных префронтальных областях мозга происходит классификация изображений живой и неживой природы на основании инвариантных характеристик стимулов, полученных на более низких уровнях обработки зрительной информации.

ЗАКЛЮЧЕНИЕ

Исследовали характеристики компонента P200 (амплитуда и латентные периоды) во фронтальных областях мозга в двух сериях исследований при классификации изображений только по семантическим признакам “живой/неживой” объект. Показано, что компонент Р200 в вентролатеральной префронтальной коре не зависит от физических характеристик стимулов, таких как наличие/отсутствие цифровой фильтрации изображений на выбранных нескольких отдельных пространственных частотах и, вероятно, связан с приходящим в эту часть мозга инвариантным описанием. В результате проведенного анализа индивидуальных данных в двух сериях исследований получили латентные периоды для компонента P200 ВП для разных классов контурных изображений с высоко- и низкочастотной фильтрацией и контурных неотфильтрованных изображений и при отличающихся инструкциях проведения классификаций по различным признакам изображений. Полученные результаты могут быть использованы в разработке нового дополнительного метода оценки остроты зрения с помощью зрительных ВП.

Финансирование работы. Работа поддержана средствами федерального бюджета в рамках государственного задания ФГБУН Институт физиологии им. Павлова РАН (№ 1021062411653-4-3.1.8).

Соблюдение этических стандартов. Все исследования проводились в соответствии с принципами биомедицинской этики, изложенными в Хельсинкской декларации 1964 г. и последующих поправках к ней. Они также были одобрены локальным Этическим комитетом Института физиологии имени И.П. Павлова РАН (Санкт-Петербург), протокол № 23-05 от 26.12.2023 г.

Каждый участник исследования дал добровольное письменное информированное согласие после получения разъяснений о потенциальных рисках и преимуществах, а также о характере предстоящего исследования.

Конфликт интересов. Авторы данной работы заявляют, что у них нет конфликта интересов.

Вклад авторов в публикацию. Г.А. Моисеенко – постановка цели и задач исследования, проведение ЭЭГ-исследований, обработка и интерпретация полученных результатов, написание статьи. С.В. Пронин, В.Н. Чихман – цифровая обработка изображений и подготовка набора изображений стимулов, обсуждение полученных результатов, редактирование статьи. С.А. Коскин – постановка целей и задач исследований, помощь в организации исследований, обсуждение полученных результатов, редактирование статьи. Е.А. Вершинина – проведение расчетов дисперсионного анализа и их интерпретация. О.В. Жукова – обсуждение полученных результатов, редактирование статьи.

×

About the authors

G. А. Moiseenko

I. P. Pavlov Institute of Physiology RAS

Author for correspondence.
Email: MoiseenkoGA@infran.ru
Russian Federation, St. Petersburg

S. А. Koskin

I. P. Pavlov Institute of Physiology RAS; Military Medical Academy named after S. M. Kirov

Email: MoiseenkoGA@infran.ru
Russian Federation, St. Petersburg; St. Petersburg

S. V. Pronin

I. P. Pavlov Institute of Physiology RAS

Email: MoiseenkoGA@infran.ru
Russian Federation, St. Petersburg

V. N. Chikhman

I. P. Pavlov Institute of Physiology RAS

Email: MoiseenkoGA@infran.ru
Russian Federation, St. Petersburg

Е. А. Vershinina

I. P. Pavlov Institute of Physiology RAS

Email: MoiseenkoGA@infran.ru
Russian Federation, St. Petersburg

О. V. Zhukova

I. P. Pavlov Institute of Physiology RAS

Email: volgazhukova@gmail.com
Russian Federation, St. Petersburg

References

  1. Kostandov E.A. [Psychophysiology of consciousness and the unconscious]. St. Petersburg: Piter, 2004. 167 p.
  2. Bonin P., Gelin M., Bugaiska A. Animates are better remembered than inanimates: Further evidence from word and picture stimuli // Mem. Cogn. 2014. V. 42. № 3. P. 370.
  3. Yang J., Wang A., Yan M. et al. Distinct processing for pictures of animals and objects: Evidence from eye movements // Emotion. 2012. V. 12. № 3. P. 540.
  4. Pauen S. Evidence for knowledge–based category discrimination in infancy // Child Dev. 2002. V. 73. № 4. P. 1016.
  5. Taniguchi K., Tanabe-Ishibashi A., Itakura S. The categorization of objects with uniform texture at superordinate and living/non-living levels in infants: An exploratory study // Front. Psychol. 2020. V. 11. P. 2009.
  6. Marchenko O.P. [Electrical potentials of the brain associated with categorization of labels of animate and inanimate objects] // Exp. Psychol. 2010. V. 3. № 1. P. 5.
  7. Gerasimenko N.Yu., Slavutskaya A.V., Kalinin S.A. et al. [Recognition of visual objects under forward masking. Effects of cathegorial similarity of test and masking stimuli] // Zh. Vyssh. Nerv. Deyat. Im. I.P. Pavlova. 2013. V. 63. № 4. P. 419.
  8. Mikhailova E.S., Gerasimenko N.Yu., Avsienko A.V. Recognition of forward-masked complex and simple images // Human Physiology. 2009. V. 35. № 3. P. 267.
  9. Verkhlyutov V.M., Ushakov V.L., Strelets V.B. [Decreased latency of the evoked potential component N170 during repeated presentation of face images] // Zh. Vyssh. Nerv. Deyat. Im. I.P. Pavlova. 2009. V. 50. № 3. P. 307.
  10. Ponomarev V.A., Kropotov Yu.D. Improving source localization of event-related potentials in the GO/NOGO task by modeling their cross-covariance structure // Human Physiology. 2013. V. 39. № 1. P. 27.
  11. Ponomarev V.A., Pronina M.V., Kropotov Yu.D. Latent components of event-related potentials in a visual cued Go/NoGo task // Human Physiology. 2019. V. 45. № 5. P. 474.
  12. Glezer V.D. Vision and Thinking. Leningrad: Nauka, 1993. 284 p.
  13. Shelepin Yu.E. Introduction to Neuroiconics: Monograph. St. Petersburg: Troitsky Most, 2017. 352 p.
  14. Chikhman V.N., Bondarko V.M., Danilova M.V. et al. Complexity of images: Experimental and computational estimates compared // Perception. 2012. V. 41. № 6. P. 631.
  15. Attneave F. Physical determinants of the judged complexity of shapes // J. Exp. Psychol. 1957. V. 53. № 4. P. 221.
  16. Long B., Störmer V.S., Alvarez G.A. Mid-level perceptual features contain early cues to animacy // J. Vis. 2017. V. 17. № 6. P. 20.
  17. Yetter M., Robert S., Mammarella G. et al. Curvilinear features are important for animate/inanimate categorization in macaques // J. Vis. 2021. V. 21. № 4. P. 3.
  18. Moiseenko G.A., Shelepin Yu.E., Kharauzov A.K. et al. Classification and recognition of images of animate and inanimate objects // J. Opt. Technol. 2015. V. 82. № 10. P. 685.
  19. Moiseenko G.A., Pronin S.V., Shelepin Yu.E. Investigation of scale-invariant image classification mechanisms // J. Opt. Technol. 2019. V. 86. № 11. P. 729.
  20. Chuprov A.D., Zhedyale N.A., Voronina A.E. [Methods for investigation of central department of a visual analyzer (review)] // Saratov J. Med. Sci. Res. 2021. V. 17 № 2. P. 396.
  21. Ophthalmology: national guidelines / Eds. Avetisov S.E., Egorov E.A., Moshetov L.K., Neroev V.V., Takhchidi H.P. 2nd ed., revised. and add. Moscow: GEOTAR-Media, 2022. Ser.: National Guidelines. 904 p.
  22. Moiseenko G.A., Vershinina E.A., Pronin S.V. et al. Latency of evoked potentials in the tasks involving classification of images after wavelet filtration // Human Physiology. 2016. V. 42. № 6. P. 615.
  23. Kutsenko M.A. History and methods of visometry // Bulletin of the Council of Young Scientists and Specialists of the Chelyabinsk Region. 2018. V. 2. № 3. P. 32.
  24. Moiseenko G.A., Pronin S.V., Zhil’chuk D.I. et al. Vanishing optotypes and objective measurement of human visual acuity // J. Opt. Technol. 2020. V. 87. № 12. P. 761.
  25. Harauzov A.K., Shelepin Y.E., Noskov Y.A. et al. The time course of pattern discrimination in the human brain // Vision Res. 2016. V. 125. P. 55.
  26. Kozlovskiy S., Kashirin V., Glazkova A. Electrophysiological differences in perception of animate and inanimate objects // Int. J. Psychophysiol. 2023. V. 188. P. 116.
  27. Mikhailova E.S., Mayorova L.A., Gerasimenko N.Yu. et al. [Sex differences in working memory for simple visual features. Analysis of event-related potentials in the process and space of sensors and dipole sources] // Zh. Vyssh. Nerv. Deyat. Im. I.P. Pavlova. 2022. V. 72. № 6. P. 836.
  28. Gerasimenko N.Yu., Kushnir A.B., Mikhailova E.S. Masking effects of irrelevant visual information inder conditions of basic and superordinate categorization of complex images // Human Physiology. 2019. V. 45. № 1. P. 1.
  29. Lee G., Blumenfeld R.S., D'Esposito M. Disruption of dorsolateral but not ventrolateral prefrontal cortex improves unconscious perceptual memories // J. Neurosci. 2013. V. 33. № 32. P. 13233.
  30. Vakhrameeva O.A., Sukhinin M.V., Moiseenko G.A. et al. [Investigation of dependence of perception thresholds on fovea geometry] // Sensory Systems. 2013. V. 27. № 2. P. 122.
  31. Chan A.W.-Y. Functional organization and visual representations of human ventral lateral prefrontal cortex // Front. Psychol. 2013. V. 4. P. 371.
  32. Radtke E.L., Martens U., Gruber T. The steady‐state visual evoked potential (SSVEP) reflects the activation of cortical object representations: evidence from semantic stimulus repetition // Exp. Brain Res. 2021. V. 239. № 2. P. 545.
  33. Badre D., Wagner A.D. Left ventrolateral prefrontal cortex and the cognitive control of memory // J. Neuropsychol. 2007. V. 45. № 13. P. 2883.
  34. Farzmahdi A.J., Fallah F., Rajimehr R., Ebrahimpour R. Task-dependent neural representations of visual object categories // Eur. J. Neurosci. 2021. V. 54. № 7. P. 6445.
  35. Kravitz D.J., Saleem K.S., Baker C.I. et al. The ventral visual pathway: an expanded neural framework for the processing of object quality // Trends Cogn. Sci. 2013. V. 17. № 1. P. 26.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. The methodology of the study. In the first series of the study, images from a single set of stimuli were presented, consisting of objects of living and inanimate nature, which were subjected to wavelet filtering in the region of low (1 cycle/deg) and high (10 cycles/deg) spatial frequencies (A). In the second series, images of living and inanimate nature were presented without preliminary wavelet filtering, the image size was 3 and 0.4 degrees (B).

Download (24KB)
3. Fig. 2. Comparative analysis of significant differences between the amplitudes of the components of evoked potentials (VP) in the F7 lead to images of objects of living (a – light curve) and inanimate (b – dark curve) nature in two series of studies. A – in the classification of images subjected to wavelet filtering in the region of high spatial frequencies. B – when classifying images subjected to wavelet filtering in the low spatial frequency region. B – when classifying images without wavelet filtering. The data are averaged over a group of subjects.

Download (21KB)

Copyright (c) 2024 Russian Academy of Sciences

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».