Классификация с использованем машинного обучения и кластеризация для анализа формы дендритных шипиков нейронов

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Синапс — зона специализированного контакта между двумя нейронами, через который осуществляется передача информации от одной клетки к другой. Формирование синаптических контактов и передача через них сигналов с помощью электрических импульсов — это фундаментальная особенность нейрональных клеток. Со стороны аксона синапс формируется аксональным бутоном, а со стороны дендрита — дендритным шипиком, специализированным выростом дендритной мембраны. Дендритные шипики характеризуются большим разнообразием форм и размеров, которые в сильной степени варьируются между различными отделами мозга, типами клеток и видами животных. Морфология дендритных шипиков изменяется при нейроонтогенетических и нейродегенеративных заболеваниях, а также в ответ на действие внешних стимулов. Считается, что данный процесс обеспечивает синаптическую пластичность, тем не менее требуются дальнейшие исследования для установления связи между формой и функцией шипиков. Для решения данной задачи в современной нейробиологии имеется необходимость разработки методов анализа морфологии синапсов на трёхмерных изображениях нейронов. Нами разработано программное обеспечение с открытым исходным кодом для сегментации дендритных шипиков из трёхмерных изображений дендритов, вычисления 10 наиболее широко используемых морфологических признаков, адаптированных к трёхмерному представлению [1, 2], и выполнения классификации и кластеризации датасета дендритных шипиков для анализа их формы. Помимо численных признаков описания формы шипика было предложено использовать гистограмму длин хорд (chord length distribution histogram, CLDH). В данном подходе строится набор случайных хорд в объёме дендритного шипа, соединяющих его внешние границы, после чего формируется гистограмма. При достижении количства хорд n=30 000 вероятностные колебания гистограммы становятся незначительно малы. Описанные метрики использовались для кластеризации и классификации датасета.

Классификация по предопределённым морфологическим группам является широко используемым подходом к анализу морфологии дендритных шипиков. В данном подходе шипики делятся на фиксированные категории, такие как тонкие, грибовидные и пеньковые. Классификация обычно выполняется экспериментатором полуавтоматическим способом, что ведёт к значительной ошибке. Мы разработали основанный на алгоритме машинного обучения инструмент классификации, который классифицирует шипики по указанным выше категориям на основе консенсуса, достигнутого путём ручной разметки обучающего датасета 8 различными экспертами. Точность такого метода при классификации с использованием набора классических морфологических признаков сопоставима с экспертной разметкой (>77%). Данный подход позволяет снизить необъективность и трудоёмкость классификации.

Последние исследования, в том числе с использованием прижизненной микроскопии in vitro и in vivo, свидетельствуют в пользу того, что формы дендритных шипиков представляют собой континуум, а не чётко разделённые классы [3]. В связи с этим существует необходимость в разработке надёжного метода оценки и изучения морфологии дендритных шипиков. Нами разработан инструмент кластеризации, где количество групп и их содержание определяется данными, а не экспериментатором. Инструмент представлен алгоритмами k-средних и DBSCAN. Для определения количества кластеров представлены три различных метода: метод силуэта; метод плеча; а также новый, разработанный нами, метод максимизации критерия расхождения классов. Данный метод основан на предположении, что качество кластеризации лучше, когда кластеры максимально отличаются друг от друга по количеству представленных в них классов грибовидных/тонких/пеньковых шипиков, размеченных экспертами. Преимущество такого подхода заключается в том, что в нём учитывается конкретный тип данных для кластеризации, в то время как без данной информации оценка качества кластеризации затруднена. Кластеризацию с применением метрики CLDH даёт стабильное число кластеров — n=5 для всех трёх описанных выше методов. В определённых кластерах содержатся схожие по форме дендритные шипики, что было валидировано экспертами. Для набора классических метрик количество кластеров значительно варьировало: от n=4 до n=14. Подобные данные позволяют сделать предположение, что более сложная метрика CLDH содержит в себе достаточное количество информации о форме синапса для выполнения кластеризации.

Полный текст

Синапс — зона специализированного контакта между двумя нейронами, через который осуществляется передача информации от одной клетки к другой. Формирование синаптических контактов и передача через них сигналов с помощью электрических импульсов — это фундаментальная особенность нейрональных клеток. Со стороны аксона синапс формируется аксональным бутоном, а со стороны дендрита — дендритным шипиком, специализированным выростом дендритной мембраны. Дендритные шипики характеризуются большим разнообразием форм и размеров, которые в сильной степени варьируются между различными отделами мозга, типами клеток и видами животных. Морфология дендритных шипиков изменяется при нейроонтогенетических и нейродегенеративных заболеваниях, а также в ответ на действие внешних стимулов. Считается, что данный процесс обеспечивает синаптическую пластичность, тем не менее требуются дальнейшие исследования для установления связи между формой и функцией шипиков. Для решения данной задачи в современной нейробиологии имеется необходимость разработки методов анализа морфологии синапсов на трёхмерных изображениях нейронов. Нами разработано программное обеспечение с открытым исходным кодом для сегментации дендритных шипиков из трёхмерных изображений дендритов, вычисления 10 наиболее широко используемых морфологических признаков, адаптированных к трёхмерному представлению [1, 2], и выполнения классификации и кластеризации датасета дендритных шипиков для анализа их формы. Помимо численных признаков описания формы шипика было предложено использовать гистограмму длин хорд (chord length distribution histogram, CLDH). В данном подходе строится набор случайных хорд в объёме дендритного шипа, соединяющих его внешние границы, после чего формируется гистограмма. При достижении количства хорд n=30 000 вероятностные колебания гистограммы становятся незначительно малы. Описанные метрики использовались для кластеризации и классификации датасета.

Классификация по предопределённым морфологическим группам является широко используемым подходом к анализу морфологии дендритных шипиков. В данном подходе шипики делятся на фиксированные категории, такие как тонкие, грибовидные и пеньковые. Классификация обычно выполняется экспериментатором полуавтоматическим способом, что ведёт к значительной ошибке. Мы разработали основанный на алгоритме машинного обучения инструмент классификации, который классифицирует шипики по указанным выше категориям на основе консенсуса, достигнутого путём ручной разметки обучающего датасета 8 различными экспертами. Точность такого метода при классификации с использованием набора классических морфологических признаков сопоставима с экспертной разметкой (>77%). Данный подход позволяет снизить необъективность и трудоёмкость классификации.

Последние исследования, в том числе с использованием прижизненной микроскопии in vitro и in vivo, свидетельствуют в пользу того, что формы дендритных шипиков представляют собой континуум, а не чётко разделённые классы [3]. В связи с этим существует необходимость в разработке надёжного метода оценки и изучения морфологии дендритных шипиков. Нами разработан инструмент кластеризации, где количество групп и их содержание определяется данными, а не экспериментатором. Инструмент представлен алгоритмами k-средних и DBSCAN. Для определения количества кластеров представлены три различных метода: метод силуэта; метод плеча; а также новый, разработанный нами, метод максимизации критерия расхождения классов. Данный метод основан на предположении, что качество кластеризации лучше, когда кластеры максимально отличаются друг от друга по количеству представленных в них классов грибовидных/тонких/пеньковых шипиков, размеченных экспертами. Преимущество такого подхода заключается в том, что в нём учитывается конкретный тип данных для кластеризации, в то время как без данной информации оценка качества кластеризации затруднена. Кластеризацию с применением метрики CLDH даёт стабильное число кластеров — n=5 для всех трёх описанных выше методов. В определённых кластерах содержатся схожие по форме дендритные шипики, что было валидировано экспертами. Для набора классических метрик количество кластеров значительно варьировало: от n=4 до n=14. Подобные данные позволяют сделать предположение, что более сложная метрика CLDH содержит в себе достаточное количество информации о форме синапса для выполнения кластеризации.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Вклад авторов. Все авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).

Источник финансирования. Исследование профинансировано Министерством науки и высшего образования РФ в рамках Программы стратегического академического лидерства «Приоритет 2030» (соглашение 075-15-2023-380 от 20 февраля 2023 г.).

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

×

Об авторах

П. И. Васильев

Санкт-Петербургский политехнический университет Петра Великого

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

Д. C. Смирнова

Санкт-Петербургский политехнический университет Петра Великого

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

В. С. Чуканов

Санкт-Петербургский политехнический университет Петра Великого

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

И. Б. Безпрозванный

Санкт-Петербургский политехнический университет Петра Великого; UT Southwestern Medical Center at Dallas

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург; Даллас, США

Е. И. Пчицкая

Санкт-Петербургский политехнический университет Петра Великого

Автор, ответственный за переписку.
Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

Список литературы

  1. Kashiwagi Y., Higashi T., Obashi K., et al. Computational geometry analysis of dendritic spines by structured illumination microscopy // Nat Commun. 2019. Vol. 10, N 1. P. 1285–1285. doi: 10.1038/s41467-019-09337-0
  2. Bokota G., Magnowska M., Kuśmierczyk T., et al. Computational approach to dendritic spine taxonomy and shape transition analysis // Front Comput Neurosci. 2016. Vol. 10. P. 140. doi: 10.3389/fncom.2016.00140
  3. Pchitskaya E., Bezprozvanny I. Dendritic spines shape analysis-classification or clusterization? Perspective // Front Synaptic Neurosci. 2020. Vol. 12. N 31. doi: 10.3389/fnsyn.2020.00031

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Эко-Вектор, 2023

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».