Классификация с использованем машинного обучения и кластеризация для анализа формы дендритных шипиков нейронов

Обложка


Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Доступ платный или только для подписчиков

Аннотация

Синапс — зона специализированного контакта между двумя нейронами, через который осуществляется передача информации от одной клетки к другой. Формирование синаптических контактов и передача через них сигналов с помощью электрических импульсов — это фундаментальная особенность нейрональных клеток. Со стороны аксона синапс формируется аксональным бутоном, а со стороны дендрита — дендритным шипиком, специализированным выростом дендритной мембраны. Дендритные шипики характеризуются большим разнообразием форм и размеров, которые в сильной степени варьируются между различными отделами мозга, типами клеток и видами животных. Морфология дендритных шипиков изменяется при нейроонтогенетических и нейродегенеративных заболеваниях, а также в ответ на действие внешних стимулов. Считается, что данный процесс обеспечивает синаптическую пластичность, тем не менее требуются дальнейшие исследования для установления связи между формой и функцией шипиков. Для решения данной задачи в современной нейробиологии имеется необходимость разработки методов анализа морфологии синапсов на трёхмерных изображениях нейронов. Нами разработано программное обеспечение с открытым исходным кодом для сегментации дендритных шипиков из трёхмерных изображений дендритов, вычисления 10 наиболее широко используемых морфологических признаков, адаптированных к трёхмерному представлению [1, 2], и выполнения классификации и кластеризации датасета дендритных шипиков для анализа их формы. Помимо численных признаков описания формы шипика было предложено использовать гистограмму длин хорд (chord length distribution histogram, CLDH). В данном подходе строится набор случайных хорд в объёме дендритного шипа, соединяющих его внешние границы, после чего формируется гистограмма. При достижении количства хорд n=30 000 вероятностные колебания гистограммы становятся незначительно малы. Описанные метрики использовались для кластеризации и классификации датасета.

Классификация по предопределённым морфологическим группам является широко используемым подходом к анализу морфологии дендритных шипиков. В данном подходе шипики делятся на фиксированные категории, такие как тонкие, грибовидные и пеньковые. Классификация обычно выполняется экспериментатором полуавтоматическим способом, что ведёт к значительной ошибке. Мы разработали основанный на алгоритме машинного обучения инструмент классификации, который классифицирует шипики по указанным выше категориям на основе консенсуса, достигнутого путём ручной разметки обучающего датасета 8 различными экспертами. Точность такого метода при классификации с использованием набора классических морфологических признаков сопоставима с экспертной разметкой (>77%). Данный подход позволяет снизить необъективность и трудоёмкость классификации.

Последние исследования, в том числе с использованием прижизненной микроскопии in vitro и in vivo, свидетельствуют в пользу того, что формы дендритных шипиков представляют собой континуум, а не чётко разделённые классы [3]. В связи с этим существует необходимость в разработке надёжного метода оценки и изучения морфологии дендритных шипиков. Нами разработан инструмент кластеризации, где количество групп и их содержание определяется данными, а не экспериментатором. Инструмент представлен алгоритмами k-средних и DBSCAN. Для определения количества кластеров представлены три различных метода: метод силуэта; метод плеча; а также новый, разработанный нами, метод максимизации критерия расхождения классов. Данный метод основан на предположении, что качество кластеризации лучше, когда кластеры максимально отличаются друг от друга по количеству представленных в них классов грибовидных/тонких/пеньковых шипиков, размеченных экспертами. Преимущество такого подхода заключается в том, что в нём учитывается конкретный тип данных для кластеризации, в то время как без данной информации оценка качества кластеризации затруднена. Кластеризацию с применением метрики CLDH даёт стабильное число кластеров — n=5 для всех трёх описанных выше методов. В определённых кластерах содержатся схожие по форме дендритные шипики, что было валидировано экспертами. Для набора классических метрик количество кластеров значительно варьировало: от n=4 до n=14. Подобные данные позволяют сделать предположение, что более сложная метрика CLDH содержит в себе достаточное количество информации о форме синапса для выполнения кластеризации.

Полный текст

Синапс — зона специализированного контакта между двумя нейронами, через который осуществляется передача информации от одной клетки к другой. Формирование синаптических контактов и передача через них сигналов с помощью электрических импульсов — это фундаментальная особенность нейрональных клеток. Со стороны аксона синапс формируется аксональным бутоном, а со стороны дендрита — дендритным шипиком, специализированным выростом дендритной мембраны. Дендритные шипики характеризуются большим разнообразием форм и размеров, которые в сильной степени варьируются между различными отделами мозга, типами клеток и видами животных. Морфология дендритных шипиков изменяется при нейроонтогенетических и нейродегенеративных заболеваниях, а также в ответ на действие внешних стимулов. Считается, что данный процесс обеспечивает синаптическую пластичность, тем не менее требуются дальнейшие исследования для установления связи между формой и функцией шипиков. Для решения данной задачи в современной нейробиологии имеется необходимость разработки методов анализа морфологии синапсов на трёхмерных изображениях нейронов. Нами разработано программное обеспечение с открытым исходным кодом для сегментации дендритных шипиков из трёхмерных изображений дендритов, вычисления 10 наиболее широко используемых морфологических признаков, адаптированных к трёхмерному представлению [1, 2], и выполнения классификации и кластеризации датасета дендритных шипиков для анализа их формы. Помимо численных признаков описания формы шипика было предложено использовать гистограмму длин хорд (chord length distribution histogram, CLDH). В данном подходе строится набор случайных хорд в объёме дендритного шипа, соединяющих его внешние границы, после чего формируется гистограмма. При достижении количства хорд n=30 000 вероятностные колебания гистограммы становятся незначительно малы. Описанные метрики использовались для кластеризации и классификации датасета.

Классификация по предопределённым морфологическим группам является широко используемым подходом к анализу морфологии дендритных шипиков. В данном подходе шипики делятся на фиксированные категории, такие как тонкие, грибовидные и пеньковые. Классификация обычно выполняется экспериментатором полуавтоматическим способом, что ведёт к значительной ошибке. Мы разработали основанный на алгоритме машинного обучения инструмент классификации, который классифицирует шипики по указанным выше категориям на основе консенсуса, достигнутого путём ручной разметки обучающего датасета 8 различными экспертами. Точность такого метода при классификации с использованием набора классических морфологических признаков сопоставима с экспертной разметкой (>77%). Данный подход позволяет снизить необъективность и трудоёмкость классификации.

Последние исследования, в том числе с использованием прижизненной микроскопии in vitro и in vivo, свидетельствуют в пользу того, что формы дендритных шипиков представляют собой континуум, а не чётко разделённые классы [3]. В связи с этим существует необходимость в разработке надёжного метода оценки и изучения морфологии дендритных шипиков. Нами разработан инструмент кластеризации, где количество групп и их содержание определяется данными, а не экспериментатором. Инструмент представлен алгоритмами k-средних и DBSCAN. Для определения количества кластеров представлены три различных метода: метод силуэта; метод плеча; а также новый, разработанный нами, метод максимизации критерия расхождения классов. Данный метод основан на предположении, что качество кластеризации лучше, когда кластеры максимально отличаются друг от друга по количеству представленных в них классов грибовидных/тонких/пеньковых шипиков, размеченных экспертами. Преимущество такого подхода заключается в том, что в нём учитывается конкретный тип данных для кластеризации, в то время как без данной информации оценка качества кластеризации затруднена. Кластеризацию с применением метрики CLDH даёт стабильное число кластеров — n=5 для всех трёх описанных выше методов. В определённых кластерах содержатся схожие по форме дендритные шипики, что было валидировано экспертами. Для набора классических метрик количество кластеров значительно варьировало: от n=4 до n=14. Подобные данные позволяют сделать предположение, что более сложная метрика CLDH содержит в себе достаточное количество информации о форме синапса для выполнения кластеризации.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Вклад авторов. Все авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).

Источник финансирования. Исследование профинансировано Министерством науки и высшего образования РФ в рамках Программы стратегического академического лидерства «Приоритет 2030» (соглашение 075-15-2023-380 от 20 февраля 2023 г.).

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

×

Об авторах

П. И. Васильев

Санкт-Петербургский политехнический университет Петра Великого

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

Д. C. Смирнова

Санкт-Петербургский политехнический университет Петра Великого

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

В. С. Чуканов

Санкт-Петербургский политехнический университет Петра Великого

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

И. Б. Безпрозванный

Санкт-Петербургский политехнический университет Петра Великого; UT Southwestern Medical Center at Dallas

Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург; Даллас, США

Е. И. Пчицкая

Санкт-Петербургский политехнический университет Петра Великого

Автор, ответственный за переписку.
Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург

Список литературы

  1. Kashiwagi Y., Higashi T., Obashi K., et al. Computational geometry analysis of dendritic spines by structured illumination microscopy // Nat Commun. 2019. Vol. 10, N 1. P. 1285–1285. doi: 10.1038/s41467-019-09337-0
  2. Bokota G., Magnowska M., Kuśmierczyk T., et al. Computational approach to dendritic spine taxonomy and shape transition analysis // Front Comput Neurosci. 2016. Vol. 10. P. 140. doi: 10.3389/fncom.2016.00140
  3. Pchitskaya E., Bezprozvanny I. Dendritic spines shape analysis-classification or clusterization? Perspective // Front Synaptic Neurosci. 2020. Vol. 12. N 31. doi: 10.3389/fnsyn.2020.00031

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Эко-Вектор, 2023

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: 

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах