Классификация с использованем машинного обучения и кластеризация для анализа формы дендритных шипиков нейронов
- Авторы: Васильев П.И.1, Смирнова Д.C.1, Чуканов В.С.1, Безпрозванный И.Б.1,2, Пчицкая Е.И.1
-
Учреждения:
- Санкт-Петербургский политехнический университет Петра Великого
- UT Southwestern Medical Center at Dallas
- Выпуск: Том 18, № 4 (2023)
- Страницы: 890-893
- Раздел: Материалы конференции
- Статья получена: 17.11.2023
- Статья одобрена: 21.11.2023
- Статья опубликована: 15.12.2023
- URL: https://genescells.ru/2313-1829/article/view/623520
- DOI: https://doi.org/10.17816/gc623520
- ID: 623520
Цитировать
Полный текст
Доступ предоставлен
Доступ платный или только для подписчиков
Аннотация
Синапс — зона специализированного контакта между двумя нейронами, через который осуществляется передача информации от одной клетки к другой. Формирование синаптических контактов и передача через них сигналов с помощью электрических импульсов — это фундаментальная особенность нейрональных клеток. Со стороны аксона синапс формируется аксональным бутоном, а со стороны дендрита — дендритным шипиком, специализированным выростом дендритной мембраны. Дендритные шипики характеризуются большим разнообразием форм и размеров, которые в сильной степени варьируются между различными отделами мозга, типами клеток и видами животных. Морфология дендритных шипиков изменяется при нейроонтогенетических и нейродегенеративных заболеваниях, а также в ответ на действие внешних стимулов. Считается, что данный процесс обеспечивает синаптическую пластичность, тем не менее требуются дальнейшие исследования для установления связи между формой и функцией шипиков. Для решения данной задачи в современной нейробиологии имеется необходимость разработки методов анализа морфологии синапсов на трёхмерных изображениях нейронов. Нами разработано программное обеспечение с открытым исходным кодом для сегментации дендритных шипиков из трёхмерных изображений дендритов, вычисления 10 наиболее широко используемых морфологических признаков, адаптированных к трёхмерному представлению [1, 2], и выполнения классификации и кластеризации датасета дендритных шипиков для анализа их формы. Помимо численных признаков описания формы шипика было предложено использовать гистограмму длин хорд (chord length distribution histogram, CLDH). В данном подходе строится набор случайных хорд в объёме дендритного шипа, соединяющих его внешние границы, после чего формируется гистограмма. При достижении количства хорд n=30 000 вероятностные колебания гистограммы становятся незначительно малы. Описанные метрики использовались для кластеризации и классификации датасета.
Классификация по предопределённым морфологическим группам является широко используемым подходом к анализу морфологии дендритных шипиков. В данном подходе шипики делятся на фиксированные категории, такие как тонкие, грибовидные и пеньковые. Классификация обычно выполняется экспериментатором полуавтоматическим способом, что ведёт к значительной ошибке. Мы разработали основанный на алгоритме машинного обучения инструмент классификации, который классифицирует шипики по указанным выше категориям на основе консенсуса, достигнутого путём ручной разметки обучающего датасета 8 различными экспертами. Точность такого метода при классификации с использованием набора классических морфологических признаков сопоставима с экспертной разметкой (>77%). Данный подход позволяет снизить необъективность и трудоёмкость классификации.
Последние исследования, в том числе с использованием прижизненной микроскопии in vitro и in vivo, свидетельствуют в пользу того, что формы дендритных шипиков представляют собой континуум, а не чётко разделённые классы [3]. В связи с этим существует необходимость в разработке надёжного метода оценки и изучения морфологии дендритных шипиков. Нами разработан инструмент кластеризации, где количество групп и их содержание определяется данными, а не экспериментатором. Инструмент представлен алгоритмами k-средних и DBSCAN. Для определения количества кластеров представлены три различных метода: метод силуэта; метод плеча; а также новый, разработанный нами, метод максимизации критерия расхождения классов. Данный метод основан на предположении, что качество кластеризации лучше, когда кластеры максимально отличаются друг от друга по количеству представленных в них классов грибовидных/тонких/пеньковых шипиков, размеченных экспертами. Преимущество такого подхода заключается в том, что в нём учитывается конкретный тип данных для кластеризации, в то время как без данной информации оценка качества кластеризации затруднена. Кластеризацию с применением метрики CLDH даёт стабильное число кластеров — n=5 для всех трёх описанных выше методов. В определённых кластерах содержатся схожие по форме дендритные шипики, что было валидировано экспертами. Для набора классических метрик количество кластеров значительно варьировало: от n=4 до n=14. Подобные данные позволяют сделать предположение, что более сложная метрика CLDH содержит в себе достаточное количество информации о форме синапса для выполнения кластеризации.
Полный текст
Синапс — зона специализированного контакта между двумя нейронами, через который осуществляется передача информации от одной клетки к другой. Формирование синаптических контактов и передача через них сигналов с помощью электрических импульсов — это фундаментальная особенность нейрональных клеток. Со стороны аксона синапс формируется аксональным бутоном, а со стороны дендрита — дендритным шипиком, специализированным выростом дендритной мембраны. Дендритные шипики характеризуются большим разнообразием форм и размеров, которые в сильной степени варьируются между различными отделами мозга, типами клеток и видами животных. Морфология дендритных шипиков изменяется при нейроонтогенетических и нейродегенеративных заболеваниях, а также в ответ на действие внешних стимулов. Считается, что данный процесс обеспечивает синаптическую пластичность, тем не менее требуются дальнейшие исследования для установления связи между формой и функцией шипиков. Для решения данной задачи в современной нейробиологии имеется необходимость разработки методов анализа морфологии синапсов на трёхмерных изображениях нейронов. Нами разработано программное обеспечение с открытым исходным кодом для сегментации дендритных шипиков из трёхмерных изображений дендритов, вычисления 10 наиболее широко используемых морфологических признаков, адаптированных к трёхмерному представлению [1, 2], и выполнения классификации и кластеризации датасета дендритных шипиков для анализа их формы. Помимо численных признаков описания формы шипика было предложено использовать гистограмму длин хорд (chord length distribution histogram, CLDH). В данном подходе строится набор случайных хорд в объёме дендритного шипа, соединяющих его внешние границы, после чего формируется гистограмма. При достижении количства хорд n=30 000 вероятностные колебания гистограммы становятся незначительно малы. Описанные метрики использовались для кластеризации и классификации датасета.
Классификация по предопределённым морфологическим группам является широко используемым подходом к анализу морфологии дендритных шипиков. В данном подходе шипики делятся на фиксированные категории, такие как тонкие, грибовидные и пеньковые. Классификация обычно выполняется экспериментатором полуавтоматическим способом, что ведёт к значительной ошибке. Мы разработали основанный на алгоритме машинного обучения инструмент классификации, который классифицирует шипики по указанным выше категориям на основе консенсуса, достигнутого путём ручной разметки обучающего датасета 8 различными экспертами. Точность такого метода при классификации с использованием набора классических морфологических признаков сопоставима с экспертной разметкой (>77%). Данный подход позволяет снизить необъективность и трудоёмкость классификации.
Последние исследования, в том числе с использованием прижизненной микроскопии in vitro и in vivo, свидетельствуют в пользу того, что формы дендритных шипиков представляют собой континуум, а не чётко разделённые классы [3]. В связи с этим существует необходимость в разработке надёжного метода оценки и изучения морфологии дендритных шипиков. Нами разработан инструмент кластеризации, где количество групп и их содержание определяется данными, а не экспериментатором. Инструмент представлен алгоритмами k-средних и DBSCAN. Для определения количества кластеров представлены три различных метода: метод силуэта; метод плеча; а также новый, разработанный нами, метод максимизации критерия расхождения классов. Данный метод основан на предположении, что качество кластеризации лучше, когда кластеры максимально отличаются друг от друга по количеству представленных в них классов грибовидных/тонких/пеньковых шипиков, размеченных экспертами. Преимущество такого подхода заключается в том, что в нём учитывается конкретный тип данных для кластеризации, в то время как без данной информации оценка качества кластеризации затруднена. Кластеризацию с применением метрики CLDH даёт стабильное число кластеров — n=5 для всех трёх описанных выше методов. В определённых кластерах содержатся схожие по форме дендритные шипики, что было валидировано экспертами. Для набора классических метрик количество кластеров значительно варьировало: от n=4 до n=14. Подобные данные позволяют сделать предположение, что более сложная метрика CLDH содержит в себе достаточное количество информации о форме синапса для выполнения кластеризации.
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ
Вклад авторов. Все авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).
Источник финансирования. Исследование профинансировано Министерством науки и высшего образования РФ в рамках Программы стратегического академического лидерства «Приоритет 2030» (соглашение 075-15-2023-380 от 20 февраля 2023 г.).
Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.
Об авторах
П. И. Васильев
Санкт-Петербургский политехнический университет Петра Великого
Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург
Д. C. Смирнова
Санкт-Петербургский политехнический университет Петра Великого
Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург
В. С. Чуканов
Санкт-Петербургский политехнический университет Петра Великого
Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург
И. Б. Безпрозванный
Санкт-Петербургский политехнический университет Петра Великого; UT Southwestern Medical Center at Dallas
Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург; Даллас, США
Е. И. Пчицкая
Санкт-Петербургский политехнический университет Петра Великого
Автор, ответственный за переписку.
Email: pchitskaya.ei@edu.spbstu.ru
Россия, Санкт-Петербург
Список литературы
- Kashiwagi Y., Higashi T., Obashi K., et al. Computational geometry analysis of dendritic spines by structured illumination microscopy // Nat Commun. 2019. Vol. 10, N 1. P. 1285–1285. doi: 10.1038/s41467-019-09337-0
- Bokota G., Magnowska M., Kuśmierczyk T., et al. Computational approach to dendritic spine taxonomy and shape transition analysis // Front Comput Neurosci. 2016. Vol. 10. P. 140. doi: 10.3389/fncom.2016.00140
- Pchitskaya E., Bezprozvanny I. Dendritic spines shape analysis-classification or clusterization? Perspective // Front Synaptic Neurosci. 2020. Vol. 12. N 31. doi: 10.3389/fnsyn.2020.00031