Анализ флуоресцентного биомаркера сетчатки с помощью ИИ

Использование машинного обучения для выявления заболеваний сетчатки на клеточном уровне. Современные техники обработки изображений для точной диагностики глаукомы

В сотрудничестве с компанией Novai наши разработчики применили методы машинного обучения и техники анализа изображений в клинической офтальмологии. Здесь мы сосредоточились на обнаружении заболевания сетчатки на клеточном уровне, используя изображения с низким разрешением. Эта задача была успешно выполнена благодаря профессиональному подходу и тесному сотрудничеству между командами.

Задача

Клиническая офтальмология является одной из многих областей, где методы диагностики, связанные с изображениями, формируют понимание глазных заболеваний, используя медицинские наборы данных. Машинное Обучение (МО) достигло больших успехов в решении многих задач визуального и слухового распознавания.
МО позволяет проводить комплексный, быстрый и неинвазивный анализ цифровых данных. В области медицинской визуализации используются постоянно растущая вычислительная мощность и облачное хранилище, а также новые алгоритмы и методы генерации данных. Возрастающий потенциал МО для выявления, классификации, идентификации и проверки специфических особенностей при заболевании глаз позволит практикам оказывать помощь с высокоинтеллектуальными инструментами и высококачественной диагностикой, а также дополнительно совершенствовать персонализированные услуги здравоохранения. Применение методов ИИ в медицинских задачах позволяет обеспечить безопасность данных и их эффективное использование. Обработка медицинских изображений с помощью ИИ доказала свою эффективность во многих сферах, где традиционные методы диагностики сильно зависят от опыта и знаний врачей, которые нельзя легко вычислить или измерить.
Наш партнер Novai, британский биотехнологический стартап, который разработал технологию DARC (Detection of Apoptosing Retinal Cells — обнаружение апоптоза в клетках сетчатки). Она сочетает в себе инновационный запатентованный биологический препарат с самым совершенным алгоритмом искусственного интеллекта для определения активности заболевания на клеточном уровне. Основной задачей было классифицировать биомаркеры, характерные для заболеваний глаз (глаукомы), на снимках глаз пациентов с разным разрешением.

Обзор решения

Основная проблема диагностики глаукомы на разных стадиях прогрессирования болезни может быть эффективно сведена к минимуму с помощью выявления специфических биомаркеров на фотографиях сетчатки пациента. Такой подход также имеет дополнительную пользу в связи с увеличением точек данных для тренировки методов классификации МО, поскольку количество маркеров (пятен) гораздо больше, чем количество изображений глаз.
Высокоуровневый конвейер для решения вопроса включал несколько этапов:

  • проверка и очистка данных
  • регистрация изображения
  • поиск предполагаемых пятен
  • фильтрация отобранных пятен
  • бинарная классификация пятен
Регистрация изображения — процесс определения преобразования, отображающий точки первого изображения к гомологичным точкам объекта на втором изображении. Для изображений с высоким разрешением можно добиться значительной оптимизации, используя принцип пирамиды – структуры с несколькими разрешениями; регистрация сначала выполняется на самом неотработанном уровне с использованием меньшего количества пикселей. Поиск предполагаемых пятен осуществляется с помощью процедуры сопоставления шаблонов с применением метода нулевой нормализованной взаимной корреляции (ZNCC).
На завершающем этапе отобранные кандидаты были введены в специально обученную свертывающую нейронную сеть (согласование CNN с архитектурой MobineNet оказалось достаточно сбалансированным выбором, что позволило быстро переучиваться на новых данных, эффективно выполнять процессы и обеспечить высокую точность определения целей). В настоящее время решение тестируется и внедряется в учреждениях здравоохранения.

Технические детали

Первым этапом была проверка на корректность данных, предоставленных партнёрами, устранение дубликатов, выяснение согласованности данных. Одни и те же изображения размечались несколькими экспертами, вследствие чего нередко на различных версиях размеченного изображения были отмечены различные дефекты глаза (видимые пятна, представляющие собой маркеры заболевания глаза). Для этого мы использовали библиотеку SimpleITK - “Insight Segmentation and Registration Toolkit” (интерфейс которой позволяет выполнять рабочие процессы анализа изображений с большинством фильтров обработки изображений и удобным синтаксисом). Эта библиотека хорошо себя зарекомендовала для анализа медицинских изображений. Многие исследовательские лаборатории включают SimpleITK в качестве ключевого строительного блока, поскольку он обеспечивает широкий выбор компонентов для фильтрации изображений и для ввода-вывода изображений с удобным интерфейсом.
В нашем технологическом процессе - пайплайне - вначале запускается python скрипт, который формирует объект, с которым дальше работает программа, выделяя нужные компоненты. На первом этапе производится первое аффинное преобразование с выравниванием геометрических центров двух изображений и построения регистрационного экземпляра.
Далее устанавливается тип метрики и маска. Оптимизатор использует метод градиентного спуска. После окончания работы оптимизатора формируется результат работы и передаётся на второе BSpline-преобразование, которое выполняется аналогично аффинному.
После чего данные отправляются в CNN архитектуру, реализованную на фреймворке pytorch, для подсчёта количества пятен.
Ниже представлена архитектура CNN с 5521 параметром:

Стек технологий

Python

Python

SimpleITK

SimpleITK

PyTorch

PyTorch