Компьютерная диагностика
рака молочной железы

Наше решение на основе искусственного интеллекта предназначено для повышения точности и эффективности диагностики рака молочной железы. Сосредоточившись на раннем выявлении онкозаболевания, наша модель способствует своевременному вмешательству и позволяет практикующим врачам получить еще одно обоснованное мнение про течение болезни. Созданная синергия между передовыми технологиями и медицинским опытом обеспечивает быстрое и успешное лечение пациентов.

Задача

Рак молочной железы является серьезной проблемой во всем мире. Ежегодно он поражает миллионы женщин. Нынешнее состояние диагностики онкологических заболеваний имеет определенные проблемы, требующие инновационных решений. Традиционные методы часто основаны на субъективной интерпретации маммографии, следствием чего может быть непоследовательность и вероятность оставить болезнь незамеченной. Кроме того, растущий объем снимков создает нагрузку на систему здравоохранения. Сложившаяся ситуация уже сейчас требует быстрых и надежных способов интерпретации результатов.

Команда Qudata решила разработать интеллектуальную систему, которая могла бы анализировать результаты маммографии с высокой точностью, сократить время для их интерпретации и предоставить медицинским специалистам надежный инструмент для улучшения ухода за пациентами.

Обзор решения

Наш ответ на существующий запрос по улучшению диагностики рака молочной железы – это новейшая система на основе искусственного интеллекта, сочетающая в себе алгоритмы глубокого обучения и усовершенствованный анализ изображений. Такое инновационное решение призвано упростить процесс диагностики, минимизировать уровень субъективности и ускорить интерпретацию результатов без потери качества.

С помощью современных технологий наша модель преобразует изображения маммографии в большие базы данных, что позволяет обеспечить быстрый и точный анализ. Инструменты ИИ категоризируют полученные результаты, применяя установленные классификации, и формируют последовательную и стандартизированную информацию для ее дальнейшего использования практикующими врачами. Этот подход не только повышает точность диагностики, но и позволяет медицинским работникам быстро принимать обоснованные решения.

Влияние созданной системы ИИ на практике бесценно: ускоренная диагностика, уменьшение количества человеческих ошибок и, наконец, общее улучшение результатов лечения пациентов. Благодаря полной интеграции искусственного интеллекта, мы стремимся переосмыслить диагностику рака молочной железы и установить новый стандарт для медицинских инноваций.

Технические детали

В ходе работы мы заметили, что большинство существующих исследований в области диагностики рака молочной железы сосредоточены на различении злокачественных и доброкачественных новообразований на маммографии. Однако лишь ограниченное количество методов способно классифицировать результаты маммографии по нескольким параметрам. Это вдохновило нас на разработку системы глубокого обучения, которая может генерировать вывод по многим параметрам для классификации маммографии BI-RADS (Breast Imaging-Reporting and Data System; BI-RADS 1-5).

Для обучения нейронной сети мы использовали набор данных VinDr. Он примечателен тем, что является крупнейшим общедоступным собранием снимков в своей области, в общей сложности 20 000 изображений. Датасет VinDr, использованный нами исключительно в некоммерческих целях, внес значительный вклад в развитие нашей нейронной сети.Распределение набора данных по категориям BI-RADS выглядит следующим образом: BIRADS 1 (67,03%), BIRADS 2 (23,38%), BIRADS 3 (04,65%), BIRADS 4 (03,81%) и BIRADS 5 (01,13%).

Из-за распространенности маммографии с большими по площади участками черного фона, которые не содержат релевантной информации, процесс обучения на таких снимках может потребовать значительных вычислительных ресурсов. Для решения этой проблемы, мы использовали OpenCV, библиотеку компьютерного зрения, чтобы идентифицировать и изолировать соответствующий участок молочной железы на изначальных снимках. Точная локализация этой области позволила нам значительно снизить вычислительные ресурсы и сосредоточиться только на важных участках снимков для обучения нашей модели.

Для повышения контрастности и яркости изображений была использована техника кадрирования (windowing). Выбрав определенное окно значений пикселей и переставив их в новый диапазон, мы значительно улучшили визуальное качество изображения. Этот процесс позволил нам выделить важные особенности и детали, одновременно оптимизировав общий вид для лучшей интерпретации и анализа.

Для решения проблемы дисбаланса классов были использованы различные методы дополнения данных: смешивание (cut-mix), извлечение (drop-out) и аффинное преобразование.

Построение модели опиралась на использование современной архитектуры, известной как Convnextv1-small, которая уже прошла предварительное обучение на наборе данных ImageNet. В качестве оптимизатора был использован стохастический градиентный спуск (SGD), где импульс = 0.9. Погрешность вычислялась с помощью функции кросс-энтропии. При оценке эффективности модели мы использовали показатель F1 для 5-классовой классификации BI-RADS. Модель обучалась в течение 60 эпох с размером партии 8 на графическом процессоре NVIDIA Tesla T4.

Классификационная модель может использоваться для идентификации и локализации участков поражения. Для этого используется техника gradCAM для создания тепловых карт, которые могут точно определить зоны интереса на маммографии.

Стек технологий

OpenCV

OpenCV

PyTorch

PyTorch

Python

Python