Комп’ютерна діагностика раку молочної залози

Удосконалення скринінгу раку молочної залози за допомогою штучного інтелекту для точної та ранньої діагностики онкологічних захворювань

Наше рішення на основі штучного інтелекту призначене для підвищення точності та ефективності діагностики раку молочної залози. Зосередившись на ранньому виявленні онкозахворювання, наша модель сприяє своєчасному втручанню та дозволяє практикуючим лікарям отримати ще один обґрунтований погляд на перебіг хвороби. Створена синергія між передовими технологіями та медичним досвідом забезпечує швидке та успішне лікування пацієнтів.

Завдання

Рак молочної залози залишається серйозною проблемою у всьому світі. Щороку він вражає мільйони жінок. Існуючий стан діагностики онкологічних захворювань має певні проблеми, які вимагають інноваційних рішень. Традиційні методи часто ґрунтуються на суб’єктивній інтерпретації мамографії, що призводить до непослідовності та можливості залишити хворобу непоміченою. Крім того, зростаючий обсяг знімків створює навантаження на систему охорони здоров’я. Наявна ситуація вже зараз потребує швидких і надійних способів інтерпретації результатів.

Команда Qudata вирішила розробити інтелектуальну систему, яка могла б аналізувати результати мамографії з високою точністю, скоротити час для їх інтерпретації та надати медичним фахівцям надійний інструмент для покращення догляду за пацієнтами.

Огляд рішення

Наша відповідь на виклик щодо покращення діагностики раку молочної залози – це новітня система на основі штучного інтелекту, яка поєднує в собі алгоритми глибинного навчання та вдосконалений аналіз зображень. Таке інноваційне рішення покликане спростити процес діагностики, мінімізувати рівень суб’єктивності та прискорити інтерпретацію результатів без втрати якості.

За допомогою сучасних технологій наша модель перетворює зображення мамографії на великі бази даних, що дозволяє забезпечити швидкий і точний аналіз. Інструменти ШІ класифікують отримані результати, застосовуючи визначені категорії, і формують послідовну та стандартизовану інформацію для її подальшого використання практикуючими лікарями. Цей підхід не тільки підвищує точність діагностики, але й дозволяє медичним працівникам швидко приймати обґрунтовані рішення.

Вплив створеної системи ШІ на практиці є безцінним: прискорена діагностика, зменшення кількості людських помилок і, зрештою, загальне покращення результатів лікування пацієнтів. Завдяки повній інтеграції штучного інтелекту ми прагнемо переосмислити діагностику раку молочної залози та встановити новий стандарт для медичних інновацій.

Технічні деталі

Під час роботи ми помітили, що більшість існуючих досліджень у галузі діагностики раку молочної залози зосереджені на розрізненні злоякісних і доброякісних новоутворень на мамографії. Однак лише обмежена кількість методів здатна класифікувати результати мамографії за кількома параметрами. Це надихнуло нас на розробку системи глибинного навчання, яка може генерувати висновок за багатьма параметрами для класифікації мамографії BI-RADS (Breast Imaging-Reporting and Data System; BI-RADS 1-5).

Для навчання нейронної мережі ми використали набір даних VinDr. Він примітний тим, що є найбільшою загальнодоступною збіркою знімків у своїй галузі, що загалом містить 20 000 зображень. Датасет VinDr, використаний нами виключно в некомерційних цілях, зробив значний внесок у розвиток нашої нейронної мережі. Розподіл набору даних за категоріями BI-RADS виглядає наступним чином: BIRADS 1 (67,03%), BIRADS 2 (23,38%), BIRADS 3 (04,65%), BIRADS 4 (03,81%) і BIRADS 5 (01,13%).

Через поширеність мамографії з великими за площею ділянками чорного фону, які не містять релевантної інформації, процес навчання на таких знімках може вимагати значних обчислювальних ресурсів. Для вирішення цієї проблеми, ми використали OpenCV, бібліотеку комп’ютерного зору, щоб ідентифікувати та ізолювати відповідну ділянку молочної залози на початкових знімках. Точна локалізація цієї області дозволила нам значно зменшити обчислювальні ресурси та зосередитися лише на важливих ділянках знімків для навчання нашої моделі.

Для підвищення контрастності та яскравості зображення було використано техніку кадрування (windowing). Вибравши певне вікно значень пікселів і поставивши їх у новий діапазон, ми значно покращили візуальну якість зображення. Цей процес дозволив нам виділити важливі особливості та деталі, одночасно оптимізувавши загальний вигляд для кращої інтерпретації та аналізу.

Для вирішення проблеми дисбалансу класів були використані різні методи доповнення даних, а саме: змішування (cut-mix), вилучення (drop-out) та афінне перетворення.

Побудова моделі спиралася на використання сучасної архітектури, відомої як Convnextv1-small, яка вже пройшла попереднє навчання на наборі даних ImageNet. В якості оптимізатора було використано стохастичний градієнтний спуск (SGD), де імпульс = 0.9. Похибка обчислювалася за допомогою функції крос-ентропії. При оцінці ефективності моделі ми використовували показник F1 для 5-класової класифікації BI-RADS. Модель навчалася протягом 60 епох з розміром партії 8 на графічному процесорі NVIDIA Tesla T4.

Класифікаційна модель може використовуватися для ідентифікації та локалізації ділянок ураження. Для цього використовується техніка gradCAM для створення теплових карт, які можуть точно визначити зони інтересу на мамографії.

Стек технологій

OpenCV

OpenCV

PyTorch

PyTorch

Python

Python