Байесовская машина на мемристорах
За последние несколько десятилетий производительность моделей машинного обучения в различных реальных задачах значительно улучшилась. Однако обучение этих моделей, а также их реализация по-прежнему требует огромных затрат энергии и вычислительной мощности.
Поэтому инженеры во всем мире пытаются разработать альтернативные аппаратные решения, которые будут более эффективно запускать модели искусственного интеллекта. Это может способствовать их широкому использованию и повышению их устойчивости. Некоторые из этих решений основаны на мемристорах, устройствах памяти, которые могут хранить информацию без потребления энергии.
Мемристоры – это электрические компоненты на основе наноустройств, которые ограничивают или регулируют поток электрического тока в цепи, а также заранее регистрируют, сколько энергии прошло в ней. Поскольку они выполняют как вычисления, так и хранение информации, эти устройства могут лучше выполнять задачу обработки информации подобно человеческому мозгу.
Сообщество ученых из университетов Гренобля, Парижа и Сорбонны разработали прототип байесовской машины (т.е. устройство на основе теоремы Байеса) с использованием мемристоров. Предложенная ими система, представленная в статье, опубликованной в Nature Electronics, оказалась более энергоэффективной, чем используемые в настоящее время аппаратные решения.
"Искусственный интеллект достигает больших успехов, но сталкивается с проблемой: он потребляет значительное количество энергии", – говорит Дэмиен Керлиоз, один из ученых, проводивших исследование. "Теперь мы знаем, что это потребление происходит из-за разделения в компьютерах функций вычислений и памяти. Поскольку искусственный интеллект использует много данных, ему требуется много памяти, доступ к которой требует больших затрат энергии. Другое дело – человеческий мозг. Он гораздо более энергоэффективен, потому что функции памяти расположены как можно ближе к вычислительным функциям, и мы хотели воспроизвести эту стратегию".
"До недавнего времени мемристоры были новой технологией, и мы не могли создавать с их помощью полные системы", – пояснил Керлиоз. "Теперь наша команда построила байесовскую машину, небольшой искусственный интеллект с мемристорами. Прототип включает 2048 мемристоров на основе оксида гафния и 30 080 кремниевых транзисторов (MOSFET)".
Архитектура машины проектируется путем написания закона Байеса таким образом, чтобы его реализация была естественной в соответствии с принципами распределенной памяти и стохастических вычислений, позволяя схеме функционировать исключительно с использованием локальной памяти и минимальным перемещением данных. Исследователи используют гибридный комплементарный процесс металл-оксид-полупроводник/мемристор и доказывают, что увеличенная конструкция машины более энергоэффективна в практической задаче распознавания жестов, чем стандартная реализация байесовского вывода на микроконтроллере.Она может распознавать определенные человеческие жесты, используя в тысячи раз меньше энергии, чем традиционное аппаратное решение на основе микроконтроллера. Также эта байесовская машина обеспечивает мгновенное включение/выключение и устойчива к одиночным сбоям.
"Большая часть исследований в области машинного обучения на основе мемристоров направлена на внедрение глубокого обучения", – сказал Керлиоз. "Это, конечно, чрезвычайно важная цель, поскольку глубокое обучение сегодня весьма успешно. Однако оно имеет некоторые ограничения: его результаты необъяснимы, и оно не работает, когда доступно мало данных. Здесь мы выбрали для реализации байесовских рассуждений альтернативный подход к искусственному интеллекту, который не очень хорошо работает в приложениях с большими данными, где так успешно работает глубокое обучение, но превосходен в ситуациях с небольшими данными и дает полностью объяснимые результаты".
В будущем байесовская машина на основе мемристоров, созданная этой группой исследователей, может помочь повысить энергоэффективность моделей ИИ, а также потенциально вдохновить на разработку других подобных решений. Это может быть особенно полезно для критичных к безопасности приложений, таких как медицинские датчики и схемы для контроля безопасности промышленных объектов.