Прогнозирование стабильности ферментов

Ферменты – важные биологические катализаторы, которые способны ускорять биохимические реакции в живых организмах. Они играют центральную роль во многих отраслях индустрии: от создания лекарств и разработки новых ферментов до производства пищевых продуктов и сельского хозяйства. Однако при определенных условиях ферменты нестабильны, что затрудняет их использование и снижает их эффективность. Чтобы лучше понимать их поведение, команда QuData провела исследования по прогнозированию термостабильности ферментов.

Задача

Ферменты (энзимы) – это белки, действующие как катализаторы в химических реакциях в живых организмах. Они играют основополагающую роль в различных биологических процессах и применяются во многих отраслях промышленности. Ферменты добавляют при производстве пищевых продуктов и напитков, улучшая качество продукции. Они используются в разработке фармацевтических препаратов и жизненно важны для превращения биомассы в биотопливо. Это всего лишь несколько примеров разнообразных способов применения ферментов.

Однако важно отметить, что многие ферменты имеют проблемы, связанные со стабильностью, особенно в неблагоприятных условиях. Эта нестабильность не только влияет на их продуктивность, но и ограничивает количество белка, который может вырабатываться в клетке. Поэтому существует настоятельная потребность в эффективных вычислительных методах для прогнозирования и повышения стабильности белка, что вызывает значительный интерес как в технической, так и в научной сферах.

Понимание и точное прогнозирование стабильности белков является основополагающей задачей в биотехнологии. Эти знания широко используются: от повышения эффективности ферментов до решения глобальных проблем в сфере устойчивого развития или углеродной нейтральности. Повышение стабильности ферментов может ускорить темпы научных экспериментов и снизить затраты на их проведение.

Обзор решения

Целью нашего исследования было спрогнозировать термостабильность разных ферментов. Данные о термостабильности, измеренные экспериментально (температура плавления), охватывали как естественные последовательности, так и последовательности, которые были созданы с помощью поодиноких или множественных мутаций на основе естественных последовательностей.

Успешное решение этой задачи способствует решению основной проблемы по улучшению стабильности белков, что позволит быстрее и выгоднее создавать новые белки, в том числе высококачественные ферменты и лекарственные препараты.

В ходе исследования наша команда сначала использовала определенный подход под названием "Thermonet", который продемонстрировал обнадеживающие результаты.

Мы экспериментировали с разными архитектурами нейронных сетей и выбрали упрощенный вариант, показавший хорошие результаты. Для дальнейшего усовершенствования наших прогнозов мы использовали такой инструмент как "molekulekit" для создания дескрипторов признаков и еще больше улучшили производительность модели.

Кроме того, команда QuData обнаружила, что могут эффективно прогнозировать термическую стабильность. Мы объединили результаты Rosetta и разработанную модель под названием "AVGP3". И хотя эта комбинация оказалась успешной, она не была выбрана в качестве окончательного решения.

Следующим этапом мы включили в созданный еще один результат, что еще больше повысило результативность модели. Мы использовали весовые коэффициенты из таблицы "Pose_Energies" для создания ансамбля под названием "RankedRosetta".

В целом, проведенное исследование подчеркивает значимость оценок Rosetta и среднего значения параметра донора водородных связей для прогнозирования термической стабильности ферментов.

Наше исследование было инициировано конкурсом, проведенным организацией Novozymes. Участникам предложили создать модель прогнозирования и ранжирования термостабильности различных ферментов на основе экспериментальных данных о температуре плавления, полученных от исследовательской лаборатории Novozymes. Ознакомиться с подробностями соревнования и результатами исследования можно здесь.

Технические детали

Стремясь улучшить прогнозы термической стабильности, команда QuData исследовала различные стратегии и технологии. Ниже изложены ключевые этапы разработки нашего подхода.

Первоначальный этап – nesp-thermonet: мы начали с того, что признали способность подхода "nesp-thermonet" хорошо прогнозировать термостабильность ферментов.

Исследования архитектур нейронных сетей: далее мы подробно изучили информацию, представленную в этой статье, что побудило нас исследовать разные архитектуры нейронных сетей. В конечном итоге мы выбрали модель Resnet-3D.

Обрезка и упрощение нейронной сети: для дальнейшего анализа архитектуры и определения ключевых факторов, влияющих на прогнозирование, мы применили итеративный процесс обрезки, который привел к разработке упрощенной архитектуры. Эта архитектура имеет такие же входные данные, что и при использовании "Thermonet", (14,16,16,16,16).

Использование дескрипторов признаков: чтобы улучшить наши прогнозные показатели, мы использовали дескрипторы признаков, созданные с помощью утилиты "molekulekit". С помощью экспериментов мы определили оптимальные дескрипторы с размером блока 16 и размером вокселя 0,5. Такая оптимизация повысила прогнозные показатели и способствовала созданию модели "AVGP3", которая впоследствии была интегрирована в финальный ансамбль.

Исследование показателей Rosetta: на основе сведений, представленных в Deletion-specific ensemble, мы наблюдали за возможностями оценок Rosetta прогнозировать термостабильность. Наша команда интегрировала показатели Rosetta с моделью "AVGP3" в ансамбль. Затем мы объединили модель "AVGP3" с ансамблем Deletion-specific, используя определенные весовые распределения (0,2 и 0,8).

Использование таблицы "Pose_Energies": мы тщательно изучили вклад оценок Rosetta, проанализировав таблицу "Pose_Energies" в файлах pdb, что содержит 20 параметров и связанные с ними весовые коэффициенты. Эти параметры сыграли ключевую роль в создании нашего подхода.

Рейтинг ансамбля Rosetta: в процессе наших исследований сформировался инновационный подход, предполагавший использование весовых коэффициентов для ансамбля. Независимые прогнозы термостабильности были сгенерированы для каждого параметра отдельно для всех мутаций. Затем эти индивидуальные прогнозы были объединены в конфигурацию ансамбля с использованием весовых коэффициентов таблицы "Pose_Energies". Этот ансамбль был назван "RankedRosetta".

Финальная интеграция ансамбля: окончательные результаты с форумов сообщества были интегрированы в наш ансамбль, что еще больше повысило наш общий результат. Формула интеграции была выражена как (0,05*Rasp + 0,95*0,615).

Подводя итог, можно сказать, что комплексный подход нашей команды QuData привел к заметным результатам. Проведенное исследование определило значимое влияние оценок Rosetta на всю молекулярную структуру, а также влияние среднего параметра донора водородных связей вблизи мест мутаций на прогноз термостабильности ферментов.