медицина

Поиск иголки в стоге сена: искусственный интеллект научился предсказывать генетические заболевания

Новая модель ускорит медленный процесс сопоставления генетических мутаций с заболеваниями, быстро отвергая маловероятных виновников
National Cancer Institute/Unsplash
National Cancer Institute/Unsplash

Распознать и предотвратить развитие генных мутаций, отравляющих жизнь человеку сейчас или в будущем, совсем не просто. Процесс обусловлен разнообразием генома человека, огромным объемом генетических данных и различными типами мутаций. Однако мучениям ученых, кажется, подошел конец — разработана новая модель ИИ, именуемая AlphaMissense, на которую ляжет бремя решения столь непростой задачи. Рассказываем подробнее.

Поиск мутаций всегда был сложным

Выявить точную генетическую мутацию, вызывающую какое-нибудь необычное заболевание, всегда было проблемой, напоминающей поиск иголки в стоге сена.

Дело в том, что в генетическом коде ДНК таятся миллионы потенциальных виновников — мутаций, способных внести хаос в биологию человека. Особый интерес представляют так называемые миссенс-варианты — однобуквенные изменения в коде, приводящие к тому, что в белке образуется другая аминокислота. Аминокислоты — это строительные блоки белков, а белки — это строительные блоки всего остального в организме. Поэтому даже небольшие изменения имеют большие и далеко идущие последствия.

В геноме человека насчитывается 71 млн возможных миссенс-вариантов. Большинство из них безвредны, однако некоторые причастны к таким генетическим заболеваниям, как серповидно-клеточная анемия и муковисцидоз, а также к более сложным состояниям, например, диабету 2-го типа, которые вызываются комбинацией небольших генетических изменений. Как узнать, какие из этих вариантов действительно опасны? По большому счету, никак.

Из всех миссенс-вариантов, обнаруженных у человека, только 2% в результате многолетних кропотливых и дорогостоящих исследований ученые отнесли к патогенным или доброкачественным. Тем временем изучение влияния лишь одного миссенс-варианта занимает месяцы.

Проблему решил ИИ

Компания Google DeepMind выпустила инструмент, позволяющий ускорить этот процесс. AlphaMissense — это модель машинного обучения, которая позволяет анализировать миссенс-варианты и предсказывать вероятность того, вызывают ли они заболевание, с точностью до 90%. Это лучший результат среди всех существующих инструментов.

Модель построена на основе AlphaFold, другой модели DeepMind, которая предсказывает структуру сотен миллионов белков по их аминокислотному составу. Новая версия работает немного иначе. Вместо того, чтобы предсказывать структуру белка, AlphaMissense действует скорее как большая языковая модель подобно ChatGPT от OpenAI.

AlphaMissense обучили языку биологии человека (и приматов), поэтому она знает, как должны выглядеть нормальные последовательности аминокислот. Когда модели предъявляется неправильная последовательность, она обращает на нее внимание, как, например, на несочетаемое слово в предложении. Другими словами, если мы подставим в предложение странный термин на русском, то человек, знакомый с русским, сразу поймет, изменит ли это смысл предложения. Понимает это и модель.

Вице-президент DeepMind по исследованиям, использует аналогию с книгой рецептов. Если AlphaFold обращал внимание на то, как именно ингредиенты связываются друг с другом, то AlphaMissense предсказывает, что произойдет, если использовать совсем не тот ингредиент. Таким образом, модель присвоила каждому из 71 млн возможных миссенс-вариантов балл патогенности от 0 до 1, основываясь на том, что ей известно о влиянии других близкородственных мутаций: чем выше балл, тем больше вероятность того, что конкретная мутация вызовет заболевание.

Исследователи DeepMind сотрудничали с Genomics England — государственным органом, изучающим растущий массив генетических данных, собранных Национальной службой здравоохранения Великобритании, чтобы проверить предсказания модели на основе реальных исследований уже известных миссенс-вариантов. В документе утверждается, что точность AlphaMissense составляет 90%, при этом 89% всех вариантов уже классифицированы. Это невероятный доселе результат.

Специалисты, пытающиеся выяснить, может ли какой-либо миссенс-вариант стать причиной того или иного заболевания, теперь могут отыскать его в таблице и узнать прогнозируемый балл патогенности. AlphaMissense поможет ученым в различных областях ускорить изучение генетических вариантов. Это, в свою очередь, позволит быстрее диагностировать заболевания и находить новые методы лечения. Эксперты надеются, что эти предсказания дадут дополнительное представление о том, какие варианты вызывают заболевания.

Ученые подчеркивают, что прогнозы не должны использоваться сами по себе, а только как руководство к действию в исследованиях. AlphaMissense поможет расставить приоритеты в медленном процессе сопоставления генетических мутаций с заболеваниями, быстро исключая маловероятных виновников.

Анастасия Дегтярева