
Структура белка KRAS. Фото: Unsplash.com
Над проблемой сворачивания (укладки, формирования пространственной структуры или попросту фолдинга) белка биологи бились последние полвека. Специально обученный ИИ компании DeepMind решил многие сложнейшие задачи в этой области за 15 минут. Предсказание пространственной структуры белка софтом AlphaFold многие называют первым значимым результатом работы ИИ и значительным шагом в его развитии.
В журнале Nature сотрудники DeepMind выложили в общий доступ более 350 тысяч предсказанных белковых структур, и результат скоро смогут повторить лаборатории по всему миру. Среди предсказанных структур могут находиться ключи к разгадке лечения рака и болезни Альцгеймера, борьбы с ковидом, а также новых способов ресайкла пластика.
Прорыв произошел в ноябре 2020 года. Команда DeepMind (которая, напомню, является дочерней компанией Google Alphabet) выиграла в конкурсе по прогнозированию структуры белка CASP 14 (технически предсказание проводится по аминокислотной последовательности трехмерной структуры белка). В июле 2021-го DeepMind опубликовала первый материал с полным кодом и методологией проекта AlphaFold 2 в журнале Nature.
Во второй статье, написанной при участии Лаборатории европейской молекулярной биологии Европейского института биоинформатики, было объявлено о возможности предсказания 3D-структуры 98,5% человеческого протеома и доступности данных бесплатно через Protein Structure Database.
Какой ресайкл? Кровь из глаз.
Интересно, учитываются ли как-то посттрансляционные модификации в предсказаниях?
Вклад АльфаФолд в открытие лекарств довольно ограничен. Во первых, знание структуры белка, независимо от её точности, решает лишь очень малую часть проблем, связанных с разработкой лекарства (порядка 1%). Во вторых, в последние годы, в примерно 90% случаев, к началу проекта, структура белка - потенциальной мишени для лекарства либо уже определена экспериментально, либо может быть надёжно предсказана исходя из принципа "сходная последовательность (аминокислот) - сходная укладка".
Ошибка в 1,6 ангстрома говорит о том, что модель, скорее всего, пере-тренирована (overtrained). Мой личный опыт: я воспользовался структурами от АльфаФолд 2 трижды, из них две структуры выглядели разумно (хотя у меня и не было возможности этого проверить) и одна была явно неверной (была возможность в этом убедиться). Так что, в моей практике эффективность - 66%.
А каковы были оценки алгоритма по достоверности в успешных и ошибочных случаях?
Согласно АльфаФолд, интересующие меня части белков были предсказаны с оценкой Very high (confidence) (pLDDT > 90).
Побольше бы таких комментов
"ресайкл" пластика :(
Не, ребята, в русском пока так еще даже в Москве не говорят. Или уже? :)
.
АльфаФолд мощная штука, но надо понимать - глубокое машинное обучение строится на большом количестве ранее собранной информации. Именно те биологи, которые тратили свои гранты целиком на расшифровку хотя бы одного белка - именно они создали основу, на которой АльфаФолд смог обучиться.
И в том числе поэтому они пока без работы не останутся :)
Я думаю, в первую очередь AlphaFold обязан своим появлением тому умному человеку, который 500 тысяч лет назад сделал топор. Или нет, погодите, до него ведь кто-то додумался обрабатывать камень пару миллионов лет назад. Где бы мы были сейчас без этих гигантов мысли, которые не жалели ни времени, ни сил, недоедали и недосыпали, обтёсывая камни?
Чувствуется в вашем комментарии какая-то обида за биологов, хотя их вроде никто не собирался обидеть - в статье нет ни малейшего намёка на то, что их прежние заслуги не имеют значения, или что они теперь останутся не у дел. :)
Ну вот, пересказаны общие слова без понимания. Как у всех. Может бы лучше интервью у структурного биолога взяли, тот бы примеры привёл, как фолдинг работает и применяется.
Зачем это здесь?
Хоть кто то написал об этом на русском.
Спасибо.
Очень интересно , спасибо.