Chemoinformatics News

ПЕЛЕ ИЗ БАРСЕЛОНЫ РОДОМ ИЗ МОНТЕ-КАРЛО,

ИЛИ БАЙКИ ИЗ ЖИЗНИ БИОИНФОРМАТИКОВ

Один раз уже как-то упоминал этот сервер здесь, до конца так и не разобравшись в запуске. Сейчас рассказываю про него снова, уже сделав несколько, по крайней мере, технически успешных симуляций.

Итак, в среде биоинформатиков уже достаточно давно наметилась тенденция, что обычный докинг – это скучно и неинтересно, для хорошей статьи, это рутина уже, она всех заела, а вот нет ли чего покруче... Чтобы и протеин, и лиганд гибкие, и это всё в динамике... Да и на самом деле – если докинг всего лишь полугибкий, картинка взаимодействий будет лишь приблизительна. А уже если исходная конформация белка не та... Или это вообще модель по гомологии... В отдельных невезучих случаях точность плавно перерастает в ранг "плюс-минус гиппопотам" со всеми вытекающими.

Высшим классом ответа на такой вопрос читателя, рецензента, или самого себя была бы симуляция молекулярной динамики. Хорошо, но требует больших вычислительных ресурсов. Везёт, если таковые есть. А вот если нет... Сегодня и расскажу про одну любопытную идею для замены.

Итак, героя нашего рассказа зовут Пеле. Да-да, как футболиста. PELE – Protein Energy Landscape Exploration – Исследование ландшафта энергии белка. И даже живёт он в солнечных странах. Только не в Бразилии, а в Барселоне, в Каталонии. Или всё же в Испании? Ладно, не нам решать. Итак, PELE – Web-сервер, принадлежащий Национальному Суперкомпьютерному центру Каталонии (название официальное). Соответственно, помимо самой инфраструктуры сайта, есть ещё вычислительный кластер. Вот ссылка на сервер: https://pele.bsc.es/pele.wt А вот про него статьи: https://pubs.acs.org/doi/abs/10.1021/ct0501811 https://academic.oup.com/nar/article/41/W1/W322/1107344

Итак, как и обычные программы//сервера молекулярной динамики, Пеле предназначен для моделирования динамики системы белок-лиганд, её движений. Но это всё же не молекулярная динамика. В молекулярной динамике симуляция строится на основе интегрирования уравнений Ньютона для материальной точки применительно к нашим атомам и молекулам, а здесь в основе моделирования лежит метод Монте-Карло. Пеле, Барселона, Монте-Карло... Какой-то средиземноморский цимес получается... В итоге всё равно получается траектория с определённым числом шагов, но привязки ко времени тут нет, в отличие от молекулярной динамики. Вместо неё более придётся оперировать энергией связи (по умолчанию) или другими числовыми параметрами системы (опционально).

Заходим на сайт, регистрируемся, авторизуемся в секции Login. Можно без регистрации, правда, но тогда результаты будет хранить только 10 дней, с регистрацией месяц.

Нажимаем кнопочку Submit. Что радует – интерфейс дружелюбный. Надо загрузить белок с лигандом в одном PDB, лиганд в виде HETATM. дальше выбираем вид симуляции. Так, что тут у нас есть... Так желанный многими Ligand binding refinement! Докинг, говорите, неточный? И это скучно? Сейчас уточним и украсим! Тогда перед запуском Ваш лиганд уже должен быть "докирован" в белок. А можно просто "положить" его рядом и заставить ползать по белку в поисках своего сайта связывания. Белок при этом тоже будет колебаться. Можно сгенерировать конформации Вашего белка в нормальном режиме, можно изучить миграцию лиганда... в общем, выбирай на вкус!

Я пока рассмотрю на примере рефайнмента, так как познакомился пока что только с ним.

Итак, загрузили белок. А дальше в удобном для пользователя режиме прямо на страничке отправки задания решаем те же головные боли, что характерны для молдинамики: протонирование белка, подготовку (параметризацию) лиганда. При параметризации лиганда сервер немного "глючит" и не сразу показывает файл шаблона. Чтобы его увидеть, сгенерируйте его, временно переключитесь на другой остаток, а потом снова на лиганд. Вы увидите два файла: темплейт (шаблон) и файл с ротамерами. Последний может потребоваться отредактировать – PELE очень плохо считает молекулы с большим количеством вращаемых связей. А уж если они ещё и почти линейные по форме... Так что, если ротамеров много, некоторые вращаемые связи убираем. Можно даже все, если в конформации лиганда более-менее уверены.

Небольшие толстенькие коротенькие молекулы с малым количеством вращаемых связей обрабатываются отлично, так что большинство низкомолекулярных лекарств должно подойти.

По поводу подготовки белка случилась интересная история. И в статье про сервер от 2005 года, и в секции Help на его сайте написано чёрным по-английски: сервер водороды не добавляет, они должны быть добавлены перед симуляцией. Об этом же меня предупредил сотрудник лаборатории Joan Francsc Gilabert Navarro, отвечающий за техподдержку сервера. Этот разговор состоялся уже после получения, как мне показалось, удачных данных симуляций. В которые я по ошибке запустил структуры белка без атомов водорода. Вообще. Неужели всё это в корзину?

А вдруг? Открываю свои структуры PDB, полученные из траекторий симуляции, и глазам своим не верю. Все водороды добавлены куда надо! Причём кислые и основные карбоновые кислоты ещё и протонированы правильно. А ведь не протонировал... Открываю текстовым редактором – вдруг с усталости показалось? Не, все водороды на месте.

Вспоминаю, что, когда я пытался добавить водороды сам, серверу что-то не нравилось, и он отказывался подвергать структуры препроцессингу, сообщая это следующим текстом: "Если добавил все атомы водорода, можешь продолжать так!"

Что-то нечисто. Открываю лог подготовки структуры с сервера. Ага! А в нём чёрным по-английски написано: Adding protein hydrogens...

Приложив всё это к письму, я пишу Jon Francesc обратно: он их у Вас ТОЧНО не добавляет? В ответ мне написали: "Извините, ошиблись. Судя по логу, добавляет!"

И что самое интересное, что структуры с добавленными водородами не берёт на препроцессинг, и результаты моделирования получаются странные. Если же не добавить их вообще, сервер сам добавит и всё пройдёт гладко. Так что... у меня это первый случай, когда с техникой надо было работать иначе, чем предписано инструкцией к ней. Приятный сюрприз, однако, что сервер всё делает сам!

Итак, сгенерировав файлы параметров лиганда, не забудьте их сохранить. Опционально задать параметры симуляции, в том числе количество процессоров. Бесплатно можно до 16 на симуляцию, при этом сервер проводит одновременно несколько независимых симуляций, число которых на единицу меньше числа процессоров. Если надо больше процессоров или пользоваться сервером в коммерческих целях – надо связываться с компанией Nostrum Biodiscovery, осуществляющей поддержку проекта.

Также можно настроить число шагов, параметры вывода числовых данных. И нажимаем кнопку Submit. Немного подождав на сервере, Ваша симуляция запустится. В реальном времени можно будет наблюдать на графике числовые параметры каждой из траекторий и даже на ходу загружать PDB с уже пройденных шагов. А можно выйти и оставить всё считаться без Вас. Симуляция длится несколько часов, примерно как 1 день или одну ночь. По итогам симуляции доступны файлы PDB, содержащие всю траекторию, а также все шаги отдельно в формате PDB – в таблице с числовыми данными. Выбрав наиболее репрезентативную структуру (например, с самой низкой энергией связывания, можно загрузить ей отдельно и использовать далее.

В целом, рекомендую – даже для уточнения результатов того же докинга может быть интересен широкому кругу пользователей. А может, кто-то запустит какой-то другой вид симуляции на нём. Рад буду услышать отзывы.

Побольше всем нам динамики и приятных сюрпризов... и, самой собой, удачного моделирования!