Проект "Повышение эффективности первичного скрининга биологически активных соединений с использованием вычислительных моделей"


Источник финансирования:

Иностранный партнер:

Цель проекта

Целью настоящего проекта является разработка и экспериментальная валидация новых инструментов для увеличения успешности первичного биологического скрининга за счет предсказания биологической и побочной активности соединений, а также химической стабильности в растворах. В рамках проекта решаются следующие основные задачи:

  • разработка инструментов для дизайна разнообразной библиотеки химических соединений с использованием современных техник визуализации данных в сочетании с 2D дескрипторами, а также с использованием 3D фармакофоров молекул,

  • разработка инструментов создания сфокусированных библиотек химических соединений, потенциально активных против заданной биомишении, с использованием двух стратегий: (1) отбор наиболее перспективных соединений из имеющейся базы данных с использованием 3D фармакофорных моделей, построенных на основе структуры биомишени или структур известных активных соединений, (2) генерация виртуальной сфокусированной библиотеки за счет перечисления возможных замен фрагментов данного соединения или соединений-затравок, приводящих к желаемому изменению биологической активности. В последнем случае будет использоваться подход "пар сопоставленных молекул" (matched molecular pairs) в сочетании с основанными на машинном обучении инструментами предсказания изменения биологической активности при данном замещении.

  • разработка инструментов для выявления и исключения из скрининга соединений, обладающих малой химической стабильностью в растворителях, используемых для скрининга, и нежелательным биологическим профилем (невысокая селективность, побочная активность, потенциальная токсичность) с использованием библиотеки 3D фармакофорных моделей,

  • валидация предложенных инструментов в ходе ретроспективных исследований и применения в реальных проектах по дизайну лекарств, активных по отношению к следующим биологическим мишеням: киназам MARK4, каннабиноидным рецепторам СВ1, аденозиновым рецепторам.

Описание проблемы, обоснование актуальности исследований

Первичный биологический скрининг является одним из первых шагов процесса разработки лекарств. Целью его является идентификация соединений (хитов), которые обладают интересующим профилем биологической активности. Эффективность данного подхода в значительной степени зависит от выбора соединений, которые были отобраны для скрининга. Адекватный выбор соединений обусловливает повышение шанса обнаружения хита (hit rate) по сравнению с случайным выбором, что уменьшает общие затраты на разработку лекарств.

Достаточно низкий шанс обнаружения хитов является одной из причин сложности в разработке препаратов нового поколения, перехода к новым хемотипам или скаффолдам. Так в работе [Milne, G.M. Pharmaceutical productivity — the imperative for new paradigms / G.M. Milne // Annual Reports in Medicinal Chemistry - London, 2003 - C.383-396] было показано, что средние затраты на первичный скрининг достигают 30 миллионов долларов, причем подавляющая часть этих денег вкладывается в синтез и испытания соединений, которые не проявляют желаемой активности.

Имеется 2 основных стратегии к выбору соединений для первичного скрининга:

  • создание разнообразной (диверсной) библиотеки химических соединений, которые тестируются против множества мишеней (высокопроизводительный скрининг общего назначения). Такие библиотеки должны включать множество несхожих соединений, чтобы максимально полно покрыть изучаемое химическое пространство. Обычно это делается анализом нескольких библиотек различных поставщиков для для выбора наиболее представительной библиотеки и создания финальной коллекции соединений.

  • создание относительно небольшой библиотеки соединений с использованием вычислительных моделей. Обычно это делается виртуальным скринингом имеющихся или сгенерированных компьютером соединений с использованием различных моделей (моделирование структура-свойство (QSAR), фармакофоров, докинга и т.п.) для уменьшения числа возможных соединений до разумного уровня.

Дополнительно, проводится оценка фармакологического профиля, физико-химических характеристик, синтетической доступности (для виртуальных библиотек соединений) [Dandapani, S. Selecting, Acquiring, and Using Small Molecule Libraries for High-Throughput Screening / S. Dandapani, G. Rosse, N. Southall, J. M. Salvino, C. J. Thomas // Curr. Protoc. Chem. Biol. - 2012. - V. 4. - P. 177–191] для удаления соединений с нежелательными характеристиками и улучшения результатов скрининга. Существующие стратегии к дизайну библиотек включают простые физико-химические фильтры (например, правило Липинского), структурные фильтры для удавления реакционноспособных соединений и потенциально неспецифичных соединений, после применения которых происходит отбор определенного числа структурно разнообразных соединений.

Обычно для отбора используются подходы, основанные на 2D представлении молекул в виде векторов структурных или фармакофорных дескрипторов в комбинации с различными методами отбора (методы исключенной сферы, отбора по разнообразию, кластеризации, и т.п.) основанных на вычислении индексов сходства/разнообразия (Танимото, Тверского, косинуса и т.п.). В этих подходах пренебрегается 3D структурой и, как следствие, стереохимической конфигурацией молекул. В то же время, было неоднократно показано, что пространственное расположение атомов и конформация существенно влияют на биологические свойства молекул. Именно по этой причине 3D подходы, такие как докинг и 3D фармакофорный поиск считаются более надежными. Однако из-за вычислительной сложности их использование для дизайна библиотек до настоящего времени было затруднительным.

Идея использования фармакофоров заключается в том, что фармакофор отражает пространственную ориентацию центров связывания молекул с биологичекими мишенями. Предполагается, что наличие одинаковых фармакофоров в молекулах приводит к схожему биологическому ответу [Davies, K. Using Pharmacophore Diversity to Select Molecules to Test from Commercial Catalogues. In Molecular diversity and combinatorial chemistry. Libraries and drug discovery. Washington DC: American Chemical Society; Chaiken, I. M., Janda, K. D., Eds.; American Chemical Society: Washigton DC, 1996; pp 309–316]. Наша идея заключается в том, что молекулы, обладающие одинаковыми фармакофорами, должны быть исключены из рассмотрения в разнообразной библиотеке соединений, поскольку с большой вероятностью будут иметь близкий биологический отклик. Подходов, которые реализуют эту простую идею для дизайна библиотек до настоящего момента нет. Наиболее близко приблизились к этой идее в работе Мэйсона [Mason, J. S. New 4-Point Pharmacophore Method for Molecular Similarity and Diversity Applications: Overview of the Method and Applications, Including a Novel Approach to the Design of Combinatorial Libraries Containing Privileged Substructures. / J. S.Mason, I. Morize, P. R. Menard, D. L.Cheney, C. Hulme, R. F. Labaudiniere // J. Med. Chem. - 1999. - V. 42, Is. 17. - P. 3251–3264], в которой предложен подход, когда один конформер молекулы представляется длинной битовой строкой, кодирующей все возможные 4-точечные комбинации фармакофорных признаков. Далее предполагалось, что с использованием упомянутых выше методов отбора по разнообразию можно выбирать соединения, обладающие отличающимися фармакофорами. Однако такой способ представления занимает от 3 до 12 МБ на хранение битовой строки для одного фармакофора одного конформера одной молекулы, что неэффективно с вычислительной точки зрения и не позволяет его использовать в дизайне библиотек соединений, содержащих более сотни молекул. Более быструю версию по генерации 3D фармакофорных дескрипторов предложили в работе [Koes, D. R.; Camacho, C. J. Pharmer: Efficient and Exact Pharmacophore Search. J. Chem. Inf. Model. 2011, 51 (6), 1307–1314], однако разработанное программное обеспечение годится только для виртуального скрининга по заданному фармакофору, но не может быть использовано ни для поиска фармакофорной модели, ни для дизайна библиотек. Таким образом, в настоящее время для отбора разнообразных библиотек можно использовать только самые простые 2D фармакофорные дескрипторы для выбора библиотек, такие как (CATS, 2D-FPT, TFBPA). Использование 3D дескрипторов (таких как CoMSIA, GETAWAY, EVA, 3D автокорреляции или 3D фармакофорные) упирается в проблему выбора представительного конформера молекулы и поэтому они не применяются в решении практических задач.

Показано, что фармакофорные модели могут существенно улучшить качество выбора сфокусированной библиотеки [Yang, S.-Y. Pharmacophore Modeling and Applications in Drug Discovery: Challenges and Recent Advances. Drug Discov. Today 2010, 15 (11–12), 444–450]. Имеется 2 основных типа фармакофорных моделей:

(1) основанные на лиганде фармакофорные модели, которые определяются на основе структур активных и неактивных молекул поиском таких фармакофоров, которые являются общими для максимально большого числа активных молекул,

(2) основанные на структуре фармакофоры, которые определяются на основе кристаллических структур комплексов протеин-лиганд.

Практически все имеющееся программное обеспечение для фармакофорного моделирования (LigandScout, DiscoveryStudio, MOE, PHASE, и т.д.) является коммерческим. Единственный имеющийся инструмент PharmaGist требует для выравнивания некий опорный лиганд в "биоактивной" конформации, с которым выравниваются все остальные молекулы.Однако, последняя она зачастую неизвестна и такой подход нельзя применить. Систематическое выравнивание всех возможных фармакофоров практически невозможно провести из-за того, что сложность вычислений растет экспонентально с числом соединений (размером набора данных) и числом конформеров (гибкостью соединений). Таким образом, назрела необходимость разработки подхода для моделирования формакофора на основе структуры лигандов, который является свободно доступным для исследователей и позволит выявлять общий фармакофор за разумное время.

Основанные на структуре биомишени фармакофоры определяющиеся с использованием различных подходов, имплементированных в коммерческое и свободно-доступное программное обеспечение, зачастую содержат в числе фармакофорных центров те, которые не являются критичными для связывания с биомишенью. Причиной этого является то, что данные расшифровки рентгеноструктурного эксперимента отражают только одно расположение молекул, в то время как происходит движение молекулы лиганда в полости фермента. По этой причине в своих исследованиях мы сталкивались с явлением [Polishchuk, P. G.; Samoylenko, G. V; Khristova, T. M.; Krysko, O. L.; Kabanova, T. A.; Kabanov, V. M.; Kornylov, A. Y.; Klimchuk, O.; Langer, T.; Andronati, S. A.; Kuz’min, V. E.; Krysko, A. A.; Varnek, A. Design, Virtual Screening, and Synthesis of Antagonists of αIIbβ3 as Antiplatelet Agents. J. Med. Chem. 2015, 58 (19), 7681–7694], что полученные на основании структуры биомишени фармакофоры не способны выявить ни одного хита из библиотеки соединений, и требуется ручное удаление менее важных фармакофорных центров для получения эффективной фармакофорной модели. Таким образом, более эффективным могло быть получение фармакофоров на основании данных молекулярной динамики комплексов протеин-лиганд и выявления фармакофоров на каждом шаге процесса. Это бы позволило идентифицировать ключевые и менее важные фармакофорные центры и улучшить полученную модель. В настоящее время анализ молекулярно-динамических траекторий с использованием фармакофорных моделей воплощено только в коммерческой программе LigandScout. Для развития области дизайна лекарств необходимо иметь свободный инструмент, который бы позволил проводить поиск идентичных фармакофоров, подсчитывать частоту их встречаемости в ходе моделирования и выбирать более часто присутствующие, однако таких инструментов в настоящее время не существует.

Другой подход, который может быть использован для дизайна сфокусированных библиотек, основан на подходе "пар сопоставленных молекул" (Matched Molecular Pairs, ММР). Это эффективный инструмент, позволяющий оптимизировать структуру имеющихся соединений. ММР зачастую определяются на основе экспериментальных данных и редко предсказываются. Мы предлагаем разработать и реализовать в виде программного продукта подход, который позволит предсказывать полезные способы трансформации данной молекулы для данной биологической мишени. Недавно нами было показано, что ММР можно рассматривать как псевдореакции, в которых реагент трансформируется в продукт [Horvath, D.; Marcou, G.; Varnek, A.; Kayastha, S.; de la Vega de León, A.; Bajorath, J. Prediction of Activity Cliffs Using Condensed Graphs of Reaction Representations, Descriptor Recombination, Support Vector Machine Classification, and Support Vector Regression. J. Chem. Inf. Model. 2016, 56 (9), 1631–1640]. Это псевдореакция может быть записана в виде Конденсированного графа реакции (КГР). В КГР реакция кодируется наложением атомов реагентов и продуктов с указанием атомов и связей, которые были изменены в ходе реакции. В рамках этого подхода закодированная в ММР трансформация может быть рассмотрена как замещение одного фрагмента (реагент) на другой (продукт). В предыдущей нашей работе [Horvath, D.; Marcou, G.; Varnek, A.; Kayastha, S.; de la Vega de León, A.; Bajorath, J. Prediction of Activity Cliffs Using Condensed Graphs of Reaction Representations, Descriptor Recombination, Support Vector Machine Classification, and Support Vector Regression. J. Chem. Inf. Model. 2016, 56 (9), 1631–1640.] был предложен способ классификации ММР для поиска тех, которые соответствуют "пикам активности" (activity cliff). Однако логично, что следующий шаг заключается в том, что необходимо предсказывать количественные изменения в активности, возникающие за счет замены одной группы на другую. В дальнейшем эта количественная модель может использоваться для того, чтобы идентифицировать замены, приводящие к желаемым количественным изменениям в активности молекул и, таким образом, создавать сфокусированные библиотеки соединений, что, однако, пока не было сделано.

Соединения в разрабатываемых библиотеках (особенно сфокусированных) должны обладать подходящим фармакологическим профилем для того, чтобы их впоследствии можно было использовать в разработке лекарств. Желательно, чтобы они взаимодействовали с одной или более желаемыми целями (полифармакология), и не взаимодействовали с побочными мишенями (побочные эффекты, промискуитет). Для оценки фармакологического профиля соединений используются множество подходов - от простых (поиск по схожести с использованием 2D дескрипторов и фрагментов), до более сложных методов с использованием машинного обучения и, как правило, 2D дескрипторов (наиболее известный пример - программа PASS), и до наиболее совершенных, но вычислительно затратных, таких как молекулярный докинг. Фармакофоры являются весьма эффективным и быстрым подходом, приближающимся по точности к молекулярному докингу. Обычно библиотеки фармакофорных моделей, используемые для профилирования, построены на основе структур биомишеней. Однако 3D структуры белков имеются не для всех мишеней. Таким образом, основанные на лигандах фармакофорные модели могут существенно расширить покрытие фармакологического пространства. Насколько нам известно, не существует ни одного инструмента для фармакологического профилирования с использованием фармакофорных моделей, основанных на лигандах. Таким образом, создание подхода такого типа позволит существенно расширить применение профилирования в дизайне лекарств.

Также соединения, используемые в скрининге, должны обладать определенными физико-химическими свойствами (растворимостью, стабильностью), для чего используются специальные модели. До настоящего времени не разрабатывались модели для предсказания стабильности молекул в растворах. В биологическом скрининге используются обычно нейтральные или слабо кислые растворы соединений в смесях вода-ДМСО, или просто воды, то есть достаточно агрессивные растворители. Наличие в библиотеках химически нестабильных соединений приводит к ошибочным или неоднозначным результатам биологического скрининга. Ранее нами был предложен подход для предсказания количественных характеристик химических реакций, таких как скорость реакции, на основе подхода Конденсированного графа реакции [Маджидов, Т. И.; Гимадиев, Т. Р.; Малахова, Д. А.; Нугманов, Р. И.; Антипин, И. С.; Варнек, А. А. Соотношение «структура – Реакционная Способность» В Реакциях Дильса-Альдера С Использованием Подхода Конденсированных Графов Реакций. Журнал структурной химии 2017, 58 (4), 685–691 ; Polishchuk, P.; Madzhidov, T.; Gimadiev, T.; Bodrov, A.; Nugmanov, R.; Varnek, A. Structure– reactivity Modeling Using Mixture-Based Representation of Chemical Reactions. J. Comput. Aided. Mol. Des. 2017. , accepted ; Madzhidov, T. I.; Bodrov, A. V.; Gimadiev, T. R.; Nugmanov, R. I.; Antipin, I. S.; Varnek, A. A. Structure–reactivity Relationship in Bimolecular Elimination Reactions Based on the Condensed Graph of a Reaction. J. Struct. Chem. 2015, 56 (7), 1227–1234 ; Nugmanov, R. I.; Madzhidov, T. I.; Khaliullina, G. R.; Baskin, I. I.; Antipin, I. S.; Varnek, A. A. Development of “structure-Property” Models in Nucleophilic Substitution Reactions Involving Azides. J. Struct. Chem. 2014, 55 (6), 1026–1032 ; Madzhidov, T. I.; Polishchuk, P. G.; Nugmanov, R. I.; Bodrov, A. V.; Lin, A. I.; Baskin, I. I.; Varnek, A. A.; Antipin, I. S. Structure-Reactivity Relationships in Terms of the Condensed Graphs of Reactions. Russ. J. Org. Chem. 2014, 50 (4), 459–463]. Применение этих подходов для предсказания устойчивости соединений к типичным реакциям, приводящим к разложению молекул в растворах, таких как реакции нуклеофильного замещения (моно- и бимолекулярного), а также гидролиза эфирной связи, позволит предсказать кинетические характеристики этого процесса, а далее пересчитать их в характеристики деградации молекул [Waterman, K. C.; Adami, R. C. Accelerated Aging: Prediction of Chemical Stability of Pharmaceuticals. Int. J. Pharm. 2005, 293 (1–2), 101–125]. Применение данного подхода позволит идентифицировать соединения с высокой скоростью разложения в растворах и исключить их из библиотек.


January 09, 2019 at 11:35. Ramil Nugmanov