Проект "Повышение эффективности первичного скрининга биологически активных соединений с использованием вычислительных моделей"


Заявочная документация к проекту:

  1. Пояснительная записка (pdf)

  2. Календарный план-график исполнения обязательств при проведении исследований (выполнении проекта) (pdf)

Отчетная документация:

Этап №1 - 12.02.2018-31.12.2018

  1. Отчет о научной работе

  2. Отчет о патентных исследованиях

  3. Резюме проекта по этапу №1

  4. Основные результаты этапа №1

В ходе выполнения проекта по Соглашению о предоставлении субсидии от 12.02.2018 № 14.587.21.0049 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» на этапе № 1 в период с12.02.2018 по 31.12.2018 выполнялись следующие работы:

получателем субсидии за счет средств субсидии:

1.1 Проведение патентного поиска и поиска по литературе.

1.2 Разработка программного модуля для поиска общего фармакофора на основании структур активных и неактивных молекул.

1.3 Разработка подхода для дизайна библиотек с использованием карт GTM.

1.4 Разработка алгоритма виртуального скринирования библиотек соединений с использованием фармакофорных моделей.

иностранным партнером за счет собственных средств:

1.5 Литературно-патентный поиск, поиск данных в открытой литературе.

1.6 разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора.

1.7 Разработка модуля для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.

План исследований первого этапа выполнения проекта был выполнен в полном объеме, все запланированные на первый этап (2018 год) задачи были решены в полном объеме.

При этом были получены следующие результаты:

  1. был проведен патентный поиск и поиск по патентной литературе как получателем субсидии (пункт 1.1 Плана-графика исполнения обязательств), так и Иностранным партнером (пункт 1.5 Плана-графика исполнения обязательств);
  2. Иностранным партнером был разработан подход и реализован программный продукт для фармакофорного моделирования, основанного на создании сигнатуры фармакофора (пункт 1.6 Плана-графика исполнения обязательств);
  3. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан модуль для поиска общего фармакофора на основании структур активных и неактивных молекул (пункт 1.2 Плана-графика исполнения обязательств);
  4. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан алгоритм виртуального скринирования библиотек соединений с использованием фармакофорных моделей (пункт 1.4 Плана-графика исполнения обязательств);
  5. на основании разработанного подхода создания сигнатуры фармакофора Иностранным партнером был разработан модуль для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур (пункт 1.7 Плана-графика исполнения обязательств);
  6. был разработан подход для дизайна библиотек с использованием карт GTM (пункт 1.3 Плана-графика исполнения обязательств).

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований получателем субсидии, раздел 2.1 Технического задания:

  1. 2.1.1 «комплекс программ и библиотек на языке Python для проведения фармакофорного моделирования на основе структур активных и неактивных молекул, проведения скрининга с использованием полученных фармакофорных моделей, создания разнообразной библиотеки, анализа молекулярно-динамических траекторий и выявления 3D фармакофоров на основании структуры биомишени» - выполнено частично, разработан модуль фармакофорного моделирования на основе структур активных и неактивных молекул, технология проведения скрининга с использованием полученных фармакофорных моделей, и модуль для создания разнообразной библиотеки. Остальные результаты запланированы на второй и третий год выполнения проекта;
  2. 2.1.2 «программный модуль для дизайна библиотек с использованием картографирования химического пространства методом GTM, а также соответствующее веб-приложение» - выполнено;
  3. 2.1.5 «база данных по скоростям реакций нуклеофильного замещения, расщепления связей и гидролиза эфирной связи» - выполнено частично, начат сбор данных, который будет продолжен во второй и третий год исполнения проекта.

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Иностранным партнером, раздел 2.2 Технического задания:

  1. 2.2.1 «разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора» - выполнено;
  2. 2.2.2 «программа на языке Python для вычисления сигнатур 3D фармакофоров» - выполнено.

На основании проведенных исследований и полученных результатов можно сделать следующие обобщения и выводы:

  1. разработан и успешно апробирован в нескольких ретроспективных случаях новый подход к трехмерному представлению фармакофоров молекул с использованием фармакофорных сигнатур. Разработанные трехмерные сигнатуры фармакофоров могут быть использованы для создания фармакофорных моделей с использованием информации об активных/неактивных соединениях для последующего виртуального скрининга. В отличие от существующих некоммерческих продуктов в рамках данного подхода не требуется предварительно заданная геометрия активных соединений, используемых в качестве шаблона, или явное выравнивание фармакофоров. Эффективность разработанных трехмерных моделей фармакофоров была сравнимы или выше, чем производительность виртуального скрининга на основе сходства двумерных фармакофорных дескрипторов. Показано, что разработанные трехмерные фармакофоры были способны выявлять важные лиганд-белковые взаимодействия в нативных позах известных лигандов в лиганд-белковых комплексах;
  2. разработан алгоритм для выявления репрезентативной выборки структурно разнообразных соединений на основе использования карт, полученных с использованием метода Генеративного топографического отображения. Идея подхода заключается в выборке данных, максимально равномерно покрывающей карту химического пространства. Разработанный алгоритм помогает выбирать репрезентативную выборку из представленного набора данных. Показано, что с использованием одной карты или консенсуса из нескольких карт алгоритм позволяет сократить объем выборки до 1%-30% от исходного объема, при этом вероятность найти активное соединение в ней повысится на 10%. Показано, что алгоритм чувствителен к типу карты и требуется тщательный выбор карты, достаточно хорошо представляющей химическое пространство. Полученная с использованием данного подхода величина обогащения слабо зависит от размера отбираемой библиотеки и, следовательно, может использоваться для отбора любых выборок разумного размера;
  3. разработан подход, который позволяет проводить скрининг баз данных с использованием разработанного представления молекул в виде фармакофорных сигнатур. Для ускорения процесса скринирования используется трехстадийный алгоритм. На первом этапе молекулярные отпечатки фармакофора используются в качестве фильтра для быстрого определения фармакофоров, которые не подходят под данный запрос. На следующем этапе полный граф фармакофора молекулы-кандидата изоморфно вкладывают в фармакофоры молекул, прошедших первый фильтр. На последнем этапе сравниваются трехмерные фармакофорные хеши запрашиваемой модели фармакофоров и соответствующих подграфов потенциальных фармакофоров, чтобы определить, имеют ли они идентичную топологию и стерео-конфигурацию. С использованием подготовленной базы данных соединений для скринирования время работы зависит от числа молекул, проходящих фильтр, и составляет от 0.6 до 11 секунд для 1000 конформеров. Это достаточно хорошая скорость, позволяющая использовать алгоритм в последующих приложениях;
  4. проведен сбор данных из различных баз для их последующего моделирования. Из базы данных ChEMBL извлекли результаты для множества различных типов биологических испытаний. Чтобы подготовить данные для последующего моделирования, создан подход для чистки данных, который на основе информации, приведенной в базе данных выявляет тип активности и осуществляет классификацию объектов на активные и неактивные. Собрана информация для 411 биологических мишеней 6 типов. Общее число данных по биологической активности соединений составило 2 243 052. Проведен сбор данных по скоростям реакций бимолекулярного нуклеофильного замещения в водной среде и среде вода-ДМСО, используемой для проведения биологического скрининга. Полученная база данных химических реакций насчитывает 550 реакций;
  5. разработан подход для создания разнообразной библиотеки химических соединений с использованием фармакофорных сигнатур, который был реализован в виде программного модуля. Данный подход выявлял набор из минимального числа соединений, покрывающих максимально широкое фармакофорное пространство.

Работы, запланированные на первый этап выполнения проекта (2018 год) выполнены полностью, в соответствии с п. 1 Плана-графика исполнения обязательств при проведении исследований, Приложение 2 к Соглашению о предоставлении субсидии.

Официальный сайт Получателя субсидии с информацией о ходе выполнения проекта: http://cimm.kpfu.ru/screening2018.

Разработанные в рамках проекта инструменты могут использоваться на этапе проведения первичного моделирования при создании библиотек химических соединений для биологического скрининга при наличии информации об активных и неактивных соединениях (подход для выявления фармакофоров, инструмент вычислительного скрининга), при отсутствии информации о биологической мишени и активных соединениях (подход для выбора разнообразной библиотеки). Этот этап является критически важным при разработке новых лекарственных препаратов. Таким образом, можно ожидать, что разработанные подходы позволят существенно повысить качество и эффективность проведения скрининга соединений. Кроме того, разработанные инструменты и собранные данные можно использовать для рационального дизайна лекарств, а именно как инструменты виртуального скрининга на основе структуры лигандов. Сочетание разработанных подходов с имеющимися может позволить улучшить качество предсказаний и расширить область применения. Созданные инструменты доступны широкому кругу исследователей и являются бесплатными альтернативами дорогостоящим коммерческим продуктам, используемым при рационально дизайне лекарственных препаратов.

Сравнение результатов анализа литературы и патентного поиска с полученными результатами показывает, что разработанные продукты являются конкурентоспособными и не уступающими лучшим достижениям в данной области. Так, разработанная технология поиска фармакофоров в отличие от существующих некоммерческих аналогов не требует знания о «биологически активной» конформации молекулы. В отличие от имеющихся коммерческих аналогов не проводится попарного выравнивания и сравнения молекул в обучающей выборке при создании фармакофора. Это позволяет потенциально обнаружить лучший возможный фармакофор в выборке, то есть наиболее часто встречающийся в активных и редко встречающийся в неактивных, если объем выборки не слишком велик. Кроме того, разработанный подход моделирования является универсальным, и может быть использован в виртуальном скрининге на основе структуры биомишени. Это недоступно для существующих коммерческих инструментов. Предложенный подход является открытым, с открытым исходным кодом, может быть использован для дальнейшей валидации и применения широкой научной общественностью для решения собственных задач. Разработанный инструмент для поиска разнообразной библиотеки с использованием карт GTM позволяет улучшить выбор соединений по сравнению со случайным подходом даже в отсутствие информации о биомишени и активных лигандах. При этом, в отличие от существующих подходов, использованием карт дает ему интуитивную ясность, возможность интерпретации или ручного анализа при необходимости. Разработанный инструмент скрининга по заданному фармакофору достаточно быстр, уступает существующему подходу Pharmer, сопоставим по скорости работы с другими инструментами. Однако наши фармакофорные модели могут быть преобразованы в формат, используемый Pharmer, за счет чего можно использовать преимущества обеих технологий. Кроме того, Pharmer специально создавался для сверхскоростного виртуального скринирования библиотек: проводилась специальная работа по оптимизации кода, для ускорения использовались компилируемые языки программирования и низкоуровневое программирование – что не было нашей задачей на данном этапе. Мы уверены, что при некоторой оптимизации программной реализации наших инструментов можно добиться существенного ускорения скрининга.

Таким образом, в рамках данного этапа выполнения проекта был разработан ключевой алгоритм генерации фармакофоров и скрининга с их использованием, что необходимо для решения остальных задач по проекту. Были разработаны технологии отбора соединений с использованием виртуального скрининга, основанного на структурах лигандов с использованием данного фармакофора, а также технология отбора разнообразных библиотек. Иностранным партнером был разработан способ создания разнообразной библиотеки с помощью фармакофорного подхода. В этой связи задачу 1 проекта «разработка алгоритмов для выбора разнообразных и сфокусированных библиотек химических соединений с использованием подхода генерации сигнатуры трехмерного фармакофора, а также с использованием картографирования с использованием метода Генеративного топографического отображения», приведенной во введении, можно считать решенной в полном объеме. Сбор данных для моделирования, завершенный на данном этапе проекта, а также разработка инструмента скрининга библиотек соединений, требуется для решения задачи 2 «разработки алгоритмов для генерации сфокусированной библиотеки соединений с использованием предсказания количественных изменений активности при замещении одних фрагментов на другие» и задачи 3 «разработки алгоритмов для отбора соединений на основе анализа профиля биологической активности соединений и анализа их стабильности в растворителях, используемых для высокопроизводительного скрининга», предпосылки для решения которых были созданы на данном этапе выполнения проекта.


March 06, 2019 at 07:37. Ramil Nugmanov