Проект "Повышение эффективности первичного скрининга биологически активных соединений с использованием вычислительных моделей"


Сведения о ходе выполнения проекта в рамках реализации федеральной целевой программы "Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы"

Общие сведения по проекту

Соглашение о предоставлении субсидии с Минобрнауки России:, №14.587.21.0049 от 12.02.2018, уникальный идентификатор проекта RFMEFI58718X0049

Тема проекта: Повышение эффективности первичного скрининга биологически активных соединений с использованием вычислительных моделей

Приоритетное направление: Науки о жизни (НЖ)

Критическая технология: Нано-, био-, информационные, когнитивные технологии

Период выполнения: 12.02.2018 - 31.12.2020 гг.

Сроки выполнения этапов проекта:

Этап №1 - 12.02.2018-31.12.2018

Этап №2 - 01.01.2019-31.12.2019

Этап №3 - 01.01.2020-31.12.2020

Плановое финансирование проекта: 42.12 млн. руб.

Бюджетные средства 21.00 млн. руб.,

Внебюджетные средства 21,12 млн. руб.

Исполнитель: федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет"

Иностранный партнер: Университет Палацкого в Оломоуце(Univerzita Palackého v Olomouci), Чехия

Ключевые слова: биологический скрининг, дизайн лекарств, биологическая активность, фармакофоры, моделирование структура-свойство, дизайн библиотек соединений, разнообразные библиотеки, сфокусированные библиотеки, пары сопоставленных молекул, молекулярная стабильность, профиль биологической активности, киназа MARK4,рецептор СВ1, аденозиновый рецептор, конденсированный граф реакции


Сведения о ходе выполнения проекта на этапе №1

В ходе выполнения проекта по Соглашению о предоставлении субсидии №14.587.21.0049 от 12.02.2018 г., с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» на этапе №1 в период с 12.02.2018 г. по 31.12.2020 г. выполнялись следующие работы:

получателем субсидии за счет средств субсидии:

1.1 Проведение патентного поиска и поиска по литературе.

1.2 Разработка программного модуля для поиска общего фармакофора на основании структур активных и неактивных молекул.

1.3 Разработка подхода для дизайна библиотек с использованием карт GTM.

1.4 Разработка алгоритма виртуального скринирования библиотек соединений с использованием фармакофорных моделей.

иностранным партнером за счет собственных средств:

1.5 Литературно-патентный поиск, поиск данных в открытой литературе.

1.6 разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора.

1.7 Разработка модуля для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.

При этом были получены следующие результаты:

  1. Был разработан подход для создания 3D сигнатур фармакофоров. На основе него разработан и успешно апробирован в нескольких ретроспективных случаях подход для выявления трехмерных сигнатур фармакофоров при создании фармакофорных моделей с использованием информации об активных/неактивных соединениях для последующего виртуального скрининга. Показано, что точность моделей на внешней тестовой выборке в основном достигала значений 50%-100% при достаточно высокой полноте, достигающей 80%.

  2. Разработан алгоритм для выявления репрезентативной выборки структурно разнообразных соединений на основе использования карт, полученных с использованием метода Генеративного топографического отображения. Было разработано 7 различных карт, которые были использованы для отбора. Разработанный алгоритм помогает выбирать репрезентативную выборку из представленного набора данных. Предложенный алгоритм позволяет добиться увеличения обогащения выборки активными соединениями на 10%-15% при уменьшении объема выборки до 1%-30% от изначального объема, что достаточно высоко в сравнении с имеющимися аналогами.

  3. Разработан подход, который позволяет проводить быстрый скрининг баз данных с использованием разработанного представления молекул в виде фармакофорных сигнатур. Для ускорения процесса скринирования используется трехстадийный алгоритм, включающий скринирование фармакофорных фингерпринтов, изоморфное вложение полных графов фармакофора и генерацию трехмерных фармакофорных хешей. С использованием заранее подготовленной базы данных соединений для скринирования скорость работы составляет до 1 000 000 молекул в час.

  4. Проводился сбор данных из базы ChEMBL для последующего моделирования. Был разработан специальный подход для автоматической аннотации активности. Собрано 2 243 052 данных по биологической активности. Начат сбор данных по константам скоростей реакций бимолекулярного нуклеофильного замещения в водной среде и среде вода-ДМСО для последующего моделирования гидролитической стабильности соединений. Полученная база данных химических реакций насчитывает 550 реакций и является уникальной, не имеющей аналогов в мире. Собранные данные требуется для разработки технологий в рамках проекта в последующем.

  5. Разработан подход для дизайна разнообразной библиотеки соединений с использованием фармакофорных сигнатур. Основная идея подхода заключалась в отборе библиотек соединений, не имеющих аналогичных фармакофоров. Показано, что обогащение выборки активными соединениями может на 70% превышать долю хитов при случайном отборе.

Предложенная технология поиска фармакофоров использует принципиально новый подход к поиску фармакофоров. В отличие от существующих некоммерческих аналогов не требует знания о «биологически активной» конформации молекулы. В отличие от имеющихся коммерческих аналогов не проводится попарного выравнивания и сравнения молекул в обучающей выборке при создании фармакофора, не используются скоринг-функции. Разработанный подход моделирования является универсальным, с открытым исходным кодом, может быть использован в виртуальном скрининге на основе структуры биомишени. Качество работы подхода превышает качество часто используемого виртуального скрининга с использованием поиска по сходству на фармакофорных фингерпринтах. Таким образом, предложенный подход по ряду параметров превосходит аналогичные работы, определяющие мировой уровень.

Новизна подхода отбора библиотеки разнообразных соединений с использованием карт заключается в принципиально новом подходе к отбору соединений с использованием снижения размерности химического пространства. В отличие от имеющихся подходов, предложенный подход к отбору отличается наглядностью и возможностью использования полученных карт для визуального анализа, построения моделей структура-свойство.

Скорость и качество работы алгоритма скринирования с использованием фармакофорных сигнатур сопоставима или превосходит аналогичные подходы, определяющих мировой уровень. В отличие от коммерческих инструментов не используются функции скоринга или времязатратные процедуры выравнивания фармакофоров. Новизна подхода заключается в использовании принципиально нового типа представления фармакофоров и новых технологий ускорения поиска.

Предложен принципиально новый метод отбора разнообразной библиотеки соединений с использованием фармакофорных сигнатур. Не имеется аналогичных инструментов, которые отбирали бы соединения по имеющимся в них фармакофорам. Качество работы алгоритма сопоставимо с имеющимися аналогами, при этом подход отличается наглядностью, скоростью и простотой интерпретации результатов.

Таким образом, предложены новые вычислительные подходы для отбора библиотек для проведения биологического скрининга.

По качеству полученных результатов предложенные технологии успешно конкурируют с основными мировыми аналогами.

Полученные результаты соответствуют техническим требованиям этапа №1 проекта и подтверждают перспективность продолжения работ по проекту.

Плановые и достигнутые значения показателей результативности реализации проекта на этапе №1 приведены в таблице.

таблица


March 06, 2019 at 07:37. Ramil Nugmanov