Вычислить и обезвредить

Блокировать вирус поможет киберинфраструктура

 В цифровое пространство сибиряков, как и большинство населения планеты, буквально вытолкнула пандемия COVID-19. Поиск способов предотвращения или снижения негативных последствий от коронавирусной инфекции COVID-19 сегодня стал приоритетным направлением научных исследований. Многие ученые во всем мире заняты изучением процессов жизненного цикла вируса — практически каждый день публикуется несколько новых работ по этой теме.
Закрыть ворота
Для создания лекарственных препаратов необходимо детально понимать механизмы функционирования вируса. Они сегодня изучаются самыми современными физическими, химическими, биологическими методами. Модернизированная вычислительная система Межведомственного суперкомпьютерного центра (МСЦ) РАН на базе высокопроизводительных серверных процессоров Intel® Xeon® Scalable второго поколения используется российскими  участниками международного проекта по разработке медицинских препаратов для диагностики и терапии заболеваний, вызываемых коронавирусной инфекцией.
Этот проект объединил научно-исследовательские коллективы из нескольких стран: России, Финляндии, Китая, Японии, Канады. В составе большой географически распределенной команды есть врачи-вирусологи, биологи, химики, математики и физики. Координатор проекта — лаборатория биомолекулярных и медицинских технологий Красноярского государственного медицинского университета им.  профессора В.Ф.Войно-Ясенецкого ­(КрасГМУ). В проекте участвуют также лаборатория цифровых управляемых лекарств и тераностики и лаборатория физики магнитных явлений Института физики им. Л.В.Киренского в составе Федерального исследовательского центра «Красноярский научный центр СО РАН» (КНЦ СО РАН), лаборатория химической кибернетики химфака МГУ, лаборатория компьютерного моделирования биомолекулярных систем и наноматериалов Института биохимической физики им. Н.М.Эмануэля (ИБХФ) РАН, лаборатория органического синтеза Института химической биологии и фундаментальной медицины Сибирского отделения Российской академии наук (ИХБФМ СО РАН, Новосибирск), Nanoscience Center, University of Jyväskylä (Финляндия), The Molecular Science and Biomedicine Laboratory (MBL) Hunan University, Changsha, Hunan (Китай), Research Center for Computational Design of Advanced Functional Materials (CD-FMat), National Institute of Advanced Industrial Science and Technology (AIST), Tsukuba (Япония), Department of Chemistry and Biomolecular Sciences, University of Ottawa, Ottawa (Канада).
— Идея нашего проекта — с помощью методов молекулярного моделирования создать компьютерный дизайн медицинского препарата, избирательно взаимодействующего с рецептор-связывающим доменом spike-белка коронавируса штамма SARS-CoV-2, — рассказывает Анна Кичкайло, заведующая лабораторией цифровых управляемых лекарств и тераностики ФИЦ КНЦ СО РАН. — Самые перспективные агенты специфического связывания будут использованы для диагностики (идентификации вирусных частиц в слюне), а также разработки противовирусных средств, блокирующих инфицирование. Результаты теоретических расчетов и компьютерного моделирования ученые проверят экспериментально на белках, вирусах и клетках.
В рамках проекта, используя суперкомпьютерное моделирование, исследователи детально изучают взаимодействие spike-белка на поверхности коронавируса с его мишенью в человеческом организме —  белком АПФ2, служащим «входными воротами» для коронавирусов типов SARS и SARS-2. Блокирование этого взаимодействия приведет к снижению вирусной активности. В этом направлении и идет поиск.
Для оценки энергий связывания белков вируса и человека проводятся масштабные молекулярно-динамические и квантово-химические расчеты комплексов этих белков. На основании полученных данных будет проведен компьютерный подбор аптамеров, которые с вирусными белками связываются лучше, чем с АПФ2 (аптамеры — одноцепочечные молекулы ДНК или РНК, обладающие определенной пространственной структурой и способные благодаря этому «узнавать» другие молекулы или даже проявлять каталитическую активность). В конечном итоге построение библиотеки аптамеров — кандидатов в лекарственные препараты — и оценка их взаимодействия с вирусным белком будут проведены с использованием методов молекулярного докинга и молекулярной динамики. Для самых перспективных аптамеров ученые вычислят более точные значения энергий связывания с помощью методов квантовой химии. Чтобы уложиться в сжатые сроки, исследователям требуется большое количество вычислительных ресурсов, то есть мощные суперкомпьютеры.
— Экспериментальные данные о вирусе на молекулярном уровне очень скудны, к тому же они получены в условиях, отличных от реальности, — поясняет Дмит­рий Федоров, старший научный сотрудник Research Center for Computational Design of Advanced Functional Materials, National Institute of Advanced Industrial Science and Technology (Япония). —  Например, структура белка получена для кристалла белка вируса, а не живого вируса в растворе. Более того, нет достаточного количества экспериментальных данных о структурах комплекса белков вируса и клетки человека, а также белка вируса и кандидатов на лекарства. С другой стороны, все эти совершенно необходимые данные по молекулярной структуре и процессу связывания можно получить с помощью суперкомпьютерных расчетов. Вот почему расчетная составляющая критически необходима. Так же, как и ее последующая проверка экспериментом.
МСЦ РАН — один из самых мощных российских суперкомпьютерных центров коллективного пользования в сфере науки и образования, суммарная пиковая производительность вычислительных систем которого составляет более 1,3 петафлопс (петафлопс — квадриллион операций с плавающей запятой в секунду, или 1000 терафлопс). Его ресурсами сегодня пользуются более 150 групп исследователей, решающих задачи фундаментальной и прикладной направленности. Но чтобы ученые были готовы ответить на самые неожиданные вызовы, такие центры, по идее, должны быть в каждом крупном регионе.
В очереди за петафлопсами
Суперкомпьютерную недостаточность ученые в российских регионах начинают остро ощущать, когда слышат, например, что Китай предоставляет докторам всего мира бесплатный доступ к диагностическим инструментам на базе искусственного интеллекта для ранней идентификации пациентов с COVID-19 путем анализа результатов сканирования грудной клетки. По данным Национального суперкомпьютерного центра в Тяньцзине, на компьютере Tianhe-1 система искусственного интеллекта может просмотреть сотни изображений, полученных с помощью компьютерной томографии, и поставить диагноз примерно за 10 секунд с вероятностью более 80%, причем рост точности диагностики все возрастает по мере продолжающегося машинного обучения. Использование искусственного интеллекта и других цифровых технологий резко возросло с момента старта эпидемии, поскольку Китай запускал собственные автономные решения, созданию которых был отдан государственный приоритет.
Эти примеры обсуждались на недавнем совместном заседании руководства Сибирского отделения РАН и Совета ректоров новосибирских вузов. Целью встречи стало подписание соглашения о создании единого межвузовского и межинститутского цифрового пространства. Сквозную цифровую коммуникационную среду хотят сформировать на основе системы распределенных взаимно интегрированных суперкомпьютерных ресурсов и вычислительных платформ Сибирского национального центра высокопроизводительных вычислений и обработки данных (СНЦ ВВОД), открытия которого добивается президиум СО РАН.
Конечно, институты СО РАН давно и успешно используют мощности суперкомпьютеров.
— В Институте вычислительной математики и математической геофизики (ИВМиМГ) c 2001 года работает центр коллективного пользования «Сибирский суперкомпьютерный центр СО РАН» (ССКЦ), входящий в реестр Современной исследовательской инфраструктуры Российской Федерации, — рассказывает директор института, доктор физико-математических наук Михаил Марченко. — Наш институт имеет тесные научные связи практически со всеми институтами Сибирского отделения РАН и университетами Новосибирска в области проведения суперкомпьютерных расчетов с использованием ресурсов ССКЦ. Мы разрабатываем параллельные алгоритмы, суперкомпьютерные пакеты программ для математического моделирования, создаем методы автоматизации распараллеливания сложных задач и активно занимаемся подготовкой молодежи на базовых кафедрах в Новосибирском государственном и Новосибирском государственном техническом университетах. На этапе создания — совместная кафедра ИВМиМГ и Сибирского государственного университета телекоммуникаций и информатики «Цифровые технологии и обработка больших данных». Сегодня среди пользователей ССКЦ — 24 научных организации и более 200 специалистов. Они решают задачи многих областей науки: математическое моделирование свойств наноматериалов; квантовохимические расчеты свойств химических соединений; создание цифровых двойников геофизических объектов с целью поиска новых и интенсификации использования имеющихся месторождений полезных ископаемых; биоинформатика; создание цифровых двойников научных установок ядерной физики и физики плазмы; численное моделирование летательных аппаратов. Между тем вычислительная производительность оборудования ССКЦ не более 160 терафлопс. Загрузка имеющейся вычислительной техники ССКЦ в 2019 году составляла 85-90%. Среднее время ожидания старта задания в очереди задач — 14-17 дней.
За последний год доля Новосибирского научного центра в структуре общих российских суперкомпьютерных ресурсов сократилась до 1,5%. Лидирует, естественно, Москва: в МГУ работают самые мощные российские суперкомпьютеры — «Ломоносов» и «Ломоносов 2» (5 петафлопс), «Ростех» запустил «Фишер» в ИВТАНе, в Сколково установлен «Кристофари», не отстают Гидрометцентр и Сбербанк. Между тем российские регионы, по научной производительности ничуть не уступая столичному (достаточно упомянуть, что ГНЦ ВБ «Вектор», разработавший первую российскую тест-систему для выявления коронавируса, находится в Новосибирской области), по-прежнему получают информационно-телекоммуникационные ресурсы по остаточному принципу. Этим горячо возмущался во время визита в Новосибирск президент РАН академик Александр Сергеев («Поиск» №5 от 31.01.2020 года), об этом неоднократно говорило руководство СО РАН («Поиск» №7 от 14.02.2020 года).
— В связи с выработкой ресурса оборудования и бурным ростом потребностей в вычислительных ресурсах со стороны пользователей  важно срочно увеличить вычислительную мощность ССКЦ до 1 петафлопс, — поясняет М.Марченко. — Даже такое увеличение производительности позволит рассчитать структуру новых катализаторов для переработки нефтегазового сырья, произвести необходимые вычисления по сборке геномов и биоинформатике, определить параметры ускорителей элементарных частиц, обработать данные сейсморазведки для поиска новых месторождений полезных ископаемых, оценить риски опасных природных (пожаров, наводнений) и техногенных воздействий на экосистему, инфраструктуру и население региона. Увеличение же производительности до 10 петафлопс вполне обеспечит СО РАН вычислительными ресурсами на ближайшие пять лет. В рамках перспективного проекта СНЦ ВВОД планируется взаимодействие с ССКЦ — объединение вычислительных кластеров сверхвысокоскоростной сетью, обмен компетенциями, распределенный запуск задач класса мегасайенс. С использованием суперкомпьютеров объединенными усилиями институтов СО РАН и вузов региона можно решать такие вычислительные задачи первостепенной важности, как создание ситуационного центра природоохранного прогнозирования в Сибири, компьютерное моделирование генома опасных вирусов, разработка новых лекарств для борьбы с инфекциями и оценка рисков эпидемий и пандемий.
Ученые не оставляют надежды, что Россия, подобно Китаю, включит развитие суперкомпьютерных и грид-технологий на территории всей страны в число национальных приоритетов.
— Сейчас мы ожидаем выход поручения по итогам состоявшейся 4 февраля в Череповце встречи Президента РФ с научной общественностью. На этой встрече делегат Сибирского отделения РАН  первый заместитель директора Института вычислительных технологий Андрей Васильевич Юрченко предложил распределенный межрегиональный характер размещения киберинфраструктуры с локализацией суперкомпьютерных центров первого уровня не только в Москве, но и Санкт-Петербурге, Новосибирске, Казани и Владивостоке, — подвел итоги совместного заседания президиума и Совета ректоров председатель Сибирского отделения РАН академик Валентин Пармон.

Наталия Булгакова, Ольга Колесова 

Нет комментариев