Химики МГУ применили машинное обучение, чтобы решить одну из старейших задач спектроскопии — научились предсказывать инфракрасные спектры сложных органических молекул, встречающихся как в городском смоге, так и в межзвёздной пыли. Результаты открывают путь к более точному анализу состава космоса и атмосфер планет.
Исследование опубликовано в Journal of Chemical Information and Modeling и посвящено полициклическим ароматическим углеводородам (ПАУ). Эти молекулы образуются при сгорании топлива и органических веществ, но также обнаружены в космическом пространстве — от туманностей до комет. Учитывая их потенциальную роль в зарождении жизни на Земле, ПАУ стали объектом интереса сразу нескольких наук — от экологии до астрохимии.
«Полученные результаты открывают путь к более точному моделированию спектров смесей ПАУ — это критически важно для анализа состава межзвёздной среды и атмосфер планет».
– Александр Закускин, младший научный сотрудник, химфак МГУ
Интерпретация ИК-спектров этих молекул до сих пор оставалась крайне трудоёмкой из-за нехватки экспериментальных данных и вычислительной сложности. Команда из МГУ предложила ИИ-модель, способную предсказывать спектры как нейтральных, так и заряженных форм ПАУ, что раньше считалось невозможным в рамках одной модели.
Отдельное внимание уделено моделированию молекул с гетероатомами — азотом и кислородом, которые особенно сложны для анализа. Для улучшения точности в будущем планируется использовать transfer learning, позволяющий дообучать модель на ограниченных данных.
Этот подход делает возможным высокоточное моделирование химического состава далёких объектов и атмосфер, включая потенциально обитаемые планеты. Современные алгоритмы ИИ превращают миллионы данных в практические инструменты, которые позволяют учёным «видеть» молекулы там, где раньше была лишь догадка.
Источник: пресс-служба МГУ


