Российский ученый разрабатывает алгоритм машинного обучения для предсказания молекулярных свойств соединений

Молодой ученый ТПУ Борис Пякилля работает над созданием алгоритма машинного обучения, способного строить модели, предсказывающие молекулярные свойства малых органических соединений. Он основан на интеграции методов искусственного интеллекта и байесовского подхода из теории вероятностей. В дальнейшем алгоритм может применяться для разработки лекарственных средств и сельскохозяйственных пестицидов.

Ученым был предложен алгоритм машинного обучения, результатом работы которого является модель, предсказывающая липофильность — свойство вещества, характеризующее его химическое сродство к органическим веществам. Полученная модель способна учитывать возможную неопределенность предсказаний, вызванную нехваткой обучающих данных.

«Работа актуальна за счет появления большого количества проектов, связанных с оценкой молекулярных свойств, а также ростом данных о химических экспериментах. Информация о неопределенности предсказаний, мере их возможного разброса крайне важна для пользователей из химических и биологических лабораторий и научных институтов», — поясняет молодой ученый.

Разработанный алгоритм основывается на байесовском машинном обучении — разделе, который напрямую работает с неопределенностями и позволяет не только точечно оценивать параметры полученной модели, но и их распределение.

«Аналогичная работа ведется во многих институтах и фармкомпаниях. Уникальность нашего алгоритма — в вычислительных аспектах: скорости построения предсказательной модели, высоком качестве предсказания липофильности, возможности учитывать неопределенность предсказаний из-за нехватки обучающих данных или их низкого качества», — добавляет Борис Пякилля.

В дальнейшем алгоритм может быть использован в компаниях и лабораториях, связанных с разработкой лекарственных средств или сельскохозяйственных препаратов, в частности пестицидов.

Пресс-служба Томского политехнического университета

29.11.2021

Нет комментариев