Севастопольские ученые разработали алгоритм машинного обучения для ранее созданной ими биологической системы раннего оповещения о состоянии водных объектов на основе поведения двустворчатых моллюсков. Эта работа важна для повышения эффективности прогнозирования аномалий в данных об активности пресноводных мидий при мониторинге состояния водной среды. Такой подход позволит снизить затраты, связанные с оперативным, тактическим и стратегическим планированием использования водоемов.
Результаты исследования, поддержанного грантом Российского научного фонда, опубликованы в журнале Forecasting.
Оценка качества воды и точный прогноз показателей загрязнения воды – ключевые компоненты управления водными ресурсами и контроля загрязнения среды. Учитывая сложность и разнообразие загрязняющих водные объекты веществ, лабораторный анализ каждого из них считается дорогостоящим и практически невозможным. В качестве альтернативы ученые предлагают использовать живые организмы как биоиндикаторы, позволяющие комплексно оценить состояние водной среды и своевременно отреагировать в случае возникновения чрезвычайной ситуации. Одними из таких индикаторов могут быть мидии: поведенческие реакции мидий, такие как открытие створок, не только отражают их естественные циркадные ритмы, пищевую и дыхательную активность, но способны служить индикатором внешних стрессовых факторов. Экспертная оценка аномалий может помочь в некоторых вопросах, но такой подход не обеспечивает быстрого реагирования на нештатные ситуации.
Блок с мидиями разработанной биологической системы раннего оповещения. Источник: Елена Вышкваркова
Решение подобной задачи возможно с помощью алгоритмов машинного обучения. Исследователи из Института природно-технических систем (Севастополь) впервые применили методы машинного обучения для анализа активности моллюсков. В частности, они сравнили работу трех алгоритмов (Theta, Croston и Prophet), чтобы оценить их эффективность. Данные для сравнения ученые собрали с помощью разработанной ими системы раннего оповещения, где датчики регистрировали движения створок моллюсков и передавали их на компьютер. Здесь алгоритмы обрабатывали входящую информацию: в качестве меры определения аномалий активности исследователи использовали ошибку между прогнозным значением и реальными данными.
Пользовательский интерфейс информационной консоли. Источник: Елена Вышкваркова
Поскольку данные из биологических систем раннего оповещения передаются на сервер в режиме реального времени, основной параметр успешности модели – это ее скорость обнаружения аномалии. Кроме того, разработанный алгоритм и последующая генерация сигнала тревоги не должны требовать значительных вычислительных ресурсов. Результаты исследования показали, что наилучшее быстродействие обеспечивает алгоритм Prophet, а значит при его использовании информация о загрязнении воды быстрее попадет конечному потребителю. Сравнение методов по вычислительной сложности показало преимущество метода Croston.
Новизна работы заключается в применении алгоритмов машинного обучения к данным активности двустворчатых моллюсков, используемых в качестве биосенсоров в системе биомониторинга водоемов. Разработанный алгоритм обнаружения аномалий будет эффективно встроен в программное обеспечение разработанного авторами автоматизированного комплекса биомониторинга водной среды.
- Елена Вышкваркова, кандидат географических наук, ведущий научный сотрудник Института природно-технических систем
Изображения предоставлены: пресс-служба Российского научного фонда