Базы данных нового поколения: метод МГУ ускоряет сложные запросы без обучения

Базы данных нового поколения: метод МГУ ускоряет сложные запросы без обучения

Центр искусственного интеллекта МГУ имени М.В. Ломоносова представил метод оптимизации языка структурированных запросов (SQL) без дополнительного обучения моделей. Работа посвящена ускорению выполнения запросов к базам данных за счёт анализа сходства их планов выполнения. Статья принята к публикации в Bulletin of Irkutsk State University, Series Mathematics.

Оптимизация запросов играет важную роль в работе современных баз данных. От того, какой план выполнения выберет система, зависит скорость обработки информации. Однако встроенные механизмы оптимизации не всегда находят наиболее эффективный вариант, особенно для сложных SQL-запросов.

Авторы предложили подход процессной ИИ-аналитики (LLM-PM), который использует предобученные векторные представления планов выполнения запросов. Система сравнивает новый запрос с ранее выполненными и подбирает набор подсказок для оптимизатора на основе сходства планов выполнения. Такой подход позволяет улучшать производительность без дополнительного обучения модели.

В работе использовался механизм поиска ближайших похожих планов выполнения запросов, а также дополнительная проверка выбранного набора подсказок перед применением. Авторы отмечают, что это позволяет снизить риск выбора неэффективных параметров оптимизации.

Эксперименты проводились на эталонных наборах данных теста для оценки порядка соединения (Join Order Benchmark, JOB) и теста для оценки кардинальности (Cardinality Estimation Benchmark) – количества строк, которые вернут различные подзапросы в процессе выполнения, в системе openGauss. По результатам тестирования предложенный метод в среднем позволил сократить время выполнения запросов примерно на 21%. При этом подход не требует длительного предварительного обучения и может использовать информацию о ранее выполненных запросах для дальнейшего улучшения работы системы.

«Мы исследовали, как предобученные векторные представления планов выполнения запросов могут использоваться для повышения производительности баз данных. Такой подход позволяет улучшать работу системы без дополнительного обучения специализированных моделей», – отметил младший научный сотрудник Центра ИИ МГУ Владимир Бурлаков.

По словам авторов, предложенный метод может применяться в системах управления базами данных, где требуется ускорение сложных запросов без значительного увеличения нагрузки на систему.

Изображение: разработано Мagnific.

Платье из обломков корабля XVII века: как финские ученые превратили древнюю древесину в бесшовный наряд
Следующий пост не найден