Исследователи из НИУ ВШЭ и InsideOutBio с помощью машинного обучения определили местонахождение и функции зеркально закрученных структур ДНК — Z-флипонов в геномах человека и мыши. Ученые выяснили, какие участки Z-ДНК сохранялись у обоих видов в ходе эволюции, и впервые доказали, что они ускоряют процесс создания РНК-копий генов. Результаты помогут в разработке новых методов лечения генетических болезней. Исследование опубликовано в журнале Scientific Reports.
Еще со школы многие знают, как выглядит молекула ДНК: двойная спираль, напоминающая винтовую лестницу. В этой «лестнице» перекладины — пары азотистых оснований, а перила — чередующиеся цепочки из сахара и фосфатных групп. Обычно нить ДНК закручена вправо, однако существуют участки, способные временно перекручиваться влево и благодаря этому регулировать активность генов. Из-за внешней схожести с буквой Z такие участки называли Z-флипонами.
Команда исследователей Международной лаборатории биоинформатики Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ и компании InsideOutBio проанализировала геномы человека и мыши, чтобы предсказать местоположение Z-флипонов и определить их функцию. Для этого ученые проверяли, сохраняется ли участок Z-ДНК у разных видов в процессе эволюции: если участок не меняется, то он важен для работы и выживания организма.
Исследователи использовали ранее разработанную систему машинного обучения DeepZ. В системе учитывалась не только информация из линейной последовательности ДНК, но и данные из десятков тысяч омиксных экспериментов. Например, информация об эпигенетических метках — химических «значках» на ДНК или белках, которые помогают включать и выключать гены, не меняя саму структуру ДНК. Кроме того, ученые добавили данные об энергии перехода — энергии, необходимой для того, чтобы участок ДНК изменил свою структуру. На этих данных построили две модели машинного обучения: для человека и для мыши. После чего уже обученная модель «скользила» по всему геному и реагировала на места, где с высокой вероятностью есть участок Z-ДНК. Предсказания моделей сравнивали, а затем искали участки, которые сохраняются в геноме человека и мыши.
Исследователям удалось структурировать данные о расположении Z-флипонов в геномах мыши и человека, а также показать, в каких именно генах они находятся. Ученые доказали, что Z-флипоны — консервативные элементы, общие для разных организмов, и они сохраняются в процессе эволюции. Методом кластеризации исследователи выявили, что Z-флипоны группируются по функциям: одни участвуют в регуляции транскрипции, другие — в организации хроматина — «упаковки» ДНК внутри клетки. Это подтвердило, что омиксные признаки действительно определяют функциональный класс Z-флипонов, что важно для понимания их роли.
Также ученые впервые выяснили и статистически доказали, что Z-флипоны ускоряют инициацию транскрипции — процесс создания РНК-копий генов. Такая особенность позволяет клеткам быстрее адаптироваться к изменениям, что особенно важно для генов, участвующих в развитии нервной системы и других жизненно важных процессов.
Чтобы сделать копию гена, РНК-полимераза должна прикрепиться к определенному участку ДНК и создать РНК-копию. Если копий нужно много, на участок одновременно садятся несколько “ксерокс-машинок”. Однако механизм здесь немного другой: вместо одной страницы, которая многократно копируется, есть одна “книжка” — последовательность ДНК. По “книжке” запускаются маленькие “ксерокс-машинки”, каждая из которых двигается вдоль ДНК и создает копию. Чтобы получить больше копий, важно, чтобы новые “машинки” садились сразу после того, как предыдущие завершат работу. Частота, с которой запускаются новые копии, и называется скоростью инициации транскрипции.
- Мария Попцова, один из авторов статьи, заведующая Международной лабораторией биоинформатики факультета компьютерных наук НИУ ВШЭ
Команда Международной лаборатории биоинформатики разработала сайт, где размещаются алгоритмы для анализа данных, основанные на машинном обучении, а также полногеномные аннотации — подробная информация о функциональных элементах генома.