С цифрой по тексту. Возрождению башкирской классики помогают современные технологии

Проанализировать, сделать понятным для общества наследие классиков национальной литературы филологи Башкирского государственного университета смогли достаточно быстро. Помогли гранты. Сначала Президент РФ поддержал молодых ученых вуза (2014 год), и за два года им удалось разработать программное обеспечение. Так творчество башкирских поэтов и прозаиков XIX века стало доступно для изучения c помощью цифровых методов. Поначалу филологи отважились взяться за произведения лишь наиболее известных авторов того времени, затем, воодушевившись, значительно расширили список. Грандиозный замысел оказался вполне осуществимым, правда, дело было за финансированием. И тогда заведующая кафедрой русской и сопоставительной филологии, профессор Флюза Фаткуллина предложила обратиться за поддержкой в РГНФ. Это был 2017 год, и заявку университета рассматривал уже РФФИ. Он и выделил трехгодичный грант на создание исторического корпуса башкирского языка.

— Думаю, на решение Российского фонда фундаментальных исследований повлияли сразу несколько факторов, — вспоминает один из основных участников проекта, кандидат филологических наук, доцент Искандер САИТБАТТАЛОВ. — Главное — масштабность поставленной задачи: изучить, проанализировать письменное наследие башкирских классиков, творивших на протяжении XVIII-XIX веков на языке тюрки, общем для многих народов, исповедующих ислам. Сегодня это мертвый язык, и в его исследовании цифровыми методами есть определенное новаторство. Безусловно, Фонд учел сделанный нами достаточно серьезный задел —  программное обеспечение для исследования литературных текстов, зарекомендовавшее себя во время работы над президентским грантом.

Чтобы описать, как в дореволюционное время развивался литературный язык башкир, нужно было за три года создать корпус — систему предварительно обработанных текстов с программным обеспечением, помогающим проанализировать их по заранее заданным параметрам. Корпус языка позволяет лингвистам и литературоведам проводить исследования сразу на больших объемах материала, не тратя время на их рутинную механическую обработку и не ставя результат в зависимость от личностных особенностей авторов. Да, в центре внимания корпусной лингвистики живые языки, но и изучение мертвых дает полное  представление о них. Едва ли не главное в корпусе — анализаторы программы, они делят тексты на значимые части, и их рассматривают.

Как это происходит на конкретном материале? Скажем, нас интересует, как в языке тюрки работают лексемы, обозначающие понятие «Бог»? Ученый, вооружаясь традиционными методами, обязан прочитать текст, зафиксировать каждый из вариантов употребления нужных лексем, составить картотеку и на ее основе сделать выводы. А благодаря корпусу достаточно несколько кликов — и филолог получает данные о частотности лексем Аллаһ, Хода, Тәңре и еще нескольких, соответствующих русскому слову. Специалисту останется лишь проинтерпретировать и объяснить полученные результаты.

В процессе работы над грантом мы решали и чисто гуманитарные задачи: описание и введение в научный оборот новых текстов, их краткую лингвистическую и стилистическую характеристику. Так наша культурная общественность впервые познакомилась с целым рядом письменных памятников. Этот пласт литературы в советское время оставался «задвинутым в дальний угол», но сегодня он необыкновенно важен для укрепления и развития национальной культуры.

— Расскажите, как конкретно вы работаете с литературными памятниками?
— В основном это письменные тексты разных жанров и на разные темы: поэзия, историография, богословие, мистика, написанные на языке тюрки (его также называют старотюркским) на территории Башкирии. В силу идеологических причин большинство из них не переводилось на современные языки и мало исследовалось. Мы должны были хотя бы частично ликвидировать этот пробел.

Работа делилась на несколько этапов: сначала мы набирали тексты арабицей (если это рукопись), делали транскрипцию кириллицей, и они приобретали вид, читаемый машиной. Затем тексты проходили через морфологический анализатор, разработанный Виталием Гречачиным, и мы получали полные списки словоформ для их возможных разборов. Установили, что наиболее подходящей для языков агглютинативного строя моделью анализа словоформы является сетевая, основанная на теории графов. Материалы проверяли и размещали в веб-интерфейсе корпуса. На их основе готовились статьи, и был составлен «Старотюркский словарь». (Искрения благодарность руководителю проекта Ф.Фаткуллиной за научное и методическое руководство проектом. Она перенаправляла энергию молодых участников с решения технических задач на постановку собственно филологических вопросов и поиск ответов на них.)

В основу исследования были положены произведения одного из самых известных наших поэтов и богословов — Мухаммада-Али Чукури (или Гали Чокрый, 1826-1889 годы). Выбор не случаен: это самый плодовитый автор, и его произведения — а среди них поэзия, малая и крупная проза — сами по себе своего рода корпус. Позднее в него вошли анонимные историографические сочинения, стихи других поэтов того времени и мистическая проза богослова Тадж ад-Дина ибн Йалчигула (1767-1837 годы).

В эти дни Башкортостан отмечает 195-летие со дня рождения Мухаммада-Али Чукури — значимое событие в культурной жизни республики. Его изучали и в советское время, но тогда возможности для этого были серьезно ограничены: сложность поэтической формы и языкового выражения, мистика как основа содержания не могли осмысливаться беспристрастно. Нам, считаю, удалось привлечь внимание к его таланту, помочь осознать наследие поэта. Мне кажется, никто в башкирской поэзии ни до, ни после так скрупулезно не работал над техникой письма, и достигнутые Чукури вершины так и остаются недоступными. Вот два двустишия из стихотворения про паломничество в Мекку:

Ғәли дил-джан илә бары теләйдүр вәсил дилдары,
Күзәтүб һәр дәм әсрары, джаны джар улды джананға.
Али всем сердцем желает соединиться с Возлюбленным,
Он ищет тайны каждый миг, душа его стала другом Возлюбленному.

С одной стороны, это традиционное для арабской, персидской и тюркской поэзии двустишие — бейт, вторая строка которого будет рифмоваться с соседними. С другой, — он распадается на четыре части, три из которых рифмуются, образуется достаточно сложная схема рифмовки aaab, дающая очень динамичный и при этом медитативный ритм.

— По условиям гранта вы публиковали статьи в отечественных и зарубежных журналах. Были ли отклики?
— За три года мы напечатали почти 60 статей. Отклики положительные, особенно порадовали отзывы студентов нашего университета. А среди коллег отмечу даже некоторое удивление: как вузовские филологи провели столь масштабное исследование? Особенно много откликов пришло из Турции, где работает сильная филологическая школа, изучающая литературное наследие тюркских народов. Создание программного обеспечения для познания региональной письменной традиции стало приятной неожиданностью для специалистов.

— Но грант закончен, что дальше?
— Исследования продолжаются, а многие тексты, переведенные на современные русский и башкирский, только сейчас выходят из печати. Отрадно, что наша общественность с интересом воспринимает новинки. Безусловно, для нас очень важной была поддержка РФФИ — финансовая и моральная. Она позволила осуществить этот грандиозный проект. Мы приобрели технику, в том числе для оцифровки данных. Выступали с докладами на крупных конференциях в Москве, Турции, Казахстане. Средств пошли и на публикации в научной прессе. Отмечу, что выполнение неминуемых бюрократических требований при оформлении отчетности не заняло много времени и сил. Что касается лично меня, то часть подготовленных по гранту материалов вошла в мою докторскую диссертацию. Рассчитываю завершить ее или в конце этого года, или начале следующего.

Юрий ДРИЗЕ

Нет комментариев