Тенденция, однако.

Как часто и в каком контексте за последние пару веков употреблялись в печатных изданиях слова “наука”, “образование”, “чиновник”? А любые другие слова (словосочетания)? Чтобы получить ответ, всего-то и требуется ввести в строку поиска на сайте http://ngrams.googlelabs.com искомое на одном из семи языков: английский, французский, немецкий, испанский, иврит, русский, китайский — и посмотреть, как же менялась частота их использования. Интересно? Тогда можно заглянуть дальше и полюбопытствовать, где именно, в какие годы наиболее активно употреблялось то или иное слово (словосочетание).
Новый онлайновый инструмент, который позволяет все это делать, создан специалистами компании Google и Гарвардского университета (США). Google labs Books Ngram Viewer представляет собой массивную поисковую базу данных. Его авторы считают свое творение настоящим ключом к новой эре научных исследований в области гуманитарных и социальных наук. Результаты исследования опубликованы в журнале Science.
На сегодня база данных Google Books Ngram Viewer насчитывает более пяти миллионов книг фонда мировой литературы: художественных и научно-популярных, опубликованных с 1800-х по 2000-е годы. А это примерно 4% всех когда-либо напечатанных книг. Правда, большинство изданий в БД — около 72% — на английском языке.
Представители Гарвардского университета — Жан-Батист Мишель (Jean-Baptiste Michel) и Эрез Либерман Эйден (Erez Lieberman Aiden) — авторы нового интернет-инструмента, он поможет исследователям “просчитать” многие интересные тенденции истории культуры. Новую дисциплину уже предложено назвать “culturomics” — культуромикой (www.culturomics.org). Как отметил в интервью газете Guardian Ж.-Б.Мишель, интерес к математическому подходу к гуманитарным и социальным наукам восходит к 1950-м годам. Однако все попытки ввести количественные методы в изучение культуры тормозило отсутствие соответствующей информации. “Теперь у нас есть большой набор данных, доступных через интерфейс, который удобен для любого пользователя”, — считает ученый.
Анализируя базу данных, исследователи обнаружили, что каждый год в английском языке рождается почти 8,5 тысячи новых слов. Так, например, во второй половине прошлого века словарный запас вырос на 70%. Интересно, что большинство этих слов не появляется в словарях. По оценке авторов Google Books Ngram Viewer, 52% английского лексикона состоят из лексической “темной материи”. Исследователи попробовали отследить, как же менялись слова в английском языке, например, понятие слова “слава”.
Сравнили они и частоту упоминания имен известных людей в литературе: оказалось, что люди, родившиеся в середине XX века, обычно обретают статус наибольшей известности раньше (в среднем в 29 лет), чем те, кто жил в предыдущем столетии (43 года в среднем). Самым упоминаемым англоязычным писателем оказался Марк Твен, а президентом США — Теодор Рузвельт.

Нина Шаталова

Нет комментариев