Какие подвохи таятся в информационном обеспечении исследований.
Есть ли совесть у ИИ? Вынуждены вас разочаровать, читатель, к сожалению, нет. Но даже с учетом этого факта ИИ становится весьма интересным инструментом для исследователя. Только использовать его надо правильно. К примеру, с выделением ключевых слов и подготовкой аннотации научной статьи ИИ справляется заметно лучше среднестатистического автора. Эти и другие животрепещущие для ученых вопросы обсуждались на одной из самых интересных панельных дискуссий «Технопрома-2025» - «Информационное обеспечение исследований и разработок в эпоху ИИ: национальные решения и международное сотрудничество». Мероприятие было организовано Российским центром научной информации, и модератор, заместитель директора РЦНИ Андрей Гуськов, сразу задал тон дискуссии.
– Достаточно ли полно представлена научно-техническая информация (НТИ) в российских информационных системах?
– Есть ли доступ к необходимым для развития науки зарубежным публикациям?
– Как выглядит справедливая и устойчивая международная система обмена НТИ?
– Как подготовить государственную систему НТИ к эффективной работе с ИИ?
Во вступительном слове Андрей Евгеньевич подчеркнул, что еще многое предстоит сделать, однако за три года существования РЦНИ большое количество электронных «кирпичиков» заложено в формирование цифровой экосистемы: национальная подписка, «Белый список» журналов, Национальная платформа периодических научных изданий, комплексная информационно-аналитическая система (КИАС) и индекс цитирования РЦНИ, который будет представлен научной общественности осенью. По словам заместителя директора РЦНИ, есть замена WoS и Scopus как способам узнать, что вышло из печати, труднее найти замену системе научной аналитики, которая позволила бы сравнить организации и страны. В этом как раз может помочь разрабатываемый индекс цитирования РЦНИ, включающий 8 миллионов профилей ученых, 38 миллионов публикаций и 112 тысяч организаций.
Но если проблема с дефицитом аналитических инструментов уже решается, то с дискриминацией бороться сложнее. Любому ученому знаком такой идентификатор, как DOI (Digital Object Identifier), однако Crossref отказывается присваивать DOI статьям в тех журналах, учредители которых входят в санкционные списки, а статьи без DOI фактически не попадают в большинство значимых систем обмена научной информацией. Как в этих условиях создать справедливую международную систему обмена НТИ? Еще одним вызовом становится развитие больших языковых моделей. И отсюда следует вопрос: а какие ИИ-сервисы нужны для опережающего научно-технологического развития и как извлечь для них информацию из публикаций (проблема машиночитаемости текстов)?
Со следующего года все эти проблемы станут заботой Российской академии наук, в ведение которой переданы РЦНИ и издательство «Наука», поэтому первое слово было предоставлено заместителю академика-секретаря Отделения математических наук РАН Сергею Безродных. Он отметил важность такого инструмента, как национальная подписка, поскольку доступность периодики очень значима для ученых, но добавил, что система не охватывает весь комплекс изданий и надо стремиться консолидировать разрозненную информацию.

Фото Ольги Колесовой
Многолетняя боль научного сообщества - недостаточная поддержка отечественных научных журналов. РЦНИ, надо отдать должное, ряд журналов поддерживает, но список их необходимо расширять. «Научная мысль должна быть выражена на русском языке!» - обратился к коллегам Сергей Игоревич. Что касается применения ИИ, докладчик предложил попробовать этот инструмент для развития междисциплинарности. Как исследователю лучше войти, например, в соседнюю область знаний? Возможно, придет на помощь искусственный интеллект?
О библиотеках как производителях и потребителях НТИ рассказала завотделом научных исследований ГПНТБ СО РАН Наталья Редькина. В России 89 680 библиотек, из них 1500 - научно-технические. И этот ресурс надо грамотно использовать! «Информационного шума» сегодня много, и именно специализированные библиотеки могут дать путеводную нить для лабиринта НТИ.
Заместитель генерального директора ООО «Научная электронная библиотека» (разработчик системы eLibrary) Дмитрий Кочетков вспомнил преподобного Томаса Мальтуса, суть теории предсказания бедствий которого - дисбаланс между ростом населения и ростом количества ресурсов. В наши дни к этим ресурсам добавились информационные. Задача - справиться с непрерывным обновлением информации и ввести ее в научный оборот качественно. Здесь возникает проблема постоянных идентификаторов, без которых невозможен информационный обмен. Самый популярный на сегодняшний день - уже упоминавшийся DOI. Но доля российских публикаций с DOI вышла на плато в 2021 году. Растет «серая зона» - статьи с незарегистрированным DOI. Д.Кочетков предложил отечественную альтернативу - разработанный eLibrary EDN. Государственные инвестиции в инфраструктуру расширяют спектр возможностей для пользователей. И здесь заместитель генерального директора ООО «Научная электронная библиотека» привел в качестве положительного примера взаимодействие с РЦНИ.
Краеугольным в выступлениях двух последних докладчиков стал вопрос доверия. Только речь шла о фейках, произведенных не без участия ИИ. Проректор по науке МФТИ Виталий Баган провел небольшой эксперимент. Сначала запросил специалистов вуза, в каких сферах и как правильно применять ИИ.
Специалисты предположили, что на этот вопрос лучше всего ответит сам искусственный интеллект. На просьбу найти трех самых выдающихся выпускников Физтеха всех времен ИИ выдал список, возглавлял который… нобелевский лауреат Барри Бэриш. Все данные о нем были указаны верно, за исключением того, что американский физик никогда не учился в МФТИ. «Поскольку у ИИ совести нет, верифицировать сгенерированные данные должен человек», - констатировал В.Баган, отметив, однако, что в обобщении и структурировании данных ИИ нет равных. И автоматический перевод, кстати, достиг таких высот, что компании стали сокращать лингвистов, - языковые модели справляются лучше. «Применяйте ИИ правильно, тогда он станет конкурентным преимуществом», - заключил спикер.
«Можем ли мы слепо полагаться на опубликованные результаты?» - поинтересовался у присутствующих заведующий научной лабораторией наукометрии и научных коммуникаций Российского научно-исследовательского института экономики, политики и права в научно-технической сфере Денис Косяков. И тут же выдал ошеломляющую статистику: в 19% статей с изображениями были обнаружены следы манипуляций с графикой.
Мы привыкли доверять репутации исследователя: число публикаций, цитирования, индекс Хирша. И в качестве примера «фейкового специалиста» Д.Косяков привел автора Viroj Wiwantkit, секрет грандиозного успеха которого в Scopus - 543 письма редакторам журналов в год. Не надо думать, что «наука сама все исправит»: исследования показывают, что вброс всего одной рекламной статьи в выборку, например, медицинских публикаций ведет к настоящему «отравлению медицинских знаний»: на выходе будет «фейковый эффект». К тому же, увы, сомнительные работы не концентрируются в «мусорных» журналах и не отличаются по цитируемости.
Например, для быстро развивающихся областей науки критически важна скорость публикации информации, и у исследователей популярны журналы с «быстрым рецензированием». Поэтому «работа с ИИ требует тонкой настройки, а от НТИ в целом нужны не только метаданные, но и полнота информации», пришел к выводу Д.Косяков.
– На панельной дискуссии были представлены взгляды на то, как может развиваться российская научно-информационная инфраструктура с разных позиций: академии наук, университета, библиотеки, исследователей и разработчиков такого рода систем, - дал сразу по окончании дискуссии комментарий «Поиску» А.Гуськов. - Как показал итоговый опрос участников, большинство спикеров пришло к выводу, что существующая система научно-технической информации в нашей стране пока далека от идеальной. Ее нужно развивать. Как представитель РЦНИ я могу только поддержать идею улучшения и развития государственной системы НТИ. РЦНИ - одна из организаций, призванных решать подобные задачи. И мы последовательно этим занимаемся. Уже можно говорить о том, что в области научно-технической информации формируется определенная экосистема. С 2020 года РЦНИ является оператором централизованной подписки, которая раньше была способом оптимизации расходов на получение научной информации, а теперь на фоне геополитической ситуации стала для многих российских организаций единственным способом получить доступ ко многим научным журналам, книгам и базам данных.
Но предоставление доступа к зарубежным журналам должно дополняться развитием собственных изданий, собственных национальных открытых технологических решений. Сейчас наше внимание сконцентрировано на научных журналах - ведем работу по обновлению ЕГПНИ: «Белый список», который совсем скоро будет опубликован. Уже несколько лет функционирует платформа российских научных периодических изданий, и редакции научных журналов могут абсолютно безвозмездно размещать на ней выпуски журналов и пользоваться полноценной электронной редакцией.
Понятно, что система НТИ журналами не исчерпывается: есть монографии, конференции, много видов информации, которые пока не в фокусе внимания, а зря. Эти документопотоки тоже надо включать в систему и делать их более доступными. Причем речь идет не только о доступности для исследователей, но и о доступности для ИИ. То есть необходим акцент на машиночитаемость такой информации, важность этой проблемы подчеркивали несколько спикеров. Чем чаще мы будем обсуждать ключевые вопросы информационного обеспечения исследований со всеми заинтересованными сторонами, тем лучшую экосистему выстроим в итоге.
Ольга КОЛЕСОВА
Обложка: фото автора


