Массив имеет значение

    Массив имеет значение

    Индекс цитирования РЦНИ должен стать хабом для качественных данных

    Два года назад Российским центром научной информации была введена в действие Национальная платформа периодических научных изданий. Как сегодня развивается этот проект, реализуемый по поручению Правительства РФ для формирования национальной системы оценки результативности научных исследований и разработок? Об этом «Поиску» рассказал начальник Управления обеспечения информационными ресурсами РЦНИ Алексей ЛУТАЙ.

    - Алексей Валериевич, с какой целью создавалась Национальная платформа и какие задачи она решает?

    - Национальная платформа периодических научных изданий была создана как инструмент популяризации и повышения конкурентоспособности отечественных журналов.

    Платформа решает два блока задач. Во-первых, она позволяет редакции настраивать свои бизнес-процессы: от приема рукописи у автора (через организацию ее рецензирования) до опубликования на сайте. Во-вторых, способствует распространению статьи, помогая издателям отправлять пакеты метаданных в разные реестры, регистрировать DOI, а индексирующим системам и зарубежным пользователям - отражать корректные данные. При этом издатель сохраняет за собой права на распространение полных текстов и может сам регулировать условия доступа к ним физических и юридических лиц.

    То есть сегодня российский издатель может обратиться в РЦНИ и бесплатно получить готовую к работе редакционно-издательскую систему для выпуска своих научных журналов, а РЦНИ обеспечивает работоспособность и развитие платформы, соответствие ее существующим стандартам, а также осуществляет обучение сотрудников редакций.

    Необходимость создания платформы была продиктована прежде всего трендами развития мировой научной периодики.

    - Раз уж зашла речь о трендах, не могли бы вы их перечислить?

    - В наши дни результаты научных исследований, опубликованные в научных журналах, оказывают огромное влияние на мировые рынки высокотехнологичной продукции.

    Количество информации увеличивается, вместе с ним возрастает спрос на ее квалифицированную экспертизу. В итоге одна статья в авторитетном научном журнале иногда заставляет «двигаться» миллиарды долларов.

    Если говорить о высшем образовании, мы видим рост популярности университетских рейтингов, которые в своих формулах оценки содержат и публикационные показатели.

    Высокие места в этих рейтингах не только приносят больше денег - они повышают уровень конкуренции в борьбе за стипендии и позволяют университетам отбирать самых способных студентов и аспирантов со всего мира.

    Здесь также вращаются большие деньги: совокупный объем кредитов на получение высшего образования только в США превышает триллион (!) долларов.

    Еще одна тенденция связана с тем, что технологические мощности для обработки информации стремительно растут. Поэтому корпорации, которые ведут собственные исследования, задумываются о создании своих баз знаний, в которых научные публикации объединяются с другими данными для быстрого поиска и извлечения новых знаний. Научные статьи в удобных форматах, с привязанными данными, воспроизводимыми протоколами, открытым рецензированием и десятками метрик, обещающих качество, - вот неполный перечень интересов этих корпораций.

    И, наконец, заказчики научных исследований во многих странах мира устанавливают целевые показатели научной продуктивности, что повышает спрос на услуги издательств. Последние вынуждены бороться за авторов и доступные денежные средства. В реальном мире конкуренция приводит к формированию профессиональных ассоциаций и появлению новых стандартов, поэтому крупные издатели инвестируют в новые технологии и поднимаются в рейтингах, а маленькие - теряют авторов, читателей и оставляют на сайтах прощальные сообщения.

    Я привел лишь несколько примеров для того, чтобы сформулировать следующий тезис: рынок академических журналов становится все менее консервативным, это уже давно не тихая гавань для идеалистов. Требования к научным журналам будут становиться все жестче.

    - Сколько изданий уже зарегистрировано на вашей платформе?

    - На платформе сегодня зарегистрированы почти 600 изданий.

    Новый журнал можно начать издавать на платформе сразу, без задержек, тогда как для уже издающихся возникают вопросы, связанные с переносом рабочих процессов и архивных выпусков, - это требует активного участия редакции журнала, а не только оператора платформы.

    По этой причине мы никогда не ставили себе цель переманить на платформу все российские журналы. Есть издатели, которые ранее инвестировали в разработку собственных платформ, они выстроили процессы и довольны результатами - им мы предлагаем размещение на нашей платформе как возможность создания дополнительного канала продвижения. То есть DOI могут вести на их сайт, а на платформе будут размещены копии изданий.

    - Прокомментируйте, пожалуйста, ситуацию с журналами РАН. На них распространяется все вышесказанное?

    - В рамках действующего соглашения между РАН и Российским центром научной информации материалы журналов РАН размещаются на платформе РЦНИ в установленные сроки, если не требуется доработка. Издательство «Наука» и РАН проводят очень непростую масштабную работу по реорганизации издательских процессов, и мы рады, что можем им содействовать, обеспечивая размещение на платформе и регистрацию DOI в CrossRef.

    - Если возникает обширная журнальная база данных, то следующим шагом стоит ждать появления нового аналитического инструмента, например, индекса цитирования?

    - Под индексом цитирования сегодня подразумевают разные сервисы. С формальной точки зрения индекс научного цитирования - это библиографический указатель, такая база данных, в которой есть объекты (публикации) и отношения между ни-ми (цитирования). Значительно больше возможностей открывается, когда к сети цитирования привязывают дополнительные сущности (издания, авторы, места их работы, сведения о финансировании, тематические направления и т. д.).

    С технической точки зрения в создании таких баз данных нет ничего сложного, потому что главные вопросы касаются организационных и финансовых аспектов:

    - как обеспечить стабильный поток данных;

    - сколько инвестировать в обработку данных;

    - из каких источников финансирования покрывать расходы.

    Сегодня именно эти вопросы формируют потолок возможностей для каждого из сервисов. И в решении ряда задач до потолка Scopus и Web of Science многие сервисы еще долго не дотянутся.

    Именно по этой причине большинство сервисов - OpenAlex, The Lens, Semantic Scholar, OpenAIRE, Dimensions, SciLit, Aminer, DBLP, BASE, Google Scholar и пр. - существует на деньги спонсоров или владельцев и вместо попыток создания более совершенного Scopus фокусируется на решении узкого круга задач. Одни делают ставку на охват индексируемых источников, другие - на включение дополнительных атрибутов, третьи предлагают пользователям личные кабинеты и особенно удобный дизайн.

    - Должно ли государство участвовать в создании таких баз данных, если очевидно, что импортозаместить Scopus или Web of Science едва ли представляется возможным?

    - Да, безусловно. И РЦНИ в рамках государственного задания ведет разработку такого инструмента.

    Перечисленные выше зарубежные сервисы являются частными и занимаются монетизацией собранных ими данных. В условиях дата-капитализма это означает стремление к монополии и стабильной ренте, присвоение прав и втягивание пользователей в закрытые экосистемы метрик и рейтингов.

    Но это не единственная возможная модель развития. Например, Национальный институт здравоохранения США реферирует биомедицинские журналы и ведет библиографическую базу данных MEDLINE. База данных финансируется из госбюджета и по этой причине распространяется на условиях открытой лицензии, то есть этими данными без ограничения пользуются все организации, исследователи, разработчики ПО, журналисты, чиновники и т. д.

    Инвестировав в долгосрочное развитие одного оператора, государство не только ежегодно сохраняет средства в бюджетах научных организаций, но и стимулирует создание новых информационных сервисов.

    Доступность данных для резидентов Российской Федерации РЦНИ рассматривает как ключевую характеристику создаваемого индекса цитирования.

    - Для решения каких задач предполагается использовать новый сервис?

    - В условиях санкционной политики, проводимой коллективным Западом против Российской Федерации, важно в первую очередь обеспечить способность решать базовые задачи, связанные с мониторингом, анализом и прогнозированием науки.

    С информационной точки зрения одной из базовых задач являются сбор и обработка сведений о российских и зарубежных научных публикациях в целях обеспечения их доступности - в форматах и на условиях, максимально удобных для дальнейшего использования. Говоря об индексе цитирования, мы думаем не столько о витринах достижений и рейтингах, сколько об открытом массиве связанных данных. Это не значит, что не будет метрик или личных кабинетов, но массив данных имеет первостепенное значение.

    Такой массив могли бы использовать тысячи пользователей:

    - вузы и научные учреждения - для верификации записей в собственных информационных системах;

    - организаторы конкурсов и экспертные советы - для оценки опыта исследователей;

    - аналитики данных - для мониторинга и прогнозирования развития науки;

    - разработчики - для создания новых сервисов (поисковых, издательских, управленческих и т. д.).

    Появление такого массива даст существенную экономию времени, которое сегодня тратится на подготовку и проверку научных отчетов.

    Конечно, мы рассчитываем здесь и на помощь государства, прежде всего в правовом регулировании отношений, которые возникают у оператора с пользователями платформы, с операторами других сис-тем, а также в определении правового статуса как самих систем, так и их операторов.

    Индекс цитирования РЦНИ должен стать в большей степени хабом для качественных данных, чем личным кабинетом с 50 интерфейсами для пользователей.

    - Сейчас основной базой российских научных журналов является Российский индекс научного цитирования. Как будут строиться ваши взаимоотношения с этим сервисом?

    - Создание РИНЦ было хорошей задумкой, которую на старте поддержали Минобрнауки и РАН, но сейчас мы имеем дело с частной компанией, обладающей положением монополиста и особыми привилегиями: в соответствии с приказом Минобрнауки России все издатели, которые хотят видеть свои журналы в перечне ВАК, обязаны сдавать выпуски журналов в РИНЦ.

    А что страна получает взамен? Всем организациям, которые заинтересованы в использовании данных, включая бюджетные учреждения, эта компания предлагает оплачивать ежегодную лицензию. Физическим лицам доступ к сайту дают только на условиях авторизации, блокируя любые попытки сбора необходимых данных.

    И при этом на сегодняшний день de facto РИНЦ - единственный доступный российским ученым способ поиска публикаций в российских научных журналах.

    Вопрос о доступности этих сведений в будущем и возможных вариантах сотрудничества с частной компанией все-таки следует урегулировать, ставя во главу всего стратегические интересы нашей страны.

    Мы ведь совсем недавно это проходили. Российским научных организациям покупали подписку на Scopus и Web of Science, ученые и организации тратили драгоценное время на ведение и корректировку своих профилей, повышая в конечном итоге качество информационных ресурсов зарубежных компаний, а последние потом отвернулись от России, закрыли доступ - и все. И где теперь можно получить данные о публикациях российских ученых, результатах их работы?

    - В связи с бурным развитием ИИ нужно ли вообще разрабатывать новые индексы цитирования?

    - Развитие искусственного интеллекта отличается стремительностью и разнообразием подходов, но все эти подходы требуют хороших данных. Поэтому открытый массив данных, который РЦНИ будет готовить для формирования индекса цитирования, российские специалисты в области ИИ смогут использовать для обучения и разработки новых инструментов. Мы уверены, что именно такой подход приведет к созданию наибольшего количества интересных результатов.

    - Сегодня довольно много говорят о том, что эффективнее для оценки научных результатов: экспертиза или формальные критерии? Какова позиция РЦНИ?

    - Оба подхода могут провоцировать недоверие со стороны научного сообщества. Процедуры оценки, основанные на метриках, винят в методологической несостоятельности, в экспертных оценках нередко видятся предвзятость и субъективность.

    В основе использования метрик цитируемости лежит несколько идеалистичное предположение о том, что появление конкретной статьи в списке процитированной литературы можно рассматривать как признание значимости указанной публикации на фоне всех остальных статей. Но существует и более скептичный взгляд на цитирование, который указывает на социальные, психологические и поведенческие причины выбора статьи для цитирования.

    Давайте представим себе зарубежного автора, который на сайте российского журнала прочел англоязычную аннотацию статьи и решил ее процитировать в своей работе. Он пишет статью в Word и формирует списки литературы с помощью Zotero. Вставляет DOI статьи, а CrossRef ему не возвращает метаданные (так как издатель из-за санкций не может регистрировать DOI). Загружает PDF в Zotero, а там в метаданных остатки статьи вообще из другого журнала (из-за того, что верстальщик взял чужой макет, но не дочистил). Что делает автор? Разумеется, отбрасывает идею о цитировании неудобной статьи из России.

    Если санкционная политика не изменится, то цитируемость российских статей в зарубежных изданиях будет и дальше падать, поэтому для сравнительных оценок потребуется придумывать другие показатели, и мы также работаем над этим.

    - Не придется ли нам считать цитируемость только в российских изданиях?

    - Это довольно скользкая дорожка, поскольку на выборках пуб-ликаций, написанных небольшой группой хорошо знающих друг друга людей, цитируемость вряд ли отражает что-то еще, кроме их отношений.

    Вот и получается, что эта метрика может полностью утратить свое значение для задач, связанных с оценкой российской науки.

    Поэтому мы считаем, что необходимо развивать инструменты для проведения экспертизы, а для них нужны доступные данные - тот массив, который создает РЦНИ как индекс цитирования.

    Подготовила Светлана БЕЛЯЕВА

    Иллюстрация: photogenica.ru

    Исцеляют роботы
    Море проблем