Кто автор? Разработка ученых РФ проанализирует текст и выявит, кем он написан: человеком или ИИ

Кто автор? Разработка ученых РФ проанализирует текст и выявит, кем он написан: человеком или ИИ

Российские ученые разработали инновационный метод, который не только позволяет различать тексты, созданные человеком, от тех, что сгенерированы искусственным интеллектом, но и выявлять ключевые факторы, повлиявшие на решение алгоритма об авторстве материала. Об этом заявили в Центре научной коммуникации МФТИ, пишет ТАСС.

По словам Лаиды Кушнаревой, старшего академического консультанта компании Huawei, в отличие от большинства существующих детекторов, которые не раскрывают степень влияния тех или иных особенностей текста, разработка российских ученых способна автоматически анализировать тексты, выделяя "атомарные" признаки, интерпретируемые с точки зрения человеческого понимания.

Кушнарева подчеркнула, что с появлением крупных языковых моделей, таких как ChatGPT и LLaMA, возникла острая потребность в разграничении человеческого творчества и контента, сгенерированного ИИ. Эти системы все чаще используются для создания разнообразных текстов, от интернет-контента до научных работ.

Существующие нейросетевые алгоритмы, способные различать авторство, работают как "черные ящики", не предоставляя объяснений принятых решений. Это затрудняет понимание причин ошибок системы и предотвращение их в будущем.

Команда исследователей из "Сколтеха", МФТИ и других научных центров решила эту проблему, используя разреженные автокодировщики. Этот подход позволяет разбить алгоритм на отдельные блоки, отвечающие за обработку конкретных аспектов текста.

Ученые проанализировали, как языковая модель Gemma-2-2B генерирует тексты, и определили признаки, используемые их алгоритмом для распознавания ИИ-творчества. Это позволило выявить особенности работы модели, такие как многословность в финансовых текстах и сложные синтаксические конструкции в научных текстах, что позволяет определить происхождение текста, даже если пользователь пытается скрыть его сгенерированную природу.

Кушнарева отметила, что разреженные автокодировщики позволяют выявлять попытки скрыть факт генерации текста, например, добавление лишних пробелов или символов. Техника позволяет анализировать текст, предоставляя человеку возможность проверить обоснованность решения на основе выявленных признаков.

Изображение: фрипик

"Кирпичики" во Вселенной. Ученые выяснили, что карликовые галактики и их газовое окружение эволюционируют вместе
Законопроект о новой структуре РАН: «Издательство «Наука» будет работать с государственной базой научных данных