Универсальную ИИ-систему управления роботами по языковым инструкциям разрабатывают в РФ

Коллектив ученых из AIRI и МФТИ в партнерстве с Центром робототехники Сбера работает
над созданием системы планирования действий роботов, которая позволит им выполнять
обыденные для человека задачи по командам на естественном языке, а не по
фиксированным сценариям.
Воплощенный искусственный интеллект позволит роботу самостоятельно формировать
последовательности действий для решения задач, взаимодействуя с внешней средой в
реальном мире. Система, построенная на основе такой технологии, обрабатывает
информацию, ориентируется в пространстве и принимает решения. В результате робот
должен суметь выполнять задачи по перемещению предметов по запросу пользователя
на естественном языке, а не как ранее по заранее заданному разработчиком алгоритму в
виде последовательности команд на языке программирования.
В настоящее время научить роботов понимать языковые инструкции – это настоящий
вызов для разработчиков. Однозначное восприятие естественного языка, на котором
люди говорят каждый день, непростая задача для роботов. Абстракции, обобщения,
контекст, сленг могут изменять смысл слов и предложений и, как следствие, запутать их.
Управление роботами с помощью языковых команд усложняется еще и тем, что хотя ИИ
добился значительных успехов в понимании письменного текста, идеально переводить
это понимание на разговорный язык с его вариациями акцента, скорости и интонации он
пока не умеет. Кроме того, роботы с трудом понимают неоднозначные команды и не
«читают между строк», что вполне естественно для человека. А еще современные роботы,
даже самые простые, управляются набором из написанных на языке программирования
команд.
Чтобы использовать прогресс генеративных технологий для успешного применения ИИ в
робототехнике, научная группа «Нейросимвольная интеграция» Института AIRI и Центр
когнитивного моделирования МФТИ в партнерстве с Центром робототехники Сбера
разрабатывают универсальный подход для планирования поведения роботов на основе
больших языковых моделей. В будущем решение, позволяющее машинам понимать
команды людей, можно будет подключить к роботам разного типа.
Одна из сложностей в реализации такого проекта – получение обратной связи от среды, в
которой действует робот. Каждая квартира или офис уникальны, и привычные нам
объекты – чашки, компьютеры, мебель – отличаются друг от друга.
Чтобы решить эту проблему, предложенная учеными система разбивает задачу на
несколько частей в зависимости ситуации. Например, простая даже для ребенка просьба
«положить все игрушки в ящик» оказывается совсем нетривиальной для ИИ. Он не
обладает «здравым смыслом» и не знает, что такое «все игрушки». В такой ситуации
робот должен преобразовать запрос в требование «сегментировать игрушки», собрать

список найденных в комнате предметов и разбить задачу на этапы – то есть
самостоятельно написать себе руководство по уборке каждого конкретного объекта.
В настоящее время ученые проводят эксперименты с использованием
исследовательского робота-ровера с манипулятором.
«Современные большие языковые модели давно вышли за пределы чисто языковых
задач и находят свое применение и в робототехнике. Наша команда одной из первых в
мире продемонстрировала возможность составления иерархического плана действий
робота с помощью языковой модели и показала, как такую модель можно встроить в
сложную систему управления мобильным роботом. До этого выполнение языковых
инструкций было возможно в основном для статических роботов-манипуляторов.
Наша команда совместно со Сбером расширяет возможности применения как
языковых моделей, так и самих роботов»

Александр Панов, к.ф.-м.н., руководитель научной группы
«Нейросимвольная
интеграция» AIRI.

 

Фото: eurekalert.org

Нет комментариев