Читает по губам. Нейросеть способна распознать речь на нескольких языках

07.12.2022

Ученые Имперского колледжа Лондона создали нейросеть, способную распознавать речь по губам говорящих людей. Причем ИИ читает по губам на нескольких языках, отличных от английского. Разработчики объяснили, что более ранние аналоги  визуального распознавания речи (VSR) рассчитаны на английский язык.

Созданная специалистами модель аналогична предыдущим, но некоторые параметры изменены. В итоге системы глубже изучает вводимые данные и лучше распознает речь на разных языках.

«Мы добились самых современных результатов на нескольких языках благодаря тщательному проектированию модели, а не просто использованию больших наборов данных или больших моделей», — прокомментировали разработчики.

Результаты работы опубликованы в журнале Nature Machine Intelligence.

 

 

Фото: fbm.ru

Нет комментариев