Иван Оселедец. Тензоры, прогнозирование и искусственный интеллект

Кто такой Иван Оселедец?

Если коротко, то человек, которого вообще-то надо знать. Доктор физико-математических наук, доцент АНО «Сколковский институт науки и технологий», старший научный сотрудник Института вычислительной математики РАН, лауреат премии Президента РФ в области науки и инноваций для молодых учёных за 2018 год. Но, самое главное, тот самый гений, заставляющий наш цифровой мир двигаться всё быстрее и быстрее.

За что ему дали премию?

«За создание прорывных вычислительных технологий решения многомерных задач физики, химии, биологии, анализа данных на основе тензорных разложений». И что всё это значит? Он расскажет сам. А еще о том, как обмануть нейросети, почему беспилотный автомобиль, в теории, не должен никуда ехать, и сможем ли мы однажды предсказывать будущее.

Текстовая версия интервью.

Иван, давайте начнем тогда с вашей работы, за которую вы получили премию. Я напомню, это сложно: за создание прорывных вычислительных технологий решения многомерных задач физики, химии, биологии, анализа данных на основе тензорных разложений. Давайте по порядку, что за работа? Что сделали? И, самое главное, зачем нужно?

Ну, объяснять можно по-разному. Но попробую таким образом. Вообще, что такое многомерные данные, да? То есть это всё имеет отношение к анализу данных. Но вот если числа ваши входные записаны в одномерной массе, то это называется вектором. 1, 3, 5, 7. Я потом скажу где это применяется и кому нужно. Это вектор. Соответственно, если у вас двумерный массив. Здесь одна какая-то переменная, здесь другая. Получается двумерная таблица. Как шахматная доска. Здесь тоже числа пишутся. Три, четыре, пять, семь, восемь. Это называется матрица.

Не та матрица, которая фильм. А что будет, если осей будет не две? Три ещё я могу нарисовать. Вот кубик такой. Кубик, ну, типа кубика-рубика или что-то такое. И дальше в каждом маленьком кубике тоже будет записано какое-то число. И это простейший пример тензора. Откуда это берется? Это берется в многомерном анализе данных. То есть у вас есть какая-то величина, которую вы хотите предсказать. Ну, например, цена на нефть. Сразу скажу, что на самом деле это очень сложная задача. Если бы я знал как это делать, то наверное занимался чем-то другим. Ну, бесплатного ничего не бывает. И тем не менее какая-то величина. Обозначаем буквой «У». И есть какие-то факторы, которые влияют на эту цену. Например, Х1 — это цена сегодня. Х2 – какой-нибудь фактор, который характеризует политическую обстановку. Например, эксперты ставят три значения: плохая, благоприятная, неблагоприятная. Ну, даже два можно. Либо плюс. Либо минус. Два значения. То есть это цена на нефть. Предположим цена 5 долларов она принимает условно говоря 100 значений. Второй признак принимает два значения. У нас это можно записать в двумерную таблицу. У матрицы в одной будет два варианта, в другой сто вариантов. И у нас будут данные наблюдений. Когда-то там позавчера и сегодня. И мы можем записать в эту табличку результат. Здесь у нас будут те признаки, которые мы знаем, а тут величина, которую мы хотим предсказать. Соответственно, когда у нас трёхмерный массив — у нас три признака и одна величина, которую мы хотим предсказать. Но в реальной жизни признаков гораздо больше. Возникают огромные многомерные массивы. Собственно, это и есть тензоры, в которых мы знаем очень мало элементов. Истории у нас недостаточно, чтобы все варианты перебрать. И задача состоит в том, чтобы имея такую неполную информацию восстановить все пропущенные элементы. И получить некое компактное представление вот этого многомерного массива. И то, что сделано в этой работе. Предложен целый ряд подходов и методов, которые позволяют вот эти многомерные массивы компактно представить, восстановить пропущенные элементы и соответственно, строить прогнозы.

​Как это поможет сделать мою жизнь и жизнь телезрителя лучше?

Ну, вокруг вас очень много вычислительных устройств, это сейчас телефоны. Все с мобильными телефонами. Все смотрят видео и происходит обмен данными между базовой станцией и телефоном. И в этот момент как раз происходит огромное количество операций вот с такими матрицами. У нас получилось ускорить эти алгоритмы примерно процентов на 15-ть. Что это означает? Ну, это означает, что данные на 15 процентов быстрее скачиваются. Вместо 11 минут тратите 10 минут. У вас лишняя минута жизни появляется. То есть на самом деле вся идея в том, что вокруг в современном мире очень много вычислений, которые мы напрямую не видим. И мы занимаемся тем, что эти базовые блоки, которые крутят этот цифровой мир – мы их ускоряем. Причём доведение их до продукта это не всегда наша работа. Предложили методы. Потом люди в Германии взяли и внедрили их ещё куда-то или в каких-то больших IT-компаниях и мир стал немного быстрее, немножко лучше.

Почему вы сказали в Германии? Почему не у нас?

И у нас тоже делается, естественно. Просто вот эти алгоритмы используются по всему миру. То есть они открытые. Это открытые программные пакеты — такие решения неких базовых задач. Люди берут, используют, внедряют. Это на мой взгляд совершенно замечательная практика. Почему нет?

То есть то, что вы предложили уже применяется?

Да, применяется. Причём в разных совершенны областях. От айти-компаний до телекоммуникационных. Как на уровне исследовательских, так и на уровне продукта.

У вас следующий этап работы, что нужно сделать?

Большой пласт работ связан с роботами. То, что сейчас называют модным словом – искусственный интеллект. Ну, это в первую очередь задача машинного и глубокого обучения. Там очень много как теоретических, так и алгоритмических вопросов. Ну, то есть все знают, что компьютер лучше распознает изображение, чем человек. Применяется это всё в медицине, есть беспилотная машина. Поэтому это большой хайп. Но вокруг этого очень мало, во-первых, теории. Непонятно, на самом деле, один из базовых вопросов – непонятно почему эти алгоритмы так хорошо работают. То есть их обучили на больших выборках. Но тем не менее, имеющаяся теория говорит, что выборок должно быть гораздо больше. Совершенно непонятно, почему они используют те данные, которые есть и нормально работают. То есть если вы делаете беспилотную машину, которая будет ездить на основании методов искусственного интеллекта, будет для вас гарантия того, что она не поведёт себя странно в незнакомой ситуации. Да, но таких гарантий нету. И это на самом деле интересный теоретический вопрос​. Более того, имеющиеся теоретические результаты говорят обратное. Что всё это не должно работать. Это очень подозрительно.

То есть беспилотная машина не должно ехать, я правильно вас понял?

Нет, она ездит. Но теория это никак не подтверждает. Это всегда так в принципе. Это большой разрыв между теорией и экспериментом. Это, в принципе, нормально, но хочется иметь какое-то обоснование. Потому что, естественно, если будем иметь основание, будем лучше понимать, как они работают. Сможем, например, интерпретировать те предсказания, которые эти алгоритмы дают. Ну, и это поможет, когда будет массовое внедрение. Когда это единичный случай – это нормально, а когда это будет повсеместное биометрическая идентификация по лицу, а в этих алгоритмах есть какие-то принципиальные дырки. А они там есть. То есть можно показать, как легко их достаточно обманывать. То вот эта дырка станет критической.

А как обмануть биометрию?

Если всё это работает на глубоких нейронных сетях, то есть так называемые злонамеренные примеры. Берётся вот какая-нибудь картинка. Тут нарисована кошка. Я правда кошку рисовать не умею. Ну, предположим это будет кошка. Пусть будет кошка. Свинья получилась. Но не важно. Классификатор выучен на миллионе картинок кошек, говорит, то это кошка. Но здесь будет какой-нибудь нехороший человек, который немножечко эту картинку возмутит в некоторых точках. Возмущение будет практически незаметно. После этого классификатор будет говорить, что это собака. Или будет это ваше фотография, а он будет считать, что это не ваша фотография. Ну, или наоборот. Это можно сделать. Связано с тем, что вот этих возмущений в обучающей выборке не было. ​По-английски это называется adversarial examples, то есть они эти примеры вот эти все искусственные нейронные сети – они ослепляют. И вот после этого классификатор перестает работать. ​Это очень интересная тема. Целый большой пласт исследований, которыми сейчас занимаемся, то есть как строить такие атаки и как защищаться от таких атак. И пока универсального ответа нету.

Почему вы решили пойти в науку? И какого вам в России заниматься наукой?

Достаточно всё просто получилось. Я закончил школу, поступил на физтех. Первые три года физтеха твоя основная задача – выжить, сдать курсы. Потом попал к научному руководителю Евгению Евгениевычу Тыртышникову. Он дал мне задачу. Она оказалась очень интересной. И мне понравилось этим заниматься. Оказалось, это жутко интересно. То есть действительно для меня одна из основных мотиваций заниматься наукой состоит в том, что, во-первых, это красиво, то есть там есть элементы искусства. Второе – элемент без которого на мой взгляд. Это мое личное мнение наукой лучше не заниматься. Это соревновательный компонент. Вот эта была исходная мотивация: это любопытство, это возможность построить решение задач так, как до этого никто не делал. Сейчас на самом деле сильная мотивация состоит в том, что все эти вещи действительно доходят до конкретного результата, до продукта, используется. То есть видно, что то, что ты делаешь – кому-то нужно.

Насколько российская наука конкурентоспособна? Вот до этого вы сказали применяется в Германии. Но вскользь первой назвали страну не нашу, где применяется?

Нет, в России, конечно, применяется. Причём в наших компаниях айти. Просто если это применяется не только у нас, но и на западе, то это хороший знак. Российская наука конкурентоспособна. Всё зависит от области. Если говорить о неэкспериментальных областях, то есть это физика, математика, вычислительная математика, российская наука очень сильно конкурентоспособна на данный момент. Если говорить про экспериментальную науку – есть огромное количество сложностей. Связано с тем, что сложно закупать оборудование, даже если есть деньги. Очень долго доставляются реагенты. Ну, я знаю, я знаком с экспериментаторами. Это очень сильно раздражает. То есть ты соревнуешься в неравных условиях. Если там они могут получить реагент завтра. Тут нужно ждать полгода.

2 комментария