Дональд Трамп в предвыборном интервью признался, что его пугают темпы развития искусственного интеллекта. Он обнаружил, что ИИ способен составить речь для выступления намного быстрее и качественнее, чем его сотрудники. Как мы до этого дошли и что будет дальше? «ПОИСК» задал этот вопрос человеку, находящемуся на передовой развития искусственного интеллекта.
Сергей Марков – управляющий директор, руководитель Управления экспериментальных систем машинного обучения департамента SberDevices. Голосовой помощник «Сбера», генеративная модель ruDALL-E («Кандинский»), модель для синтеза музыки SymFormer и многое другое – лишь некоторые плоды работы «команды Маркова», работающей совместно с другими ИИ-командами Сбера.
Нож, одежда и триада ИИ
Современные технологии искусственного интеллекта (ИИ, в англоязычной литературе – AI) призваны раздвинуть границы интеллекта человеческого. От начала времен человек так или иначе борется со своим несовершенством, изобретая все новые способы, помогающие ему адаптироваться к природе. Вместо острых когтей и зубов, которыми были вооружены звери, люди создавали ножи и пики, вместо толстой шкуры и густого меха – одежду. Но настало время, когда их стало остро волновать несовершенство не только собственного тела, но и разума.
Сергей Марков поясняет: «Есть ряд барьеров, которые человеческий мозг не может преодолеть. Например, барьер скорости. У человека мозг основан на «мокрых», если можно так выразиться, технологиях. Это электрохимическая система, в которой ионы проталкиваются через зону каналов синапса, и скорость их перемещения зависит от разницы потенциалов. Чем больше разница в потенциалах, тем быстрее они движутся. Но если она станет больше 1,27 вольта, вода начнет разлагаться на водород и кислород, что прекратит не только мышление, но и земное бытие индивида».
Синапс – место контакта между двумя нейронами или между нейроном и получающей сигнал клеткой. Нейроны и клетки обладают электрическим потенциалом: благодаря разнице между ними нервные импульсы доходят до точки назначения в головном мозге.
Cинаптическая передача. Изображение: Freepik
Еще один естественный барьер – надежность. Для решения определенных задач технологические системы могут быть надежнее, чем люди. Все мы иногда «тупим». Электронные системы тоже, но исключительно из-за человеческих ошибок, неважно, на уровне «железа» или «софта».
Существует также ограниченный параллелизм – человеку сложно решать несколько задач сразу и, как только такая необходимость возникает, мы срочно набираем дополнительных людей, что не всегда рационально и всегда дорого. Ну и, наконец, вечная проблема физической хрупкости тоже имеет прямое отношение к ИИ. Люди живут в очень узком диапазоне температуры, давления, концентрации кислорода. 99,(9)% Вселенной не приспособлены для нашей жизни.
Но, несмотря на временное отступление в освоении космоса, мы все равно выйдем туда, потому что у нас, простите за тавтологию, попросту нет другого выхода. Технологический потенциал человечества гораздо выше, чем необходимо для обживания Земли, и попытки колонизации небесных тел – единственный мирный способ выплеснуть кипучую энергию Homo sapiens. Но к этому времени нам будут нужны системы, которые смогут в таких ситуациях действовать за нас – не благодаря удаленному управлению, ибо расстояния в космосе очень велики даже для радиосигнала, а именно принимая решения на месте.
Согласно формулировке Сергея Маркова, искусственный интеллект – это область науки и технологии, которая занимается автоматизацией решения интеллектуальных задач. И в этом смысле древние технологии вроде абака – своего рода один из первых подходов к снаряду, тот же поиск способов усиления наших возможностей в этой области.
Даже рисунок и письменность – это ведь тоже примитивные технологии расширения возможностей интеллекта, механизмы для кодирования, совершенствования передачи и, главное, сохранения информации.
Абак – расчерченная линиями счетная доска в древних Европе и Китае, предшественник роликовых счётов. Арифметические операции осуществлялись с помощью перемещения по линиям камешков или иных предметов.
На нынешнем этапе развития человечества реализация искусственного интеллекта выглядит в виде триады:
- искусственный интеллект – область науки и технологии, которая занимается
автоматизацией решения интеллектуальных задач; - машинное обучение – отрасль ИИ, включающая в себя методы, в которых
поведение создаваемых систем не программируется явным образом, а
появляется в результате применения статистических и оптимизационных методов; - искусственные нейронные сети (нейросети) – наиболее современный класс
моделей машинного обучения.
Изображение: Freepik
Рассказывает Сергей Марков: «То, что сейчас делается в области исследования области искусственного интеллекта, во многом заложено Дугласом Энгельбартом, который в начале 1960-х задался вопросом, каким образом машины могутрасширять возможности человеческого интеллекта. Его обычно вспоминают как изобретателя компьютерной мыши, но на самом деле Энгельбарт – авторпринципов, положенных в основу современных интерфейсов взаимодействия людей с машинами – включая, например, многооконность. Его труд "Расширение человеческого интеллекта. Концептуальные основы" – действительно концептуальная основа всего, что происходит сейчас в сфере ИИ, и обязателен к прочтению всеми, кто интересуется этой сферой».
Грезы об «электронном Госплане»
Одним из самых очевидных и потенциально ценных направлений применения ИИ является управление экономикой.
В 1960-х годах экс-чемпион мира по шахматам Михаил Ботвинник поставил вопрос о создании компьютерной шахматной программы с прицелом адаптации ее для управления советской экономикой. Масштабной поддержки Ботвинник не нашел, отчасти из-за слабости компьютерной базы в стране, отчасти из-за чиновничьего консерватизма. Только в 1980-х усилиями, в частности, Николая Ведуты идея «кибернетического Госплана» наконец завладела умами продвинутой части партийной верхушки, но тут в стране как на грех закончилась плановая экономика.
Казалось бы, если мы не можем дать ИИ директивную роль в экономике, то по крайней мере прогностическая ему точно по плечу. Уже сейчас человечество в состоянии построить модель, которая на основании большого массива статистических данных сможет спрогнозировать, например, урожай сои в Амурской области в 2050 году.
Вот только в реальном мире слишком много «черных лебедей», «идеальных штормов» и прочих рукотворных форс-мажоров с красивыми именами. Естественным ограничителем мощи ИИ здесь, как ни странно, является человек. При определенном обучении и соответствующем объеме метеорологических данных ИИ, вероятно, скоро будет способен создать достоверный список всехураганов на несколько лет вперед, но он точно не в состоянии угадать, какие экономические решения примет руководство той или иной страны. Увы, санкционный мир насквозь алогичен, а значит, неподвластен компьютерным прогнозам.
Есть, впрочем, одно условие, при котором и прогнозирование, и даже планирование станут возможными – это приход ИИ к власти во всех сколько-нибудь значимых странах. Если нейросети в состоянии писать речи президентам, они явно способны и отдавать поручения министрам. Звучит как антиутопия (или утопия, для кого как), но в одной отдельно взятой сфере это произойдет достаточно скоро.
Речь идет об автомобильном движении – все еще достаточно опасном мероприятии. Автомобили с автопилотом уже созданы, система работает качественно, но предсказать маневр какого-нибудь горячего мачо она не в состоянии. Поэтому, например, в Москве ехать на автомобиле даже с идеальным автопилотом просто страшно. Человек на основании личного опыта по косвенным признакам может вычислить неадеквата, но формализовать эти признаки для нейросети чрезвычайно сложно, если возможно вообще.
Но что если бы все машины на дороге были оборудованы автопилотами – соединенными в единую сеть? Это дало бы абсолютную предсказуемость действий и, соответственно, их координацию. В компьютерных играх автомобили не сталкиваются между собой, если это не предусмотрено создателями игры – то же самое было бы и на дорогах. Кстати, при полном переходе на автопилот исчезнут и пробки – ИИ с легкостью определит оптимальные маршруты для всех. Возможно, уже сегодняшнее поколение младших школьников застанет времена запрета на вождение автомобиля человеком.
Изображение: Freepik
Добавим, что для не столь всеобъемлющих задач компьютерные алгоритмы широко используются уже сейчас. Несложные нейросети уже сейчас с легкостью зарабатывают деньги на фондовом рынке – компьютер в состоянии покупать и продавать ценные бумаги куда быстрее живого трейдера, поэтому на биржах введены ограничения по числу и частоте транзакций.
Маленький шажок ИИ – большой скачок к безработице?
Безусловно, ИИ, как и любая значимая новая технология, изменит ситуацию на рынке труда. Именно эта тема совсем недавно обсуждалось на круглом столе в МИА «Россия сегодня». Что ж, давайте и мы попробуем изучить ситуацию в этой сфере.
Первыми приняли на себя удар переводчики: уже в нулевых годах системы машинного перевода существенно снизили объем их работы. Оказалось, что для большинства ситуаций компьютерного перевода вполне достаточно, тем более что он с каждым годом становится все качественнее. Сейчас робот уже вполне может работать даже голосовым переводчиком-синхронистом.
На глазах умирает профессия редактора новостей. Представители одного СМИ, попросившие не публиковать его название, с помощью ChatGPT 3,5 и одного редактора делают 60 новостей в сутки – ранее тот же объем выдавали три новостника на полной зарплате. Еще хуже дела у копирайтеров – целый ряд движков готов быстро и бесплатно (или очень дешево) написать текст на любую тему. В мире лидируют ChatGPT, Gemini, только что анонсирована универсальная система Apple Intelligence, а в России выделяются GigaChat «Сбера» и YandexGPT. Беда и у операторов колл-центров: почти во всех крупных компаниях звонки принимает робот, и хотя полноценно решать сложные вопросы он еще не может, персонал первых линий поддержки сокращен очень сильно.
Тают доходы фотографов: если ранее новости в СМИ иллюстрировались изображениями из фотобанков, то сейчас все чаще их заменяют изображениями, сгенерированными нейросетями. Это Stable Diffusion, Midjourney, DALL-E, многие другие, а в России, опять же, конкурируют YandexArt и «Кандинский» «Сбера». Но особенно туго будет цифровым художникам: грамотно написанный запрос («промпт») заменяет часы упорного высококвалифицированного труда.
О будущем профессии водителя мы поговорили выше, и есть все основания полагать, что то же самое произойдет и с машинистами поездов. У летчиков «запас прочности» побольше – ввиду особой опасности воздушного транспорта как минимум для страховки ИИ на случай нештатной ситуации живой пилот нужен будет еще долго.
Корректоров уже сейчас в десятки раз меньше, чем было тридцать лет назад – в России они еще держатся, на Западе сокращены почти все.
Теоретически грамотно сконструированный робот под управлением ИИ может заменить даже парикмахера и, страшно сказать, маникюршу. Но в серьезных масштабах это случится еще очень нескоро – куда раньше станет беспилотным весь транспорт.
Также под вопросом профессии курьера, охранника и учителя. Да-да, именно учителя. Несложно предположить, что в массовых школах все больше будут внедряться цифровые технологии, тогда как взаимодействие с живым педагогом сможет позволить себе только элита. Между тем шофер и учитель – две самые массовые профессии в России.
Чем заняться в мире нейросетей
Что ж, рынок труда меняется не впервые. И как отразится на нем новый виток научно-технического прогресса, с абсолютной точностью предсказать трудно. Те же художники когда-то уже пережили изобретение фотографии, а вот шорники, занимающиеся конской упряжью, после распространения автотранспорта практически исчезли. Есть и более свежие примеры – после распространения онлайн-торговли число покупок в «живых» магазинах сильно сократилось, однако при этом продавцы все равно нужны постоянно и везде.
Но есть одна проблема. Трансформация рынка труда – явление постоянное, но темпы у нее разные. Какие-то новации внедряются медленно, какие-то существенно быстрее. Сейчас, когда люди живут и работают долго, а технологии совершенствуются быстро, необходимо создавать социальные демпферы – обеспечивать теряющим профессию людям социальную поддержку или качественную переподготовку.
Учиться чему-то даже в зрелом возрасте – нормальный процесс для Homo sapiens. И это, кстати, роднит его с ИИ. Очень многие профессии требуют от человека именно умения учиться, отталкиваясь от той базы, которая у него есть. И таких профессий все больше: не будет преувеличением сказать, что постоянное обучение – это обязательное требование уже сегодня.
Можно сказать, что прямо сейчас рождается новая профессия, точнее даже профессиональная область – управление искусственным интеллектом, умение эффективно его использовать и обучение этому умению (AI-тренинг). Любой может написать «Кандинскому» «Нарисуй мне веселого котика в новогоднем стиле», но сформулировать запрос так, чтобы на выходе был действительно оригинальный рисунок с художественной ценностью, способны единицы.
История свидетельствует, что человек крайне изобретателен в выдумывании профессий. Общество, создавшее бизнес-коучей и бьюти-блогеров, способно на все, лишь бы каждый человек чувствовал себя полезным.
А поскольку ИИ – лицо заинтересованное, мы задали двум генеративным моделям – Gemini и «Гигачату» – один и тот же вопрос: «Какие новые профессии появятся после торжества искусственного интеллекта?» Вот что они ответили.
Gemini:
появление искусственного интеллекта (ИИ) приведет к появлению многих новых профессий, даже если некоторые рутинные задачи будут автоматизированы. Вот несколько примеров:
1. Специалисты по этике ИИ:
- обеспечивать разработку и использование ИИ в соответствии с этическими принципами;
- решать сложные вопросы, связанные с предвзятостью, прозрачностью и безопасностью ИИ;
- консультировать компании и правительства по вопросам внедрения ИИ.
2. Инженеры по безопасности ИИ:
- разрабатывать и внедрять системы безопасности для защиты ИИ-систем от кибератак и других угроз;
- обеспечивать конфиденциальность и целостность данных, используемых в ИИ-системах;
- тестировать ИИ-системы на наличие уязвимостей и разрабатывать планы их устранения.
3. Специалисты по человеко-машинному взаимодействию:
- проектировать и разрабатывать интерфейсы, которые позволяют людям легко взаимодействовать с ИИ-системами;
- обеспечивать удобство использования и интуитивно-понятность ИИ-систем;
- проводить исследования для изучения того, как люди взаимодействуют с ИИ и как улучшить этот опыт.
4. Специалисты по данным ИИ:
- собирать, очищать и готовить данные для обучения ИИ-систем;
- разрабатывать алгоритмы для извлечения информации из данных;
- отслеживать производительность ИИ-систем и вносить коррективы по мере необходимости.
5. Творческие специалисты, работающие с ИИ:
- использовать ИИ-инструменты для создания новых форм искусства, музыки и дизайна;
- сотрудничать с ИИ-системами для создания совместных работ;
- исследовать потенциал ИИ для расширения границ творческого самовыражения.
Помимо этих конкретных профессий, ИИ также приведет к появлению новых возможностей в существующих профессиях. Например, врачи могут использовать ИИ для диагностики заболеваний, а учителя – для персонализации обучения.
Изображение: Freepik
Важно отметить, что это лишь некоторые из примеров новых профессий, которые появятся благодаря ИИ. По мере развития этой технологии появятся и другие, даже сейчас мы не можем себе их представить.
Чтобы преуспеть в будущем, важно быть готовым к адаптации и изучению новых навыков. Вам следует сосредоточиться на развитии навыков, которые дополняют ИИ, таких как креативность, критическое мышление и социальный интеллект. Эти навыки будут востребованы во всех профессиях, независимо от того, какие новые технологии появятся.
Gigachat:
развитие технологий искусственного интеллекта приведет к появлению новых профессий. Так, согласно докладу Глобального института McKinsey «Будущее рабочих мест», среди них будут:
- специалисты по кибербезопасности;
- специалисты по работе с данными;
- специалисты по машинному обучению;
- разработчики программного обеспечения;
- специалисты по анализу данных;
- специалисты по автоматизации;
- эксперты по робототехнике;
- специалисты по интеллектуальным устройствам;
- специалисты по виртуальной реальности;
- специалисты по искусственному интеллекту;
- специалисты по цифровому маркетингу;
- специалисты по блокчейну;
- специалисты по Интернету вещей (IoT);
- специалисты по квантовым вычислениям;
- специалисты по 5С;
- специалисты по облачным технологиям;
- специалисты по умным городам, специалисты по дополненной;
- реальности (AR).
В общем, если нам и есть чего бояться, то точно не ИИ. Упрощение, удешевление и распространение технологий 3D-печати гораздо сильнее повлияет на рынок труда, чем искусственный интеллект, поскольку преобразит не виртуальное пространство, а самое что ни на есть реальное производство.
ИИ нам друг, но истина дороже
К теме о смерти и рождении профессий примыкает базовая проблема несовершенства искусственного интеллекта. Он, как ни странно, не умеет отличать правду от лжи. И это, кстати, тоже роднит его с большинством людей.
Одна из главных проблем нейросетей – качество данных, на которых их обучают. Да, существуют авторитетные энциклопедии с минимумом ошибок, но воспитанная на «Британнике» текстовая модель будет совершенно непригодна для задач XXI века. Соответственно, объем данных, которые использует нейросеть, должен постоянно расти, и в общем случае это – весь интернет. При этом в Сети очень много недостоверной информации, отфильтровать которую вручную совершенно невозможно – для этого тоже нужен ИИ, и это выглядит как некий порочный круг верификации.
Сергей Марков, однако, не считает ситуацию тупиковой: «Дело даже не в том, что отфильтровать невозможно. Дело в том, что это и не нужно. Это как если в стихотворении «Что такое хорошо и что такое плохо» убрать все, что плохо, и потом пытаться использовать его как моральный ориентир. Поэтому на стадии предобучения очень важно, чтобы данные были максимально разнообразными, полный цифровой след человечества без пробелов. Качественные и достоверные данные при обучении современных больших языковых моделей нужны уже на втором этапе – дообучении следованию инструкциям. Тут уже используются вручную подготовленные качественные вопросно-ответные пары».
На данный момент, однако, текстовый помощник неизбежно будет несовершенен, его всегда надо проверять. ИИ вполне в состоянии написать неплохой студенческий реферат по строго ограниченному количеству источников, но, отпущенный в «свободное плавание», он почти неизбежно понаделает ошибок, особенно в гуманитарных науках.
Даже сейчас, когда ИИ вроде бы знает все, только одна из почти десятка опрошенных нами генеративных моделей (Gemini) смогла правильно ответить на простейший вопрос, сколько пальцев было на руках у президента России Бориса Ельцина. У него было семь здоровых пальцев и один без фаланги – теперь вы знаете больше, чем «страшные нейросети». Почему?
Большой ИИ следит за тобой?
В начале распространения еще даже не ИИ, а хороших цифровых механизмов создания и корректировки фото- и видеопродукции появилась такая проблема, как «дипфейки» (deep fake) – хорошо сделанные, глубоко проработанные фальсификации. Российское общество впервые столкнулось с этой проблемой в 1990-х годах, посмотрев ролик с «человеком, похожим на генпрокурора», который в итоге стоил должности высокопоставленному чиновнику.
Сейчас, когда дипфейки можно делать буквально одним запросом к нейросети, проблема, казалось бы, стала очень острой.
Однако Сергей Марков считает, что это не совсем так: «Я, думаю, что проблема во многом раздута. Когда-то люди верили печатному слову: раз это написано в газете, значит, правда. Потом какое-то время доказательством считалось изображение или видео. А сейчас складывается ситуация, когда любые видео или тем более картинки, даже выглядящие совершенно правдоподобно, больше не являются доказательством того, что запечатленные события имели место в действительности. Люди постепенно это понимают».
Как ни странно, но существование дипфейков в какой-то степени облегчает участь жертв шантажа. Качество подделок, включая не только внешность, но и голос, сейчас таково, что практически в любой ситуации можно объявить «компромат» сгенерированным контентом. Даже если он таковым не является.
Гораздо страшнее дипфейка его антоним – так сказать, deep true, глубокое проникновение электронного интеллектуального наблюдателя в нашу реальную жизнь.
По записям с видеокамер, геопозиционированию телефона, движениям по банковской карте и так далее уже давно можно в подробностях восстановить жизнь человека. Но до недавнего времени это было тяжелым многочасовым ручным трудом. Теперь ИИ с доступом к соответствующим базам может выдать цифровой портрет любого человека мгновенно. И даже идеально добропорядочному человеку становится неуютно жить в таком прозрачном мире. Как привыкнуть к новой реальности?
На самом деле, полагает Сергей Марков, подобные скачки в сторону снижения приватности, так же как и колебания на рынке труда, – не новость. Похожие ситуации уже возникали: когда, например, появилась фотография, когда научились распознавать отпечатки пальцев, когда распространились анализ ДНК, повсеместное видеонаблюдение и так далее.
Как и все другие достижения техники, ИИ – в частности, системы распознавания лиц, – используют для раскрытия преступлений. Но не следует думать, что это какое-то безграничное применение: все больше стран законодательно ограничивают «полномочия» ИИ. В Евросоюзе, например, совсем недавно принят жесткий AI-акт. В данном случае вопросы надо задавать не нейросетям, а использующим их людям.
ИИ в России: свет и тени
Первый заместитель председателя правления «Сбера» Александр Ведяхин сообщил в апреле 2024 года, что искусственный интеллект используется в организации повсеместно: «Мы начали внедрение ИИ с самих себя. В 85% процессов Сбера уже внедрен искусственный интеллект – в 2023 году было порядка 75%. В 2024 году банк планирует получить 400–450 млрд рублей прибыли от искусственного интеллекта».
Изображение: Freepik
Александр Александрович пояснил, что искусственный интеллект может менять процессы по-разному. Первый и самый очевидный вариант – радикальное ускорение. Благодаря нейросетям срок принятия решения о выдаче кредита сократился с нескольких дней, а когда-то и недель, до нескольких минут. Второй – постепенные улучшения, когда эффективность повышается на 20–30% ввиду автоматизации части процессов, которые ранее выполнялись вручную. Есть и третий, нежелательный вариант: искусственное «прикручивание» искусственного интеллекта туда, где он никак не добавляет эффективности.
Ведяхин обратил внимание на интересные результаты обучения базовой нейросетевой модели «Сбера» GigaChat. Выяснилось, что, когда модель получает множество знаний из абсолютно разных областей, а потом доучивается на специализированный профиль, то общий профессиональный интеллект модели оказывается выше, чем у обученных только на специализированных данных. В частности, недавно GigaChat сдал выпускной экзамен Института медицинского образования НМИЦ им. В. А. Алмазова по направлению подготовки «Лечебное дело». Разумеется, такой эффект достигается только у очень больших сетей с хорошо отлаженной архитектурой.
Еще любопытная деталь. Учитывая, что человеку уже сложно проверить качество работы новой нейросетевой модели, в «Сбере» процесс запуска в промышленную эксплуатацию выглядит так: уже проверенная модель тестирует новую, а потом человек принимает окончательное решение о принятии новинки или отправке ее на доработку.
Нейросети «Сбера» наряду с разработками «Яндекса» делают Россию одним из глобальных лидеров в сфере искусственного интеллекта (тот же экзамен в медицинском вузе «Гигачат» сдал одним из первых в мире). У этого лидерства есть и обратная сторона: в 2023 году число судебных разбирательств в сфере искусственного интеллекта увеличилось на 60%. Среди основных категорий прошедших разбирательств – споры по грантам на разработку IT-продукции с использованием ИИ, споры по договорам на создание программного обеспечения с элементами ИИ, споры об авторских правах на произведения, созданные с использованием ИИ, административные правонарушения, в основном в рамках рассылок/звонков с использованием ИИ.
Что ж, издержки при внедрении новых технологий неизбежны. Но в целом Россия легко переживает переходную стадию: ИИ проникает в жизнь незаметно, без шоков и революций.
И это хорошо.
Специалисты, непосредственно работающие над публичными моделями генеративного ИИ, хорошо знают, что подавляющая часть мощностей все равно уходит в лучшем случае на изображения котиков, на какие-то веселые или хулиганские вещи, практического применения не имеющие, а в худшем на порнографию (если это дозволяется в данной нейросети).
Так уж устроен человек – что ему ни дай, он все может превратить в игру. И именно это сильнее всего отличает нас от электронного помощника-конкурента.
Автор текста Михаил Мельников
Изображение на обложке: Freepik