Мир переживает вторую весну искусственного интеллекта (ИИ) – впервые с 70-х годов прошлого века в эту технологию активно вкладывают деньги. Новая надежда разработчиков связана уже не с классическим программированием, но с машинным обучением, в частности с нейронными сетями, имитирующем некоторые особенности работы человеческого мозга.

Большие объемы доступных сегодня данных и дешевые вычислительные мощности позволяют буквально тренировать компьютеры выполнять разные интеллектуальные задачи, такие как перевод текста или анализ изображений. Как технологии машинного обучения меняют мировую экономику и какую роль в этом играют исследователи из России? Об этом рассказал Михаил Бурцев, руководитель лаборатории нейронных систем и глубокого обучения Московского физико-технического института (МФТИ).

Арнольд Хачатуров

Как технологии искусственного интеллекта меняют жизнь и мировую экономику. Интервью Михаила Бурцева

– Генеральный директор Google Сундар Пичаи недавно заявил, что создание искусственного интеллекта (ИИ) по своей значимости потенциально превосходит открытие человечеством огня и электричества. Нынешняя весна связана с исследованиями в области проектирования и обучения нейронных сетей. Когда подобные системы появились?

– Первые разработки в области ИИ относятся к 1950-м годам. С самого начала существовало два основных подхода к ИИ, которые решают одни и те же задачи совершенно разным образом. Первый подход связан с попытками смоделировать интеллектуальную деятельность человека, его поведение – например, то, как человек рассуждает. Это направление, получившее название символьный, или традиционный, ИИ, раньше считалось наиболее многообещающим и получало основную часть финансирования. Второй подход предполагал моделирование нервной системы человека. Это и были нейронные сети, которые до последнего времени развивались на периферии. Потом, в 1970-е, был придуман алгоритм обучения, который позволял нейросетям решать задачи аппроксимации функции. В этом как раз проявилось основное отличие нейронных сетей от классических алгоритмов, в случае которых программист должен заранее задать последовательность вычислений, необходимых для решения задачи. С нейросетями вам не нужно знать эту последовательность – достаточно иметь много примеров входных данных и правильных ответов, а затем применить алгоритм обучения, который автоматически настроит параметры нейросети. В результате нейросеть сможет решать задачу не только для знакомых примеров, но и для всех остальных случаев. Например, вам нужно научить нейросеть отличать пирожные от бананов на картинках. Вы берете несколько тысяч картинок и размечаете их – где пирожные, а где бананы. После этого обучаете нейросеть предсказывать правильный ответ. Алгоритм учится обобщать обучающую выборку, на которой он тренировался, и в итоге может работать с незнакомыми картинками.

– Почему расцвет нейронных сетей начался именно в последние годы?

– Все преимущества нейросетей по-настоящему проявились только тогда, когда у нас появилось достаточно данных для их обучения. Как я уже сказал, нейросети не программируют в стандартном понимании, их тренируют. Поэтому результат сильно зависит от объема данных: чем их больше, тем выше качество решения. Во-вторых, качество обучения зависит от размера нейронной сети. Чем она больше, тем больше вычислений нужно проделать, чтобы ее обучить. Если мы используем небольшие объемы данных – скажем, сотни картинок – мы получим качество, которое не будет превосходить качество обычного инженерного решения. Но если мы используем нейросети из сотен тысяч нейронов и примеров, то тогда алгоритмы позволяют существенно уменьшить уровень ошибки. Раньше для этого нам не хватало мощности – чтобы натренировать сегодняшние алгоритмы, пришлось бы считать целый год, причем без гарантий, что что-то получится. Поэтому никто и не пробовал. Но когда в последние годы удалось оптимизировать вычисление нейросетей на аппаратной платформе графических ускорителей (на той же платформе занимаются майнингом криптовалют.Ред.), это привело к расцвету этого метода.

Если же говорить про другие формы машинного обучения, то превосходство нейросетей, видимо, связано с тем, что эти алгоритмы достаточно универсальны. Нейросети подходят для широкого спектра применений: можно строить архитектуры, которые будут подходить под различные классы задач. Все это в совокупности и позволило им выстрелить в последние пять лет.

Насколько устройство нейросетей воспроизводит строение человеческого мозга?

– На самом деле нейросети не очень сильно похожи на мозг. Скорее, они инспирированы мозгом, но не являются его моделью. Например, алгоритм обратного распространения ошибки, который используется для стохастического градиентного спуска при обучении глубоких нейросетей, не имеет аналога в мозге. Так что скорее это просто некий биоподобный алгоритм.

 

Петр Саруханов / «Новая газета»

Есть исследователи, которые отстаивают идею «нейроморфных» чипов и искусственных синапсов, которые в точности воспроизводили бы работу биологических систем.

– Да, есть целый европейский проект Human Brain Project, на который выделили 1 млрд евро сроком на 5 лет. Планируется сначала полностью смоделировать мозг мыши, а потом и человека. Пока это лишь исследовательский проект, о перспективах применения полученных в этом проекте моделей для решения практических задач говорить еще рано. Но думаю, в каком-то приближении такая модель все же будет построена, хотя насколько точно она будет отображать человеческий мозг – это открытый вопрос. Очевидно, что в этой модели не появится сознание.

Как выглядят нейросети, которые сегодня окружают нас в повседневной жизни?

– Яркий пример – машинный перевод (переводчики от Google и «Яндекс»), который осуществляется при помощи нейросетей. Алгоритмы также используются для распознавания речи, перевода голоса в текст, во всех голосовых интерфейсах, например в айфоне. Сюда же стоит отнести сортировку картинок, когда можно фильтровать их не только по описанию, но и по содержанию. И конечно, любой поиск в интернете сегодня построен на нейросетях. Вообще, если посмотреть на презентации, которые показывает Google, можно заметить, что доля их внутренних проектов, в которых так или иначе задействованы нейросети, сегодня приближается к 100%. Нейросети повсюду, хотя иногда мы можем об этом даже не догадываться.

Вы в лаборатории МФТИ занимаетесь разработкой нейросетей. Расскажите, в чем заключается ваш главный проект, iPavlov?

– Мы занимаемся применением нейросетевых методов к задачам ведения диалога. Сегодня традиционная архитектура нейросети выглядит следующим образом. Есть несколько этапов обработки информации, своего рода модулей. Первый отвечает за то, чтобы понять высказывание. Система должна опознать намерения пользователя и классифицировать его запрос. Затем, чтобы ответить на него, нужно проанализировать текст запроса на предмет содержащихся в нем параметров задачи. Предположим, речь идет о заказе столика в ресторане. Сначала алгоритм должен понять, что сейчас человек запрашивает наличие свободных мест. Затем нужно узнать, какой тип ресторана ему нужен: вид кухни, ценовой диапазон и т.д. Для этого нейросеть выделяет так называемые сущности – значения переменных, которые описывают характеристики задачи. Когда он получил всю информацию, алгоритм обращается в базу данных, фильтрует рестораны, узнает наличие мест и генерирует ответ.

То есть существует три основных этапа: понимание запроса, управление диалогом и реализация действия (предоставление ответа пользователю). Примерно так выглядит решение задач современными разговорными системами.

На каком этапе разработки находится ваш алгоритм?

– Пока что на самом раннем. Мы можем помогать оператору техподдержки, выдавая ему наиболее релевантные ответы на запрос пользователя. Или сортировать сообщения пользователей: система помогает направлять запрос к правильному специалисту. Но даже эти функции уже значительно ускоряют процесс ответа на запросы клиентов. Вторая часть нашей задачи состоит в том, чтобы заменить нейросетью ту часть диалогового интерфейса, которая определяет правила поведения системы, – например, когда нужно задать дополнительный вопрос, когда отправить запрос в базы данных и т.д. Обычно это поведение задает программист, но мы хотели бы, чтобы единый алгоритм обучался вести диалог полностью самостоятельно.

Есть много примеров, когда алгоритмы сочиняли музыку, писали сценарии для кинофильмов или занимались современным изобразительным искусством. Вы видите потенциал нейросетей в решении творческих задач?

– Нейросети позволяют генерировать более-менее адекватные вариации, из которых человек может выбирать лучшие. Очевидный пример – это перенос стилей изображений, когда можно, например, перенести импрессионистский стиль с картины на фотографию. Тут возникает широкое поле для экспериментов: можно взять любой элемент и использовать его для создания какого-то образа, причем сделать это за одну минуту. С другой стороны, понятно, что в искусстве не только форма играет роль, но и некоторый контекст, в котором это произведение создается. И тут, конечно, нейросети ничего предложить не могут.

С точки зрения генерации каких-то сюжетов и вообще текста нейросеть можно научить подражать стилю писателя, но она будет неспособна производить длинные связанные последовательности предложений. Пока что никто не знает, как сделать такой алгоритм, который смог бы уловить сюжет, правильные отношения между частями текста.

Насколько хорошо мы сами сегодня понимаем «смысл» работы алгоритмов? Многие эксперты говорят, что слишком сложное устройство нейросетей может скрывать в себе потенциальную опасность для людей.

– Думаю, особой опасности здесь нет. Мы многого не знаем о том, как работают какие-то сложные программные продукты. Например, про операционные системы можно сказать то же самое. Мы не можем проанализировать все варианты поведения ОС – программисты затыкают дырки, только когда видят, что что-то работает не так. Это связано с тем, что система состоит из многих компонентов, и сложно предугадать, как они себя поведут. Примерно то же самое с нейросетями. Да, мы можем не знать, как именно она работает. С другой стороны, если нейросеть по изображениям МРТ диагностирует рак легких в два раза точнее, чем лучший специалист, многим будет все равно, как именно она устроена.

То есть пока что нет поводов опасаться, что в мире будущего суперкомпьютеры будут самостоятельно программировать друг друга, а люди, в том числе программисты, останутся не у дел?

– В принципе, можно написать программу, которая будет создавать другие программы, – это вполне нормально. Другое дело, что пока это не позволяет пересечь определенный уровень сложности, можно лишь улучшить решение задач в ограниченном интервале. В будущем влияние программистов только усилится, скорее надо думать о тех людях, которые заняты рутинной, чаще всего бюрократической работой. Использование технологий автоматизации труда даже без методов глубинного обучения – возьмем всевозможные единые информационные системы – лишает людей работы в массовом порядке. В любом случае внедрение новых технологий нельзя остановить, сколько бы ты с этим ни боролся. Нужно думать о том, как перейти к ним с минимальным стрессом для общества.

В таком случае сам термин «искусственный интеллект» выглядит не совсем корректно.

– На мой взгляд, терминологические споры больше интересны с точки зрения беседы интеллектуалов, а не в практическом плане. Сегодня под ИИ понимается некоторый набор технологий, позволяющий автоматизировать задачи, которые раньше считались интеллектуальными, вот и все. Другая грань этого понятия – это созданное в кино и литературе представление о том, что роботы обладают разумом, сопоставимым с человеческим. Это абсолютно разные вещи, просто не надо их смешивать.

Такие люди, как Стивен Хокинг и Илон Маск, вполне серьезно называют возникновение суперинтеллекта угрозой для существования человечества.

– У них сформировались завышенные ожидания роста в области ИИ, поскольку они напрямую не участвуют в этой работе. И конечно же, в этом смысле они не приносят пользу реальным исследованиям, поскольку скорее пугают людей. Если говорить про Маска, то, думаю, он пытается минимизировать все возможные риски, и поэтому у него слегка параноидальный подход к этой теме.

– Противоречия новых технологий хорошо заметны на примере Китая. С одной стороны, из-за огромного количества доступных данных в прошлом году Китай впервые обошел США по объему инвестиций в ИИ. В то же время считается, что одна из причин роста инвестиций – это стремление китайских властей наладить массовую слежку за гражданами.

– Хорошо или плохо быстрое развитие искусственного интеллекта – зависит от того, как вы сформулируете вопрос. Если посмотреть на ИИ как на глобальную технологию, которая позволяет национальным компаниям выходить на мировой рынок, то наличие большого объема данных и инвестиций дает Китаю некую фору и увеличивает его шансы стать сильным игроком. Если же говорить о применении ИИ для распознавания лиц, то понятно, что эта технология сама по себе нейтральна и может быть внедрена где угодно. Например, осенью одна из российских технологических компаний отчиталась о том, что пилотное внедрение на станциях метрополитена технологии распознавания лиц позволило за месяц задержать 15 разыскиваемых преступников. В этом плане эффект, конечно, положительный.

– Есть ли у России шансы в мировой гонке разработчиков ИИ?

– Отдельные российские программисты и математики очень конкурентоспособны, они работают в крупных западных компаниях или создают собственные стартапы (например, «виртуальный друг» с миллионами пользователей Replica или популярное мобильное приложение для переноса стилей изображений Prisma). Ребята из России также регулярно занимают призовые места в соревнованиях по машинному обучению. Но если в целом смотреть на ландшафт рынка ИИ, то, конечно, Россия здесь практически незаметна. Например, в рейтинге стран по цитируемости статей в области ИИ мы находимся на 42-м месте. Причем проблема здесь не только в деньгах для науки, нужно же еще где-то найти кадры. Привлекать людей из западных компаний в Россию, создавать условия для научных исследований и организации стартапов. Это непростая задача. Китаю удается решить ее за счет того, что зарплаты в этом секторе там сейчас даже чуть выше, чем в Силиконовой долине. Люди возвращаются, потому что для них созданы более комфортные условия. Вероятно, это можно повторить и в нашей стране. Так, для решения этой задачи на Физтехе в этом году создается национальный центр компетенций в области искусственного интеллекта. Этот центр объединит проведение исследований по ИИ и подготовку кадров.

Для России нейросети были бы очень хорошей возможностью выйти на мировой рынок. Во-первых, при производстве ПО не встает вопрос с транспортировкой продукции в любую точку мира. Во-вторых, алгоритмы очень легко модифицировать, чтобы они подходили для любого языка.

Интервью подготовлено в рамках информационного партнерства с Фондом Гайдара, проводившего цикл открытых лекций «Экономика наступившего будущего».

Источник: «Новая газета»