Чем различаются когнитивный и математический подходы к ИИ, как роботы получают знания и почему искусственным системам нужно учиться планированию.
О самых важных открытиях в сфере искусственного интеллекта — специалист в области Computer Science Константин Яковлев.
— Сложилась ли сегодня единая трактовка понятия «искусственный интеллект» (Artificial Intelligence, AI) в научной среде?
— Скорее нет, чем да. Сегодня от представителей разных научных школ, без сомнения компетентных исследователей, можно услышать разные и порой противоречивые определения. Такое разнообразие объясняется в том числе тем, что искусственный интеллект — это междисциплинарная область исследований. Представители разных наук привносят в ее изучение нечто специфическое, связанное с их первоначальными интересами. Математики концентрируются на формальных моделях и методах, специалисты в области компьютерных наук — на алгоритмах и способах их практической реализации, психологи — на вопросах, связанных с феноменом сознания и самосознания, лингвисты — на языковых, коммуникационных аспектах взаимодействия. Соответственно, и определения ИИ у всех получаются разными.
Мне импонирует следующий вариант, данный моим научным руководителем, президентом Российской ассоциации искусственного интеллекта Геннадием Семеновичем Осиповым: «Искусственный интеллект — это научная дисциплина, основной целью которой является получение методов, моделей и программных средств, позволяющих искусственным устройствам реализовывать целеполагание, целенаправленное поведение, разумные рассуждения и обучение».
— А как изменялось понимание термина ИИ с течением времени?
Термин «искусственный интеллект» был введен в научный обиход в 1956 году, когда в Дартмутском колледже прошел первый семинар по ИИ. Его идейным вдохновителем был Джон Маккарти, а в число участников входили Марвин Мински, Натаниэль Рочестер, Клод Шеннон. На семинаре обсуждался круг вопросов на стыке кибернетики, теории автоматов, теории информации.
Вскоре событие стало ежегодным, семинар начал собирать все больше участников и со временем приобрел статус главной международной конференции по ИИ, которая продолжается и в настоящее время под названием IJCAI (International Joint Conference on Artificial Intelligence).
Благодаря регулярному проведению такой конференции естественным образом обеспечивалась (и продолжает обеспечиваться) преемственность идей и традиций: в конференции участвуют родоначальники основных направлений ИИ, которые передают свои знания и опыт новым участникам, те — своим ученикам. Таким образом, можно попытаться отследить эволюцию содержания такой научной дисциплины, как ИИ, по содержанию трудов IJCAI. Я этим специально не занимался, но мне кажется, что всегда в центре внимания был примерно один и тот же круг вопросов, связанных с обучением, рассуждениями, планированием и прочим, но смещались акценты, в том числе из-за того, что те или иные методы решения поставленных задач оказывались более успешными. Сейчас мы видим, что весьма успешны искусственные нейронные сети, поэтому фокус многих исследователей несколько смещается в эту область.
— А каким еще проблемам уделяется наибольшее внимание в настоящее время? С какой стороны следует ждать новых открытий?
Таксономия всех направлений обширна: поиск, машинное обучение, представление знаний, моделирование рассуждений, обработка естественного языка, планирование, робототехника, мультиагентные системы. Достаточно взглянуть на список тематических секций и семинаров в рамках IJCAI, чтобы понять, что их действительно много.
Для выделения проблем достаточно составить облако тегов из ключевых слов докладов упомянутой выше IJCAI. Так мы увидим, что присутствует большой интерес как к тому, что на слуху у миллионов, — обучение, нейросети, — так и к тому, что менее известно обывателям, но всегда составляло соль ИИ, — представление знаний, планирование, эвристический поиск.
При этом важно понимать, что популярность темы среди научных коллективов часто может быть обусловлена прагматическими причинами, а не тем, что в этой области в ближайшее время ожидаются большие прорывы и открытия. Просто в какой-то области существует сильная академическая традиция, есть большое сообщество исследователей, при этом постоянно происходит подпитка за счет молодого поколения — аспирантов и студентов.
Среди наиболее освещаемых тем обязательно присутствуют традиционные, например представление знаний (knowledge representation) или планирование (planning). Но в последние годы, конечно, появляется все больше докладов по машинному обучению и нейросетям. Развитие нейронных сетей происходит во многом благодаря увеличению компьютерных мощностей, адаптации архитектуры вычислений к алгоритмам обучения, благодаря доступности огромных массивов накопленных данных. То есть наблюдается экстенсивный рост. При этом на теоретическом уровне критическая масса научных идей, обеспечивающих сегодняшнюю работоспособность нейросетей, была предложена уже давно. Сейчас эти идеи находят дальнейшее развитие, но основа была заложена еще в прошлом столетии.
Я не готов сделать ставку на какое-то отдельное направление в рамках ИИ, которое перевернет научный мир (ключевое слово — научный). Скорее всего, будет, как и раньше, наблюдаться постепенный, эволюционный рост во всех направлениях. Какие-то направления будут замедляться в развитии, какие-то ускоряться, и это естественный процесс.
— Каковы современные взгляды ученых на систему представления знаний у ИИ-cистем?
— Представление знаний — одна из традиционных сфер исследований. Она сформировалась на ранних стадиях развития ИИ, в 1950–1960-х годах. Уже тогда было ясно, что недостаточно владеть большим объемом данных — нужны способы их трансформации в знания, которые можно формализовать, накопить и передать.
Для современных интеллектуальных систем переход от данных к знаниям — это все еще непростая задача, но вместе с тем очень важная. Рассмотрим простой пример. Предположим, ребенок забыл взять в школу портфель, но у него есть персональный робот-помощник, который должен принести забытые книжки. Для этого роботу нужно составить план действий: сложить книги в портфель, взять его с собой и принести в школу. Важно, что робот должен обладать знанием о том, что, когда он перемещает портфель из точки А в точку Б, все, что лежит в портфеле, тоже перемещается вместе с ним. Для человека это очевидно, а для робота отсутствие этого знания равносильно невыполнению задачи.
Получить знание робот может различными способами, например при помощи методов машинного обучения. Но способность формализовать, то есть объяснить знание и передать его, — задача посложнее. Современные нейронные сети пока не очень хорошо с этим справляются: они помогают роботам учиться, но далеко не всегда способны объяснить, почему результат именно таков. Почему, когда перемещаем портфель, перемещается его содержимое?
Способам представления и хранения знаний, методам использования полученных моделей в различных системах посвящены такие разделы ИИ, как knowledge representation и reasoning(представление знаний и автоматизация рассуждений). При этом можно условно выделить два различных подхода к представлению знаний: логический и психологический.
В первом случае активно используется аппарат математической логики. Здесь идет ставка на строгий формализм, математическую точность и аккуратность. Полученные результаты понятны техническим специалистам, в частности программистам, что облегчает практическую апробацию идей.
Второй подход более гуманитарный, здесь первую скрипку играют когнитивные психологи. Для них ценность модели не в том, что она строга, точна и потенциально легко реализуема, а в том, что она, по их мнению, описывает (может быть, даже неформально) когнитивные процессы, связанные с трансформацией данных в знания.
Очевидно, что для существенного прогресса в области knowledge representation and reasoningнеобходима интеграция указанных подходов, но это не так просто. Сторонники разных подходов зачастую не понимают друг друга. Мы в лаборатории активно пытаемся это поле вспахать: у нас есть несколько проектов по когнитивному моделированию, в которых участвуют как «математики», так и «психологи».
— В развитии и совершенствовании ИИ больших успехов ждут от когнитивистского или математического подхода?
— Я думаю, наибольших успехов удастся достигнуть за счет интеграции этих подходов. Мне как специалисту с математическим бэкграундом более понятны и симпатичны математические методы. Их использование почти всегда гарантирует возможность воспроизведения и верификации результатов. Но цена, которую приходится за это платить, высока: узость исследуемых задач. Все должно быть описано и разложено по полочкам. Это то, что называется слабый ИИ.
Условные психологи больше тяготеют к общим задачам, к тому, что называется Artificial General Intelligence (сильный ИИ). Они смотрят широко, поэтому предлагаемые решения зачастую кажутся математикам слишком абстрактными. Эти решения плохо подходят для наиболее распространенных специализированных задач. Это как забивать гвозди огромной кувалдой: можно, но молотком эффективнее. При этом успешных прецедентов решения общих задач мы пока не наблюдаем. Но популярность AGI растет, соответственно возрастает и доля специалистов различного профиля, вовлеченных в исследования по этой тематике. Не исключено, что нарастающая популярность AGI выльется во что-то значимое.
Если говорить о моих предпочтениях в области AGI, то мне весьма интересными кажутся исследования в области построения биоинспирированных когнитивных архитектур (BICA). Центральный вопрос при разработке таких архитектур — это представление знаний. Также изучаются способы трансформации сырых сенсорных данных в образы, механизмы накопления данных (память), трансформации данных в знания, оперирования этими знаниями, в том числе для целеполагания. И все это на базе последних достижений в области нейрофизиологии и когнитивной психологии (и, естественно, компьютерных наук).
Те, кто пытается создавать такие архитектуры, черпают вдохновение в живой природе и устройстве нервной системы человека, его сознания. Когнитивный характер таких исследований означает, что нужно не просто воспроизводить в искусственных системах мозговые процессы человека на уровне нейронной активности — нужно попытаться понять, как происходит переход от нейронных импульсов к высшей нервной деятельности — к рождению смыслов, их формализации и представлению.
— Если вернуться к классическим направлениям ИИ, то что еще можно отметить, помимо представления знаний и моделирования рассуждений?
— Например, вопросы планирования. Это обширное направление в рамках ИИ, которое имеет долгую историю развития. Оно зародилось почти вместе с ИИ. Суть так называемого классического ИИ-планирования (automated planning) заключается в необходимости выстроить определенную цепочку действий, которая приведет интеллектуальную систему (например, персонального робота-помощника) из текущего состояния в желаемое.
Планирование тесно связано с упомянутым выше представлением знаний, потому что действия — это фактически процедурные знания системы об окружающем мире. Эти знания должны быть как-то формализованы. Именно из-за необходимости строгой формализации столь популярные в настоящее время нейросетевые подходы пока плохо справляются с решением классических задач планирования. Мы наблюдаем много попыток подступиться к вопросам планирования действий или перемещений с помощью аппарата искусственных нейронных сетей, но разрабатываемые методы пока серьезно уступают классическим алгоритмам. Вполне возможно, что нужно просто поменять задачу, переформулировать ее, чтобы она лучше подходила под нейросетевую парадигму.
Пока задачи планирования в имеющейся постановке наиболее успешно решаются методами, основанными на явной формализации знаний. При этом в основе методов лежит информированный перебор. То есть мы пытаемся использовать некоторые очевидные закономерности, чтобы сократить пространство поиска. Это называется эвристический поиск. Эвристика — это правило, которое формализует «здравый смысл», мы за счет этого отсекаем рассмотрение многих ненужных вариантов. Так, если нам нужно забить гвоздь, то не имеет смысла рассуждать о действиях, которые мы можем сделать с отверткой. При решении некоторых задач подобные эвристики могут быть весьма изощренными, а их получение (в автоматическом режиме) — отдельный вопрос.
— Каковы наиболее важные открытия в сфере ИИ в последние годы?
— Вокруг темы AI сегодня огромный ажиотаж, но нельзя сказать, что мы регулярно сталкиваемся с великими прорывами, как нас в этом пытаются убедить некоторые СМИ. Я говорю о прорывах на уровне научных идей. Их могут идентифицировать только ученые, а не массовые пользователи. Ведь для массового пользователя применение известных методов для решения известных задач, но на новых данных уже, зачастую расценивается как прорыв. Это правильно с пользовательской точки зрения, но серьезные, значимые с научной точки зрения прорывы случаются не так часто. Поэтому в ближайшие несколько лет мы, на мой взгляд, не увидим революций, а продолжим эволюционный путь.
Проиллюстрирую тезис на личном примере. Мы в лаборатории занимаемся в том числе исследованием систем планирования траектории для групп мобильных роботов. Это сложная задача, которую невозможно решить без введения большого числа ограничений и допущений. Так, раньше эту задачу решали в упрощенном виде, программируя роботов на движение только под прямым углом. В этом случае достаточно просто рассчитать конфликтные интервалы во времени и реализовать механизм задержек, с помощью которого этих конфликтов можно избегать.
Есть популярное YouTube-видео, в котором роботы сортируют посылки на китайской фабрике. Они перемещаются по спланированным траекториям, ориентируясь по квадратным меткам на полу, и меняют направление движения только на 90 градусов. Нам удалось разработать новый метод, который позволяет планировать неконфликтные траектории для сотен роботов и при этом менять направление движения в узловых точках в любом направлении. Это сокращает общее время пробега до 20%. Для нашей отрасли это весьма значимый результат. Но вряд ли стоит его рассматривать как серьезный прорыв в области ИИ. Это всего лишь продолжение развития уже существующих идей.
Если смотреть на ситуацию в целом, то получается, что в рамках каждого направления исследований есть набор устоявшихся проблем. По каждому направлению ведется целый пласт специализированных исследований, собираются отдельные конференции и семинары. Результатом является улучшение отдельных методов. Поскольку таких методов и направлений в ИИ очень много, то рано или поздно мы увидим кумулятивный эффект (как это произошло с нейросетями). Конечно, всегда могут возникнуть какие-то непредвиденные факторы, которые повлияют сразу на весь ход событий, повернут исследования в другое русло, но мне почему-то кажется, что вряд ли стоит ожидать крутых поворотов в ближайшие годы.