Многие из последних достижений в области искусственного интеллекта, упоминаемых в новостях, так или иначе связаны с искусственными нейронными сетями – большими системами простых элементов, сложным образом взаимодействующих между собой. Эти системы созданы по аналогии с простотой и сложностью нейронов и мозга соответственно. Новые методы построения глубинных сетей со множеством слоев нейронов подходят для решения актуальных проблем или даже превосходят требования, предъявляемые такими разнообразными задачами, как распознавание речи, идентификация изображений и перевод с одного языка на другой. У всякого, кто интересуется искусственным и естественным интеллектом, эти достижения вызывают два вопроса: во‑первых, должны ли все разумные машины иметь сходство с мозгом и, во‑вторых, что мы узнаём о настоящем мозге и разуме, исследуя искусственный мозг и разум?
Когда человек начинает интерпретировать данные, – не важно, выясняет ли он значение слова или пытается понять действия коллеги, – он может пойти по одному из двух неверных путей: оказаться чересчур предвзятым или слишком довериться данным. Ваши предположения введут вас в заблуждение, если вы решите, что слово на новом для вас языке значит то же самое, что и слово с тем же звучанием на языке, который вы знаете, например французское gâteau и испанское gato[1] (что может иметь неприятные последствия и для домашнего животного, и для праздника). Чрезмерное доверие данным подведет вас, если вы решите, что ваша идея очень не понравилась коллеге, тогда как на самом деле он просто на взводе, потому что всю ночь просидел без сна с простудившимся ребенком (а это не имеет к вам вообще никакого отношения).
Компьютеры, пытающиеся интерпретировать входящие данные, чтобы извлечь из них какие‑либо закономерности, сталкиваются с такими же проблемами. Значительная часть исследований в области машинного обучения наталкивается на существенные противоречия между строгостью и гибкостью. Большая строгость означает большую предвзятость, что бывает полезно для вынесения суждений на основе ограниченных объемов данных, но может также приводить к систематическим ошибкам, снижающим эффективность работы. Большая гибкость означает больше возможностей для обнаружения закономерностей, проявляющихся в данных, но также и более высокий риск принятия за паттерны то, что не является таковыми.
В исследованиях по искусственному интеллекту эти противоречия между строгостью и гибкостью проявляются в различиях между видами систем, которые можно использовать для решения различных ресурсоемких задач, таких как распознавание речи, компьютерное зрение и машинный перевод. В течение многих десятилетий системы, которые лучше всего справлялись с такими задачами, тяготели к строгости. Они были результатом тщательного планирования, разработки и совершенствования целыми поколениями инженеров, которые обдумывали особенности речи, образов и синтаксиса и пытались выстроить в систему лучшие из своих предположений насчет того, как следует интерпретировать каждый из отдельных видов данных. Недавние открытия, использующие искусственные нейронные сети, сделаны, напротив, с помощью гибких алгоритмов. Они используют набор принципов, которые в равной степени могут быть применены в множеству различных контекстов, то есть у этих алгоритмов нет предрасположенности к какой‑то конкретной информации, что позволяет системе самостоятельно выяснять, как интерпретировать входные данные.
Искусственные нейронные сети теперь, возможно, лучше справляются с распознаванием речи, изображений и смысла в предложениях, чем системы, разрабатывавшиеся поколениями инженеров, и в этом ключ к их высокой эффективности. Победа гибкости над строгостью – отчасти результат инноваций, которые позволяют нам строить искусственные нейронные сети большего масштаба и быстро их обучать. Но отчасти это также результат увеличения объемов данных, которые можно скормить нейронным сетям. У нас теперь больше записанной речи, больше оцифрованных изображений, больше документов на разных языках, чем когда‑либо прежде, и объем доступных данных меняется так, что в конце концов должно быть достигнуто равновесие между строгостью и гибкостью.
Когда у вас нет большого количества данных, то есть когда вам приходится строить допущения на основе ограниченных сведений, строгость важнее. Под руководством грамотных инженеров компьютерам проще делать разумные предположения. Когда у вас много данных, важнее оказывается гибкость. Здесь вам уже не нужно, чтобы система ограничивалась только теми идеями, которые смогли найти инженеры, если у вас достаточно данных для того, чтобы позволить компьютеру предложить идеи получше. Так что системы машинного обучения, в которых упор сделан на гибкость, как в искусственных нейронных сетях, успешнее всего справляются с задачами, в которых доступны большие объемы данных.
Мысль о том, что наличие большего количества информации способствует большей гибкости, дает ответ на два наших вопроса об искусственном и естественном интеллекте. Мыслящие машины должны иметь сходство с мозгом – в той мере, в которой с ним сходны искусственные нейронные сети, – когда решаемая проблема такова, что гибкость важнее структуры, а данных хватает с избытком. Если же посмотреть на вопрос с другой стороны, то можно заметить, что это полезно для понимания, чем настоящий мозг похож на искусственные нейронные сети, то есть какие аспекты человеческого разума лучше рассматривать как результат алгоритмов общего обучения, где акцент сделан на гибкость, а не на строгость, в противоположность результату, основанному на «встроенных» априорных суждениях о мире и о том, что в нем есть. По существу, ответ будет определяться объемом доступных данных и сложностью того, что надо выяснить.
Значительная часть полемики в области когнитивистики, например о том, как дети учат язык и обретают способность интерпретировать действия других людей, сводится как раз к этим вопросам: о доступных данных и приобретаемом знании. Чтобы ответить на них, мы пытаемся зафиксировать входные данные системы (что дети слышат и видят), описать результат (что такое язык, какое знание лежит в основе социального познания) и исследовать различные виды алгоритмов, которые могли бы обеспечить переход от первого ко второму.
Ответы на эти вопросы относятся не только к пониманию нашего собственного разума. Несмотря на последние достижения в области искусственного интеллекта, человеческие существа все еще остаются лучшим из имеющихся у нас примеров разумных машин. Определив объем и природу априорных суждений, которые формируют наше познание, мы заложим основу для того, чтобы сделать компьютеры более похожими на людей в плане эффективности выполнения определенных задач.
[1] gâteau – сладкий пирог; торт; пирожное (фр.) .– кошка (исп.) .
|