выживание. Если запрограммировать эти изначальные рефлексы и обеспечить машине возможность обучения, то, быть может, окажется возможным решить проблему распознавания контекстов; необходимо, однако, оговориться, что в настоящее время этот подход в "искусственном интеллекте" совершенно не разрабатывается*. Искусственный интеллект, как его сейчас определяют Ё.Фейгенбзум, Г.Саймон, М.Минский, Дж-Вейценбаум и др., фактически представляет собой попытку построения полностью сформированного интеллекта взрослого человека - нечто вроде Афины Паллады, в полном вооружении появившейся из головы Зевса. Из сказанного выше, однако, не следует, что предложенное решение позволит снять исходную дилемму. Остается неясным, каким образом ребенок проходит путь развития от неизменных реакций, вызываемых фиксированными особенностями окружающей среды, до определения смысла в терминах контекста, что, по признанию даже исследователей в области ИИ, характеризует поведение взрослого человека.
Как только ребенок научается определять значения в терминах ситуаций, он приобретает способность так преобразовывать ситуации, с которыми он сталкивался в прошлом, чтобы они отвечали текущему положению; однако первоначальный переход от неизменных реакций к реакциям гибким, основанным на учете смысла ситуаций, по-прежнему остается неясным. Одно из двух: либо этот переход следует понимать как непрекращающуюся модификацию предшествующих ситуаций (и тогда из сказанного нами выше понятно, что именно в этом случае подлежит объяснению), либо так называемый глобальный контекст должен распознаваться в терминах фиксированных, независящих от контекста признаков, и тогда мы не столько решаем проблему, сколько
* По-видимому, единственное исключение представляет отчет Т. Джоунса "Машинная модель простых форм обучения" (Th. L.Jones. A Computer Model of Simple Forms of Learning).Т.Джоунс следующим образом описывает свою программу:
"INSIML представляет собой программу, написанную на языке ЛИСП, моделирующую простые формы обучения ребенка в первые недели его жизни, такие, как сосание пальца или элементарная координация рук и глаз.
Программа работает по принципу обнаружения причинно-следственных связей и упорядочения их в виде дерева целей. Если, например, явление вызывает явление В и программе требуется получить 5, то А будет выделено в качестве подцели; в таком обратном направлении анализ будет производиться до тех пор, пока программа не встретит подцель, которая может быть реализована непосредственно, то есть путем реализации мышечного усилия".
Эта работа находится в самом начале, поэтому трудно дать ей какую-либо оценку. Если это исследование - не случайное явление, а отражает определенную тенденцию, то можно ожидать существенного сдвига в целях и методах "искусственного интеллекта".
187игнорируем ее. С одной стороны, ребенок или машина в состоянии производить отбор релевантных фактов, приписывать всем подобным фактам их обычные значения и вместе с тем, в случае необходимости, прорывать границы их обычных значений в нужном направлении. В этом случае ни про какую совокупность фиксированных характеристик, даже ту, которую в состоянии воспринять ребенок, нельзя сказать, что она имеет фиксированное значение, в терминах которого начинается весь этот процесс. С другой стороны, если все, что нам нужно,- это фиксированные характеристики, тогда нам придется отказаться, как от иллюзорной, от той гибкости, которую мы так старались объяснить. По всей видимости, не существует ни способа проникновения внутрь ситуации, ни способа распознавания ее извне.
Тем не менее, как все мы знаем, способность к обобщению и гибкому оперированию со значениями постепенно развивается в процессе обучения и вся наша проблематика погружается в проблему обучения. Создается впечатление, что либо развитие ребенка заключается в том, что он в каждый момент времени приобретает все более сложные неизменные реакции, либо что он с самого начала способен интерпретировать конкретные факты в терминах общего контекста, развивая и все более тонко структурируя чувство ситуации. Если в применении к взрослому человеку мы откажемся от анализа в терминах фиксированных реакций, считая, что в этом случае подобный подход не применим, то мы вновь столкнемся с временной версией исходной антиномии. Одно из двух: либо должен существовать самый первый контекст- контекст, который машина не в силах распознать из-за отсутствия предыдущего контекста, в терминах которого происходит выделение существенных характеристик данного контекста; либо возникнет редукция контекстов во времени, уходящая в сколь угодно отдаленное прошлое, и тогда машина окажется не в состоянии начать процесс распознавания.
Как говорил И.Кант, для того чтобы разрешить антиномию, нужно отказаться от предположения, что две рассматриваемые альтернативы являются единственно возможными. Но для тех, кто занят построением искусственного разума, возможны только эти альтернативы*. Однако, коль скоро люди пользуются языком и понимают друг друга, должна существовать еще одна альтернатива. Должен существовать некоторый способ обхода внутренне противоречивой редукции контекстов или маловразумительного понятия распознавания изначального контекста, -способ, который в
* За исключением альтернативы, предполагающей существование таких фактов, которые имеют не зависящие от контекста фиксированные значения, альтернативы, которую, как мы видели, такие исследователи проблемы "искусственного интеллекта", как Дж. Вейценбаум, молчаливо исключают из рассмотрения.
188настоящее время только представляется возможным для придания значения независимым нейтральным фактам. Единственным выходом из этого положения является, по-видимому, отказ от разграничения фактов и ситуаций, к чему, как мы видели, и был вынужден прибегнуть Дж.Вейценбаум, учитывавший последовательный характер функционирования цифровых машин. Общеизвестно, что человек не в состоянии исключить из рассмотрения ситуацию, отдав предпочтение фактам, релевантность и значимость которых фиксированы независимо от контекста; единственная имеющаяся возможность сохранения неразрывной связи фактов и ситуаций заключена в отказе от тезиса о независимости фактов и в попытке трактовать их как продукт соответствующих ситуаций. Для обоснования этого положения следует показать, что о существовании фактов вообще можно говорить лишь в категориях их релевантности данной ситуации. Тогда проблема распознавания ситуаций извне отпадет вообще, ибо для того, чтобы интеллект мог интерпретировать какие-либо факты, он должен находиться "внутри" некоторой ситуации.
В части Ш мы покажем, каким образом возможна реализация этой альтернативы и как она связана с человеческой жизнью вообще. Только после этого станет понятным, почему вариант с фиксированными характеристиками является неосуществимым с эмпирической точки зрения, а также почему невозможно запрограммировать формы человеческой жизни.ЗАКЛЮЧЕНИЕ
В нашем анализе всех четырех допущений, лежащих в основе оптимистической интерпретации результатов, достигнутых в области "искусственного интеллекта", мы каждый раз сталкивались с одним и тем же ходом событий. Каждое допущение принимается как нечто само собой разумеющееся, то есть как аксиома, редко отчетливо формулируемая и никогда не подвергающаяся сомнению. На деле же рассматриваемое допущение оказывается отнюдь не единственно возможной и, вообще говоря, весьма спорной гипотезой. Биологическое допущение, предполагающее, что функционирование мозга подобно работе цифровой вычислительной машины, в наши дни уже не соответствует имеющимся данным. Три другие допущения приводят к затруднениям концептуального порядка.
Психологическое допущение, согласно которому разум руководствуется некоторой эвристической программой, не выдерживает критики с эмпирических позиций, априорная же аргументация в его пользу оказывается несостоятельной в связи с неудачей попыток изучения логически допустимого уровня рассмотрения, промежуточного между физическим и феноменологическим уровнями. Это не доказывает, что задача, стоящая перед исследователями проблематики моделирования процессов познания, безнадежна- Однако без поддержки психологической аксиомы исчезает единственный аргумент, дающий хоть какие-нибудь основания надеяться на успех в данной области. Если бы удалось доказать, что переработка информации необходимо осуществляется по эвристическим правилам, то перед специалистами, работающими в области моделирования процессов познания, возникла бы реальная задача отыскания этих правил. А без опоры на эту аксиому все трудности, связанные с разработкой проблематики моделирования процессов познания, выявившиеся за последние десять лет, приобретают новый смысл; мы просто не имеем права игнорировать всевозрастающую массу эмпирических данных, свидетельствующих о том, что процессы переработки информации человеком и машиной протекают совершенно по-разному.
Исследователи, работающие в сфере ИИ (и принявшие эстафету от направления моделирования процесса познания, точно так
190же, как М,Минский принял эстафету от Г.Саймона), разработали программы, позволяющие цифровой машине получать, используя логические операции, результаты, приближающиеся к тем, которые человек, по-видимому, достигает, не решая, а обходя трудности, неразрывно связанные с формализацией. Но ведь формализация ограниченного контекста представляет собой "решение" ad hoc; при этом проблема формализации всего массива человеческих знаний, необходимых для разумного поведения, остается нетронутой. Эта фундаментальная трудность скрыта за гносеологическим и онтологическим допущениями, согласно которым все человеческое поведение необходимо допускает анализ в терминах правил, связывающих между собой атомарные факты.
Однако концептуальные трудности, связанные с этими допущениями, оказываются еще более серьезными, чем трудности, вытекающие из психологического допущения. Неизбежное использование обоих допущений в качестве основополагающего принципа теории, объясняющей практическую деятельность человека, приводит к "регрессу в бесконечность": к введению все более и более специфических правил - правил применения правил - или все более и более общих контекстов, необходимых для контекстуального распознавания. В свете этих противоречий разумно предположить, что на информационном уровне, в отличие от уровня физических законов, мы не можем представить поведение человека в терминах, подчиняющихся правилам манипуляций над некоторым множеством элементов. А поскольку теоретики "искусственного интеллекта" не выдвигают никаких аргументов для доказательства того, что человеческое поведение должно быть воспроизводимым на цифровой машине, оперирующей детерминированными "квантами" информации по строгим правилам, у нас, по всей видимости, есть вполне веские философские основания отказаться от этих допущений.
Если мы действительно перестанем опираться на эти четыре допущения, то накопившиеся к настоящему времени эмпирические данные приобретут иное значение. Тот факт, что можно найти такие поисковые эвристики, которые позволят машине использовать свое быстродействие и точность операций для того, чтобы проникнуть в сферы поведения человека, в которых тот применяет более утонченные методы, уже не будет столь очевидным. При отсутствии каких бы то ни было априорных оснований для уверенности в такой возможности мы можем опираться только на уже достигнутые результаты. Хотя ранние успехи в этой области исследования показали возможность применения в ней грубых "силовых" методов, однако те трудности, которые на сегодняшний день имеются в программировании игр, машинном переводе, решении задач и распознавании образов, указывают на существование предела нашей способности заменять
191один тип "обработки информации" другим- Только опытным путем можно установить, в какой степени новые, более быстродействующие машины, более совершенные языки программирования и более хитроумные эвристики позволят нам отодвинуть этот предел. Но неуклонный спад, наблюдаемый в рассмотренных нами областях, и несостоятельность всех ранее сделанных по этому поводу прогнозов наводят на мысль, что этот предел, по-видимому, не очень далек. Если не принимать на веру эти четыре допущения, то существующий застой, скорее, дает основание для пессимизма.
Разумеется, все это чревато серьезными последствиями для нашей философской традиции. Если затруднения, с которыми сталкиваются все без исключения исследования в области "искусственного интеллекта", расценивать как неудачи, то они должны интерпретироваться как эмпирические свидетельства, говорящие о несостоятельности психологического, эпистемологического и онтологического допущений. Говоря словами М.Хайдеггера, если западная метафизика достигла в кибернетике своей высшей точки, то возникшие за последнее время трудности в разработке проблем "искусственного интеллекта" отражают не столько недостаточное развитие нашей технологии, сколько, пожалуй, указывают на принципиальные границы ее возможностей.
192
Часть III
АЛЬТЕРНАТИВЫ К ТРАДИЦИОННЫМ ВОЗЗРЕНИЯМВВЕДЕНИЕ
Общей чертой психологического, эпистемологического и онтологического допущений является взгляд на человека как на устройство, действующее на основе определенных правил организации данных, имеющих вид атомарных фактов. Эта идея была вынесена на поверхность в результате слияния двух мощных потоков; у истоков одного из них стоит философская концепция Платона, другой был вызван появлением современных электронных цифровых вычислительных машин, Платон сводил всякое рассуждение к четким правилам, а мир - к атомарным фактам, к которым, по его мнению, единственно возможно применять эти правила, не опасаясь противоречий в их интерпретации, В свою очередь изобретение цифровой вычислительной машины явилось итогом работ по созданию устройства общего назначения для обработки информации, которое производит вычислении по точным правилам и воспринимает данные лишь в виде атомарных элементов, логически друг от друга не зависящих. Случись подобное открытие в рамках какой-либо иной культуры, вполне возможно, что создание цифровых машин не воспринималось бы как многообещающая модель "искусственного разума"; однако на почве нашей культурной традиции вычислительная машина представляется подлинной парадигмой логического мышления, которой не хватает только некоторой совершенной программы, чтобы сравняться с человеком в его отличительном свойстве - рациональности, разумности.
В результате этого взаимодействия двухтысячелетней культурной традиции и ее продукта - самого мощного устройства из всех когда-либо изобретенных человеком - возник толчок такой силы, что его нельзя не только затормозить или направить в другом направлении, но даже полностью осознать. Самое большее, на что можно надеяться,- это на понимание того факта, что, даже если эта линия развития неизбежна, она не единственно возможна; кроме того, предположения, лежащие в основе тезиса о возможности "искусственного интеллекта", есть всего лишь предположения, а не аксиомы. Короче говоря, может существовать иной подход к пониманию человеческого разума, который объяс-
195нит нам как то, почему "машинная установка" столь сильна и живуча, так и то, почему она неизбежно должна "сойти со сцены". Развитие подобного альтернативного подхода связано с многими трудностями, и самая серьезная из них состоит в том, что его невозможно представить в форме естественнонаучного объяснения. Мы уже видели, что смысл процедуры, считающейся "полным описанием" или объяснением, предопределяется той самой традицией, для которой мы ищем альтернативу. Последняя определяет следующую точку зрения: невозможно понять такой способности человека, как владение естественным языком, до тех пер пока не найдена теория - или формальная система правил -для описания соответствующей компетенции. Нельзя понять поведения человека, в частности языкового его аспекта (применения языка в общении) , до тех пор пока поведение не выражено в терминах однозначных и точно определенных реакций на точно определенные объекты в универсальным образом заданных ситуациях. Западная мысль и оказалась во власти такого рода взглядов на объяснение человеческого поведения. Эти взгляды были теоретическим отражением сложившейся практики, при которой человек рассматривался как устройство или объект, реагирующий на воздействия со стороны других объектов согласно универсальным законам или
Но именно подобные теоретические представления - представления, прошедшие двухтысячелетний путь развития и совершенствования,- ныне стали в такой степени проблематичными, что от них вынуждены отказываться как англо-американские, так и континентально европейские философские направления. Именно эти представления привели к тому, что специалисты, разрабатывающие проблематику "искусственного интеллекта", натолкнулись на каменную стену. Неудачи в данном случае касаются не конкретного подхода к объяснению - нет, крушение потерпела вся концептуальная схема, строящаяся на той предпосылке, что объяснение человеческого поведения может и должно быть выражено в рамках идущей от Платона схемы, которая оказалась столь успешной в применении к естественным наукам; что ситуации, с которыми сталкивается человек, можно трактовать подобно физическим состояниям; что мир человека допустимо трактовать так же, как Вселенную, изучаемую в физике. Коль скоро эта схема оказывается несостоятельной, то, пытаясь предложить альтернативный подход, мы должны пойти по пути объяснения совершенно другого рода, то есть дать совершенно иной ответ на вопрос: "Каким образом человек осуществляет разумное поведение?"; или даже сам вопрос должен в этом случае звучать иначе, ибо выражение "человек осуществляет" (а не просто "проявляет") несет на себе печать традиционного подхода. Ибо любая вещь должна быть как-то осуществлена; если же вещь
196нельзя произвести каким-то определенным способом, то для объяснения ее появления приходится обращаться к магии.
Ответ на этот вопрос не предполагает предварительного нахождения управляемых правилами точных отношений между точно определенными объектами. Этот ответ будет иметь форму феноменологического описания рассматриваемого типа поведения. Такое описание позволит нам понять также, можно ли ставить задачу нахождения общих характеристик поведения такого, например, типа, как восприятие стола или дома или вообще процессы перцепции, решения задач, применения языка и т. д. Подобное описание вполне можно назвать объяснением, если пойти еще дальше и попытаться найти фундаментальные отличительные черты человеческой деятельности, которые представляют собой необходимые и достаточные условия любых форм человеческого поведения.
Такого рода объяснение - дань методу Аристотеля, но без привлечения его рассмотрений и аргументации. Б отличие от Платона, который имел в виду критерии поведения в виде правил, Аристотель пытался описать общую структуру восприятия и суждения. Но как свидетельствует его представление о том, что действия людей основываются на практически применяемых силлогизмах, он все же смотрел на человека как на вычислимое и вычисляющее устройство - рассуждающее животное, В результате его фактический подход представлял собой лишь еще один шаг в русле описанной выше философской традиции - традиции, которая в конечном счете вела к разделению разумного и животного начал в человеке и попыткам моделирования его способности к рассуждению, исходя из нее самой.
И лишь недавно, когда наконец в полной мере стали очевидными все следствия, которые вытекают из представления о человеке как об "устройстве" или "объекте", в философии началась разработка нового подхода. Пионерами в этой области выступили М.Хайдеггер и Л.Витгенштейн77.
С тех пор аналогичные идеи каждый по-своему собирали, развивали и применяли ряд других философов, в частности М.Мерло-Понти и М.Поляный. В настоящее время их исследования продолжают молодые философы, такие, как Ч.Тэйлор и С.Тоудс. В своих попытках разработки альтернативной точки зрен.я, основанной на сопоставлэнии трех основных допущений традиционней мысли с феноменологическим описанием структуры человеческого поведения, я буду опираться преимущественно на работы упомянутых выше исследователей,
R полностью, отдаю себе отчет в том, что предлагаемая "тяжбэ" с традицией носит более туманный характер и означает нечто менее подтвержденное экспериментом, чем любой бихевиоризм или ментализм, на вытеснение которых он направлен. Но
197нельзя позволить до такой степени увлечься формализуемыми аспектами предмета, чтобы забыть о тех серьезных вопросах, которые первоначально собственно и дали толчок соответствующим исследованиям; нельзя во что бы то ни стало стремиться к все новым экспериментальным результатам, используя старые методы, которые, хотя и "работают", тем не менее уже давно не ведут к новым открытиям или идеям- Одним из немногих ученых, работающих в области наук о человеке и осознавших эту опасность, является Н.Хомский. Вот его слова:
"Не желая возвеличивать культ благовоспитанного дилетантизма, мы должны тем не менее признать, что классические споры обладают свежестью и значимостью, которых, возможно, недостает в исследовательской области, определяемой скорее применимостью некоторых инструментов и методов, нежели проблемами, которые представляют интерес сами по себе.
Поучительный вывод состоит не в том, чтобы отказываться от полезных инструментов; скорее, он состоит в том, что, во-первых, мы не должны терять перспективу, чтобы вовремя заметить неизбежное наступление того дня, когда исследование, которое может быть проведено с помощью этих инструментов, уже больше не является существенным; и, во-вторых, что мы должны ценить идеи и проницательные наблюдения, которые прямо относятся к нашей теме, хотя, возможно, и являются преждевременными, неопределенными и неспособными дзть толчок развернутым исследованиям на конкретной ступени развития методики научных представлений
Запомним этот совет и обратимся к рассмотрению трех факторов, которые обходятся специалистами, работающими в области моделирования процессов познания и "искусственного интеллекта", но которые, на наш взгляд, составляют основу всякого разумного поведения: роли тела в организации и интеграции нашего опыта; роли ситуации как основы для такого упорядочения поведения, которое не предполагает использования каких-либо правил; и, наконец, роли человеческих целей и потребностей в процессе организации ситуаций, с тем чтобы производить распознавание объектов как релевантных и приемлемых.
198 Глава 7. ТЕЛЕСНАЯ ОРГАНИЗАЦИЯ ЧЕЛОВЕКА
И РАЗУМНОЕ ПОВЕДЕНИЕ
Психологическое и эпистемологическое допущения, утверждающие формализуемость человеческого поведения с помощью эвристических программ для цифровой машины, с неизбежностью привели к разработке такой теории разумного поведения, в которой совершенно игнорируется тот факт, что у человека есть тело, поскольку на данном этапе развития вычислительной техники говорить о "теле цифровой машины" не приходится. Полагая, что без тела можно обойтись, сторонники этой теории и на сей раз следуют традиции, которая, начиная с Платона и кончая Декартом, представляла себе тело как простое вместилище интеллекта и мышления, а не как необходимое для них условие, Но коль скоро выяснится, что тело совершенно необходимо для разумного поведения человека, естественно, возникнет вопрос; можно ли его промоделировать с помощью эвристической программы для вычислительной машины? Если ответ на этот вопрос окажется отрицательным, то надежды на создание искусственного интеллекта с самого начала обречены на крушение. Именно выяснением этого вопроса мы сейчас и займемся.
Р. Декарт - первый мыслитель, оценивший возможности роботов, - первым же осознал и ограниченность их возможностей. В "Рассуждении о методе" он замечает:
"Хотя бы такие машины выполняли много вещей так же хорошо или, может быть, даже лучше, чем кто-либо из нас, они неизбежно не могли бы выполнить ряд других.,. Ибо, в то время как разум является орудием универсальным, которое может служить при всякого рода обстоятельствах, эти органы нуждаются в некотором особом расположении дли выполнения каждого особого действия. Отсюда явствует, что морально [то есть практически^. - Х.Д.] невозможно иметь достаточно органов в одной машине, чтобы они заставляли ее действовать во всех обстоятельствах жизни таким же образом, как нам позволяет действовать наш разум" .
Таким образом, не сознавая различия между ситуацией и физическим состоянием, Р.Декарт тем не менее понимал, что мозг может охватить сколь угодно большое количество ситуаций, тогда
Р.Д е к а р т. Рассуждение о методе. - В кн.: Р.Д екэрт, Избранные
произведения. М., 1950, с. 301,
199как машина имеет лишь ограниченный набор состояний и потому неизбежно проявит свою неспособность к соответствующим реакциям. Декарт полагал, что такая присущая любому механизму ограниченность делает необходимым постулат о существовании нематериальной души.
Этот любопытный аргумент или какая-либо его модификация в некоторой степени, быть может, и справедлива, тем не менее убедительность этого довода основывается на предположении, что робот может иметь лишь сравнительно небольшое число состояний. Однако если говорить о современной вычислительной машине, то число возможных ее состояний составляет порядок 101010; в этом случае не ясно, сохраняет ли свою силу аргументация Декарта. Ибо такая машина, по крайней мере в принципе, могла бы реагировать в некотором смысле на неограниченно большое число ситуаций, и если исходить из позиций Декарта, то ее нельзя было бы отличить от человека, что, несомненно, подрывает самое основу его рассуждения, состоящую в том, что разумное поведение возможно только в том случае, когда реализующий его механизм каким-то образом связан с нематериальной душой. Но тут можно выдвинуть новый аргумент, до некоторой степени противоположный соображению Декарта: "мозг в колбе" - цифровая машина-не в состоянии должным образом реагировать на все новые и новые ситуации еще и потому, что сама способность находиться в некоторой ситуации, быть может, зависит не столько от гибкости нашей нервной системы, сколько от нашей способности к практической деятельности. После ряда попыток программирования подобного устройства можно признать, что наше отличие от машины вне зависимости от сложности ее конструкции связано отнюдь не с обособленной, универсальной, нематериальной душой, а со сложно организованным материальным телом, находящимся в самодвижении.
В сомом деле, именно "телесный аспект" разумного поведения явился основным препятствием для тех, кто работает над созданием искусственного интеллекте. Г.Саймон, который в свое время был лишь несколько обескуражен неудачами этого направления в последнее десятилетие, теперь считает, что «не более чем через 20 лет машины смогут выполнять ту же работу, которая под силу человеку»*; тем не менее он допускает, что "автоматизация гибкой центральной нервной системы произойдет гораздо раньше, чем автоматизация более гибкой сенсорной и "манипулятивной", или двигательной, систем"**. Но что если работа центральной нервной системы зависит от функций двигательной системы, или,
* Н. S i m о п. The Shape of Automation for Men and Management, N.Y.,
Harper and Row, 1965, p. 96.
** Ibid, p. 40.
200выражаясь в феноменологических терминах, что если "высшие" четко определенные, обособленные, логические формы интеллекта с необходимостью выводятся из весьма сложных и более общих "низших" его форм и даже управляются этими последними? В этом случае оптимизм Саймона, основанный на трех допущениях, лежащих в основе работ по "искусственному интеллекту', а также на философской традиции, окажется неоправданным.
Неподатливость "низших" функций уже вызвала определенную ироническую реакцию. Применение вычислительной техники оказалось наиболее успешным при моделировании так называемых рациональных функций -тех, которые некогда считались уникальной особенностью человека. Вычислительные машины блестяще справляются с абстрактными языками и логическими отношениями. Как выяснилось, именно форма психики, роднящая нас с животным миром, в частности распознавание образов (наряду с использованием языка, которое и на самом деле может считаться уникальной способностью человека), не поддается машинному моделированию.
Рассмотрим критически две взаимосвязанные области, в рамках которых исследования по "искусственному интеллекту" не оправдали первоначальных ожиданий: игру (например, шахматы) и распознавание образов. До сих пор я пытался объяснять существующие неудачи невозможностью формализации самых задач, а также тем, что неформальные процессы "переработки информации", обязательно имеющие место и в том и в другом случае, выделяются в особую область. Теперь я попытаюсь показать, что неформализуемые процессы обработки информации, о которых здесь идет речь, возможны только для существ, наделенных телом.
Для того чтобы убедиться в этом, перейдем к более подробному рассмотрению проблемы распознания образов. С помощью понятий, заимствованных из феноменологии79, я попытаюсь показать, что распознавание образов требует определенного рода предвидения, носящего недетерминированный и общий характер.
Эта установка или предвидение присуще нашему телу как "машине", состоящей из нервов и мускулов, функцию которой может изучать анатом. Вместе с тем мы постоянно ощущаем свое тело, наделанное способностью движения и манипулирования объектами внешнего мира. Я намерен привести доводы в пользу того, что и в том, и в другом случае тело человека нельзя воспроизвести с помощью эвристической программы для цифровой машины (даже если машина будет передвигаться и иметь органы-манипуляторы) и что, следовательно, благодаря нашей телесной организации мы можем решать задачи, лежащие за пределами способностей любого эвристически запрограммированного робота.
201Как мы видели, ограниченная применимость программ по распознаванию образов наводит на мысль, что процесс распознавания происходит каким-то иным способом, нежели поиск на основе списка признаков. В самом деле, как указывают представители направлений феноменологии и гештальтпсихологии, распознавание человеком обычных пространственных или временных объектов совсем не похоже на просматривание списка четко различимых "нейтральных" и специфических характеристик80. Например, при распознавании мелодии ноты приобретают свое значение, если их воспринимать как часть мелодии, а не наоборот, поскольку мелодия распознается не путем узнавания отдельных нот. Аналогично при восприятии объектов не существует нейтральных в отношении объекта отличительных признаков. Один и тот же слегка заметный налет на яблоке может показаться мне пылью, если я считаю, что яблоко из воска, и влагой, - если я смотрю на настоящее яблоко. Стало быть, само значение деталей и даже данный мне их внешний вид определяются моим восприятием предмета как целого.
Распознавание разговорной речи наиболее ярко демонстрирует этот "ситуационно-глобальный" характер нашего опыта. Время от времени некоторые исследователи, в частности Ф.Розенблат, смело предсказывали создание механического секретаря, которому можно будет диктовать (или с которым окажется возможным говорить); соответствующая программа будет преобразовывать звуки в слова, и машина будет выдавать текст на печать. В действительности же никто не знает, как приступить к созданию столь гибкого устройства, и дальнейший прогресс в этой области вряд ли возможен, поскольку ход исследований показал, что одно и то же физическое сочетание звуковых волн слышится как совершенно разные фонемы в зависимости от ожидаемого значения.
А.Эттингер уделил этой проблеме большое внимание. Данный им анализ проблем распознавания речи стоит привести подробно, во-первых, потому что проблема распознавания образов достаточно важна сама по себе и, во-вторых, потому, что на примере этой работы мы сможем проследить переход от первоначального успеха к последующим неудачам, сопутствующий ныне, по-видимому, любому исследованию в области "искусственного интеллекта":
"Процесс создания аппарата для вычленения из непрерывного речевого патока последовательности дискретных фонем на первых порах протекал вполне успешно. Хотя в этой области преобладал фонематический анализ, одновременно в проблеме речевого декодирования были испробованы многочисленные иные подходы. Однако все они разделили участь первого подхода: первоначальный успех и последующая неспособность значительного выхода за пределы распознавания речи очень немногих и сильно отличающихся по тембру голосов людей, а также распознавание очень
202ограниченного числа отчетливых звуковых образов, будь то фонемы, слова или что-либо еще. Таким образом, необходим четко ограниченный круг говорящих или произносимых ими звуков, или то и другое вместе.
В пределах этих ограничений можно добиться очень интересных результатов, В настоящее время существует множество машин, одни из которых представляют собой экспериментальные устройства, другие уже не совсем экспериментальные. Машины эти могут распознавать где-то от 20 до 100 четких звуковых образов; некоторые из них весьма сложны. Обычный прием, напоминающий идентификацию какого-то определенного набора признаков, состоит в рассмотрении последних как координат в некотором гиперпространстве и последующем проведении плоскостей, которые разбивают это пространство на различные блоки. Если речевое событие попадает внутрь одного из блоков, вы говорите, что оно должно представлять собой такой-то звук, и, стало быть, вы его распознаете.
Эта игра была весьма успешной в диапазоне от 20 до 100 различных объектов распознавания, но, если блоков оказывалось больше, они становились столь малы и так тесно сгруппированы, что становилось затруднительно найти надежный способ их разделения. Все шло насмарку1'*.
Это приводит Эттингера к следующему замечанию чисто феноменологического рода:
"Быть может... при восприятии, так же как при сознательном научном анализе, фонема появляется после самого факта, а именно ...она строится (если это вообще возможно) как следствие перцепции, не являясь сама по себе шагом в перцептивном процессе"**.
Это, по-видимому, означает, что общий смысл фразы (или мелодии, или любого воспринимаемого объекта) определяет значение, которое приписывается индивидуальным элементам. "
А, Эттингер с сожалением констатирует:"Это приводит меня к заключению (которое, по-видимому, вряд ли будет плодотворным для последующих исследований и, наверное, не встретит понимания), что, быть может, здесь кроется нечто вроде гештальт-восприятия: вот вы, к примеру, меня слушаете, и каким-то образом смысл моей речи доходит до вас полностью. Но только a posteriori и только в том случае, если вы сами себя заставите, вы остановитесь и скажете себе: "Так, это было предложение, и слова в нем были такого-то типа, а здесь, наверное, было существительное, а здесь - гласная буква, и эта гласная была такой-то фонемой, а предложение было повествовательным и т. д."***.
Феноменологи, не занимающиеся разделением образов с тем, чтобы сделать возможным процесс машинного распознавания, меньше боятся этой трудности, однако и они поддались влиянию гештальтистской концепции восприятия. В самом деле, последняя подвергалась систематической разработке в их исследованиях, касающихся уровней восприятия. Ими рассматривались две формы сознания. Во-первых, это фундаментальный феномен отношения "фигура-фон", являющийся необходимым условием вое-
* А.О е 11 i n g e r. Language and Information.- American Documentation, vol. 19, No. 3, July 1968, p. 297.
** А.О е t t i n g e r.The Semantic Wall. (Опубликовано в издании Лаборатории фирмы Белл.)
***A. Oettinger. Language and Information, p. 298.
203
приятия любого вида: все, что мы замечаем в нашем опыте, все, привлекающее наше внимание, проявляется на некотором фоне, который остается более или менее неопределенным. Этот задний план, или фон, от которого не требуется никакой определенности, воздействует на то, что воспринимается, выделяя его в определенное, единое, четко ограниченное изображение. В знаменитом рисунке Е. Рубина "Кубок Петра и Павла" (рис.) "контур.отделяющий изображение от фона, "принадлежит" только изображению и совершенно меняет свой характер, если сделать фоном то, что ранее было изображением"*^ Таким образом, данное изображение имеет специфически отличительные характеристики, тогда как фон может быть охарактеризован лишь путем отрицания: это то, что не является изображением.
Эта неопределенность играет решающую роль в человеческом
восприятии, М.Мерло-Понти указывает на то, что большая часть
данного нам в опыте остается на заднем плане, чтобы служить
фоном восприятия того, что выступает на передний план как
предмет перцепции»
«Когда гештальттеория говорит нам, что фигура на некотором поле есть простейшая доступная нам чувственная данность, мы отвечаем: это не есть какая-то случайная характеристика фактического восприятия, которая предоставляет - в рамках некоторого идеального анализа - свободу введения понятия впечатления; это подлинная дефиниция феномена восприятия... Перцептивное-"нечто" всегда находится в окружении чего-то еще; оно всегда образует часть некоторого "поля"»**.
Именно этот фон, или внешний горизонт, как назвал его Гуссерль, основоположник феноменологии, оставаясь неопределенным в нашем примере игры в шахматы, тем не менее обеспечивает специфические условия или контекст для шахматных расчетов, в результате чего играющий, делан конкретный ход, всегда так или иначе учитывает его значение в дальнейшей игре. Аналогично наше чувство общего контекста организует и направ-
* UN e i s s e r. Cognitive Psychology, p. 90.
** М.М е г I e a u-Р о n t у. Phenomenology of Perception, p. 4. -
204ляет восприятие деталей в процессе осмысления предложения. Для машины каждый бит вводимой в нее информации должен быть выражен в явной форме, в противном случае она не воспримет ничего, ибо у нее полностью отсутствует внешний горизонт. Любая информация, подлежащая вводу в машину, должна быть столь же четко определена, как и изображение. Отсюда та громоздкость вычислений, которую мы видели в шахматных программах и на которую сетует Эттингер, говоря о лингвистических программах.
Итак, внешний горизонт характеризует, каким образом игнорируется фоновая информация, скажем, о беседе или игре, не будучи исключенной до конца. Однако он не дает представления о той части этой информации, которая способствует концентрации внимания играющего на некоторой части шахматной доски, или же о том, как предвосхищение смысла всего предложение определяет понимание входящих в него элементов. Чтобы понять это, мы должна рассмотреть второй тип перцептивной недетерминированности, исследованный Гуссерлем и гештальтпсихологами, - то, что Гуссерль называет внутренним горизонтом. Будучи "чем-то большим, чем сама фигура", фон в данном случае является не столь неопределенным, как внешний горизонт. Воспринимая объект, мы отдаем себе отчет в том, что у него больше аспектов, нежели мы в состоянии рассмотреть в данный момент. Более того, поскольку в нашем опыте имеются дополнительные аспекты, они переживаются как наличные, подобно непосредственно воспринимаемым аспектам, либо как скрыто содержащиеся в последних. Следовательно, для обычных ситуаций можно говорить о восприятии объекта в целом и даже о его скрытых аспектах, потому что неявные аспекты непосредственно воздействуют на нашу перцепцию. Например, мы воспринимаем дом не только как имеющий фасад, но и как обладающий глубиной, задней стеной и т. д. - тем, что составляет внутренний горизонт для данного восприятия. Сначала мы реагируем на объект в целом, а затем по мере дальнейшего ознакомления с ним происходит наполнение конкретными деталями того, что находится внутри дома и на его задней стороне. Машина, не имея эквивалента "внутреннему горизонту", должна Перерабатывать информацию в обратном порядке: от деталей к целому. Если машине задан какой-либо аспект объекта, то она с помощью своих рецепторов либо опишет данный объект, либо нет. Вся дополнительная информация - о других аспектах объекта - должна храниться в памяти машины в явном виде {модель типа разработанной М.Минским) или же определяться по мере необходимости. Это отсутствие горизонтов существенно отличает образ на киноленте или телеэкране от подобной же ситуации, переживаемой в действительности реальным человеком.
205"Когда в фильме объект дается наплывом, мы можем помнить, что нам показывают пепельницу или руку актера, но в действительности мы их не отождествляем. Это происходит потому, что сцена не имеет горизонтов"*,
В шахматах и в распознавании грамматических предложений этот феномен играет решающую роль. Наше общее чувство ситуации в целом, или внешний горизонт, и наш прошлый опыт общения с данным объектом либо с интересующим нас образом, или внутренний горизонт, дают нам ощущение целого и руководят нашим постижением деталей объекта**.
Лучше всего этот процесс осознается при его нарушении. Если вы хотите взять стакан воды, а по ошибке берете молоко, то первый глоток вызовет у вас замешательство; вы не почувствуете вкуса ни воды, ни молока. Рот ваш полон того, что Э.Гуссерль называет "чистым чувственным материалом" или "гилетическими данными"82, и, естественно, вы захотите выплюнуть это. Однако если вы достаточно быстро найдете правильное глобальное значение, то сможете вовремя сориентироваться и узнать молоко. В этом случае определяются и другие его характеристики: свежее или кислое, жирное или снятое.
Можно лишь удивляться тому, на что мы опираемся, когда определяем, что это молоко, а не, скажем, бензин. Нужны ли нам какие-либо нейтральные к ситуации отличительные признаки для того, чтобы начать процесс распознавания? Несомненное "ясновидение" воспринимающего субъекта столь парадоксально, что возникает искушение принять машинную модель, несмотря на все связанные с нею трудности. Но этот процесс покажется менее таинственным, если вспомнить, что каждое новое значение дано в некотором нашем внешнем горизонте, который уже организован - в данном случае речь идет о пище - на основе наших ожиданий. Важно также отметить, что мы иногда строим неправильные значения; в этих случаях то, что нам дается, вообще лишено смысла и нам приходится заново испытать новую общую гипотезу.
Вычислительную машину, работающую только с полностью определенными, четко детерминированными данными в соответствии со строго определенными правилами, в лучшем случае можно запрограммировать на испытание ряда гипотез с целью
* Ibid., p. 68.
** На этом явлении основывается вся теория восприятия Э. Гуссерля. Гуссерль утверждает, что, узнавая объект, мы придаем до некоторой степени определенное глобальное значение -он называет это значение "ноэмой" -тому, что до этого момента было неопределенным, но допускающим уточнение чувственным материалом. Затем происходит процесс придания этому открытому глобальному значению все большей определенности (см.: Е. Н u sse r L Ideas, New York, Collier, 1931, Part III; см. также мою работу "Феноменологии восприятия Э. Гуссерля" (HusserPs Phenomenology of Perception, Northwestern University Press)81, находящуюся в печати).
206выбора такой, которая наиболее подходит к этим фиксированным данным. Не приходится говорить, сколь все это далеко от того гибкого взаимодействия недетерминированных данных и недетерминированных прогнозов, которое, по-видимому, характерно для распознавания образов человеком, -
Как и следовало ожидать, исследователи, работающие в области вычислительной математики, находясь под влиянием философской традиции и успехов физики, редко обращают внимание на эту проблему. Философы представляли человека созерцателем, пассивно воспринимающим сведения, поступающие из окружающего мира, а затем упорядочивающим их. Физика, для которой мозг есть физический объект, придала этой концепции правдоподобие. Мозг пассивно получает энергию из физического мира и перерабатывает ее в соответствии со своим состоянием в настоя щий момент, используя полученную ранее энергию. Если принять такую пассивную интерпретацию деятельности разума и пренебречь различием между физическим уровнем переработки энергии и уровнем "переработки информации", то само собой получится, что разум подобно вычислительной машине просто получает "кванты" четко определенных данных. В вводной статье "Информация" в тематическом номере журнала "Scientific American",
смешивает мозг и разум, энергию и информацию, в результате чего пассивность машины воспринимается как естественная модель процессов "переработки информации" у человека.
'^Человеческий мозг также воспринимает внешнюю информацию, сопоставляет ее с информацией, каким-то образом хранящейся внутри него, и возвращает обработанную информацию в окружающий мир"*.
У.Ниссер гораздо более тонок. Он также недооценивает проблемы, возникающие в связи с ролью предвосхищения, но его работы в области психологии привели его по крайней мере к признанию необходимости "целостных операций, формирующих те единицы, на которые затем мы и направляем свое внимание"**. Этот факт он пытается согласовать со своей полной приверженностью к машинной модели. В результате возникает путаница между значением "глобальный или целостный" ("холистский") в смысле гештальтпсихологии и тем, что это должно означать в машинной программе. Это положение настолько показательно, что стоит остановиться на нем подробнее.
Общая характерная черта "гештальта", или феномена "глобальности", состоит в следующем: интерпретация части зависит от целого, которому эта часть принадлежит. Однако это определение слишком общо. Оно позволяет М. Минскому, например, опустить
* Дж. Маккарти. Информация.- В кн.: Информация. М., 1968 с. 7. ** U.fMe isser. Op. cit., p, 86.
207проблему в целом. В своей статье в журнале "Scientif1? American" он считает программу распознавания аналогии Т.Эванса способной "принимать во внимание глобальный аспект ситуации"*. Оказывается, это означает, что на основе расчетов, выполняемых по некоторым локальным признакам фигур, программа разделяет две наложенные друг на друга фигуры именно таким, а не каким-либо другим способом. Для тех, кто знаком с функцией "гештальтов", или глобальных конфигураций в нашем опыте, здесь нет ничего ни удивительного, ни интересного.
Для того чтобы увидеть различие между процессами восприятия целостностей, которые интересуют У.Ниссера, и теми процессами, которые М, Минский называет глобальным распознаванием, необходимо более четкое определение феномена "гештальта". Оперируя понятием временного "гештальта", или ритма (любимый пример гештальтистов), Ниссер дает следующее определение:
''Части (отдельные длительности) приобретают свое значение (относительное положение) исходя из целого, даже если это целое не существует в какой-либо момент времени. Оно существует, если можно так выразиться, в уме испытуемого в виде намерения... гештальта..."**.
Отличительная особенность такой интерпретации "гештальта", при которой каждая часть приобретает свое значение только исходя из целого, совсем не упоминается М.Минским при рассмотрении упомянутого выше примера, поскольку, как мы видели, в применении к цифровой машине каждое сложно составленное целое должно быть построено путем логических комбинаций независимо определенных элементов. В примере Минского элементы уже имеют точное значение (или, вернее, два возможных точных значения), и остается лишь решить, какую интерпретацию применить к решению, основанному на других четко определенных локальных признаках фигуры.
В то же время У. Ниссер, упомянув о "направленности ума",
которая наделяет отдельные длительности соответствующим значением, подводит нас к сути проблемы. Вопрос в том, как на
эвристически запрограммированной цифровой машине промоделировать неполностью детерминированное предвосхищение, имеющее место в игре, распознавании образов и разумном поведении,
таким образом, чтобы избежать неимоверно больших вычислений,
требующихся в том случае, если внутренняя модель задана а
явном виде. Для Ниссера, в частности, проблема состоит в том,
чтобы примирить его гештальтистский анализ с машинной моделью человеческой деятельности.
У. Ниссер полагает, что способ такого примирения ему известен. Рассматривая лингвистическое поведение - применение
* М. Минский. Искусственный разум83- - В кн.: Информация,
с. 208.
** U.N e i з s e r. Op, cit., p. 235.
208языка человеком - как пример феномена “гештальта", он считает правила грамматики как раз тем целым, частью которого являются слова. Мы читаем у него:
"Правила структурны: они указывают нам не способ использования конкретных слов, а способ связи этих слов друг с другом и с предложением как целым"*.
Однако это не так. Когда речь идет о ритме, целое определяет значение отдельного элемента не существует, например, синкопированной доли ритма самой по себе. Тем не менее Ниссер, переходя к лингвистическим примерам, утверждает, что слова уже обладают определенным множеством возможных значений; грамматика же просто-напросто предоставляет правила выбора того или иного значения и способы их сочетания. Элементы в этом случае полностью определены и могут быть установлены независимо от правил. Отсюда Ниссер делает ошибочный вывод:
"Предложение есть нечто большее, чем сумма его частей,- этот тезис не так уж нов. Уже давно гештзльтпсихслоги использовали его для описания целостных аспектов зрительного восприятия"*.
Подобное же смешение понятий Ниссер допускает и в приведенном выше описании явления предвосхищения (антиципации), предполагающего вслушивание в ритм. Далее он заключает: "[Предвосхищение] сущестпует... в сознании испытуемого в виде намерения, "гештальта", плана, структуры реакции, которая может быть выполнена без дальнейшего обдумывания"***. Этот переход от предвосхищения, связанного с "гештальтом", к наличному плану поведения является результатом сбивающего с толку влияния машинной модели: если гештальт определяет значение организуемых им элементов, то план или правило просто организует независимо от него определяемые элементы. Более того, поскольку элементы (или длительности) не могут быть определены независимо от гештальта, то гештальт (ритм) есть не что иное, как организация элементов. План же можно считать правилом или программой независимо от элементов. Очевидно, что, исходя из машинной модели формальной программы поведения, которая определяется и хранится отдельно от независимо задаваемых "квантов" данных, организуемых ею, Ниссер невольно изменил своей собственной гештальтистской иллюстрации. Очерченным различием пренебрегают во всех моделях познавательных процессов, однако именно в нем заключается сущность такого гештальтистского понятия, как "инсайт", и именно им объясняется гибкость феномена человеческого узнавания в отличие от распознавания образов машиной.