длится приблизительно пять лет. С 1957 по 1962 г. (гл. 1) в основном велись работы по моделированию познавательных процессов, заключавшиеся в использовании эвристического программирования для машинного воспроизведения человеческого поведения; при этом предпринимались попытки имитации тех мыслительных переходов, которыми человек фактически пользуется. На втором этапе (гл. 2) центром тяжести стало изучение процессов переработки семантической информации. Здесь термин "искусственный интеллект" приобрел более узкий смысл, чем
тот, который я в него вкладывал в предшествующем изложении.
ИИ {я буду использовать такое сокращение для обозначения
этого более узкого смысла} представляет собой попытку моделирования разумного поведения человека с помощью таких методов программирования, которые не имеют или почти не имеют сходства с мыслительными процессами человека. Трудности, с которыми мы сталкиваемся при таком подходе, уже начали проявляться. Остальные главы части I касаются вопроса о том, какова основная причина всех этих, казалось бы не связанных между собой, неудач.
Однако все практические трудности и провалы ни в коей мере не приводят в отчаяние самих исследователей: создается впечатление, что их оптимизм растет с каждым новым разочарованием. Поэтому мы вынуждены заняться вопросом о том, какие предпосылки заложены в столь стойком к постоянным неудачам оптимизме, В части II предпринимается попытка выявить четыре допущения, четыре глубоко укоренившихся предрассудка, которые мешают видеть всю серьезность создавшегося безвыходного положения и прояснить путаницу понятий, порождаемую этими предрассудками.
Эти предрассудки столь глубоко укоренились в нашем сознании, что кажется, будто единственной альтернативой дли" них может быть обскурантистское отрицание всякой возможности точной науки о человеческом поведении. В части Hi мы попытаемся отвести это опасение (в той мере, в какой его можно вообще отвести), предлагая некоторую альтернативу упомянутым традиционным допущениям; последняя основывается на идеях, выдвинутых теми мыслителями XX столетия, в работах которых имплицитно содержится критика "искусственного интеллекта", - идеях, которые до сих пор не рассматривались под таким углом зрения.
На этой основе в заключение становится возможным выявление основных характеристик "искусственного разума" и указание его возможностей и его ограничений. Это в свою очередь создает базу для разграничения различных форм разумного поведения и оценки, в какой степени каждая из них может быть предметом программирования - как с практической точки зре-
29
ния, так и в принципе.
В некотором ограниченном круге вопросов ИИ может - и, по всей вероятности, будет - иметь практическую ценность, несмотря на те ограничения, которые, как я попытаюсь показать в дальнейшем, являются фундаментальными. (Я ограничиваюсь рассмотрением только ИИ, ибо все еще неясно, может пи то наивное моделирование человеческого процесса познания - в том виде, в каком оно имеет место сегодня, - иметь вообще какую бы то ни было ценность, кроме, может быть, той, что оно служит нагляднейшим доказательством того факта, что человек, демонстрирующий разумное поведение, обрабатывает информацию не так, как это делает эвристически запрограммированная ЭЦВМ.) Устройства специального назначения могут заменять человека при выполнении некоторых задач, например в исследованиях других планет; при этом они не обязательно должны действовать так же, как человек, и проявлять свойственную человеку гибкость. Неверно говорить, что исследования в этой области не имеют смысла, хотя следует заметить, что определенное философское осмысление вопроса и здесь способствовало бы выработке более трезвого взгляда на то, чего можно и чего нельзя ожидать от такого рода устройств.
30
Часть I
ДЕСЯТЬ ЛЕТ ИССЛЕДОВАНИЙ В ОБЛАСТИ
"ИСКУССТВЕННОГО ИНТЕЛЛЕКТА"
(1957-1967)
Глава 1. ПЕРВЫЙ ЭТАП (1957-1962)
МОДЕЛИРОВАНИЕ ПРОЦЕССОВ ПОЗНАНИЯ
I. Анализ работ в области машинного перевода, решения задач и распознавания образов
Машинный перевод
В области машинного перевода успехи наметились раньше, чем в других областях: именно здесь велись наиболее интенсивные исследования, именно сюда вкладывалось больше всего средств и именно здесь неудачи были наиболее очевидны. Очень скоро выяснилось, что сконструировать машинный словарь, в котором лингвистические единицы, будь то части слов, целые слова или группы слов, могли бы одна за другой независимо от контекста переводиться в соответствующие единицы другого языка, не представляет большого труда. А. Эттингер, автор первого машинного словаря (1954), так описывает настроение тех дней: "Представление о ...полностью автоматизированном высококачественном машинном переводе, распространяемое чересчур рьяными пропагандистами машинного перевода... и взлелеянное теми, кто в нем заинтересован, однако принимает желаемое за реальность, разрослось, как буйный сорняк"*. Этот первоначальный энтузиазм и сменившее его затем отрезвление образуют своего рода клише для всех работ в этой области. В докладе "Современное состояние автоматического перевода" об этом очень удачно сказал И.Бар-Хиллел:
"В течение первого года работы над машинным переводом были достигнуты значительные успехи..- В результате этого специалисты, работающие в данной области, прониклись уверенностью, что реально работающая система находится где-то очень близко, буквально за ближайшим поворотом. И хотя причины появления в то время подобной иллюзии вполне понятны, тем не менее это была лишь иллюзия. Она возникла... в связи с тем, что решение довольно значительного числа задач не вызвало затруднений... Еще не до конца был осознан тот факт, что разрыв между этими результатами... и собственно высококачественным переводом все еще огромен. К тому времени удалось решить лишь наиболее простые задачи, и, хотя их было действительно много, по-прежнему "несколько"
· A.G.0 e 11 i n g e r. The State of the Art of Automatic Language Translation: An Appraisal, -in Beitraege zur Sprachkunde und Informations Verarbeit-ung, KMarchl (ed,)r vol. 1, H. 2, Munich, Oldenbourg Verlag, 1963, p. 18.
33
наиболее сложных задач оставались нерешенными. Это были по-настоящему сложные задачи"*.
За десять лет, прошедших с момента появления машинного словаря, пять государственных агентств потратили около 20 млн. долларов на исследования в области автоматического перевода**. Несмотря на восторги журналистов по поводу того, что машинный перевод стал наконец реальностью, единственным результатом этих исследований явилось более глубокое осознание неожиданной сложности языковых синтаксиса и семантики. И, по замечанию А.Эттингера, "остается нерешенной основная задача - задача выбора в языке, на который мы переводим, подходящего слова, соответствующего исходному слову в данном контексте. Не решена также родственная задача установления однозначной синтаксической структуры предложения,- структуры, единственность которой для человека очевидна"***. В заключение А. Эттингер пишет; "Для тех, кто до сих пор лелеет надежду на
получение полностью автоматического высококачественного машинного перевода, перспективы весьма неутешительны"****.
Так обстояло дело в 1963 г. Три года спустя в правительственном отчете "Язык и машины", изданном Научно-исследовательским советом при Национальной академии наук СШАГ был
подведен итог буму, созданному вокруг машинного перевода.
Тщательно сравнив переводы, сделанные человеком и машиной,
комиссия пришла к выводу;
"Как мы уже отмечали, несмотря на то что уже в настоящее время существует перевод научного текста средней трудности, выполняемый с помощью машины, полностью автоматического перевода, которым можно было бы пользоваться, у нас нет. Более того, его не следует ожидать ни завтра, ни в обозримом будущем"*****.
* Y. В а г-Н i I I e L The Present Status of Automatic Translation of Lan-guages.ln: Advances in Computers, F.L.A I t {eel). New York, Academic Press, 1960, vol. t, p. 94.
**Language and Machines, National Academy of Sciences, Washington, 1966,p. 29. .
*** A. G, О e 11 i n g e r. Op. cit, p. 21.
**** tbid., S. 27. Часто такого рода критические оценки работ по машинному переводу заканчиваются обескураживающим заключением, что, мол, проделанная работа во всяком случае помогает глубже понять структуру языка. Однако даже это оправдание весьма сомнительно. Н. Хомский 11968 г.) относится с недоверием к такого рода "уверткам"; "Ощутимые затраты времени, энергии и денег на применение вычислительных машин в лингвистическом исследовании (ощутимые в рамках такой небольшой области, как лингвистика) не обеспечили сколько-нибудь значительного прогресса в нашем понимании использования языка и его природы. Это резкие суждения, но я думаю, они аргументированы. Они к тому же практически не оспариваются активными исследователями в области лингвистики и психолингвистики" (Н. Хомский. Язык и мышление, с. 16),
***** Language and Machines, p. 32
34
С тех пор как возникли надежды на машинный перевод, прошло 10 лет. В то время еще полет на Луну казался научной фантастикой, а создание механического секретаря было где-то "за ближайшим поворотом". Сегодня мы уже совершили посадку на Луне, а машинописный научный текст для автоматического перевода - не говоря уже о разговорной речи и более общем материале-все еще за горизонтом, и горизонт этот, по-видимому, удаляется от нас со всевозрастающей скоростью. Поскольку надежды на создание роботов вроде тех, которые показаны в фильме "2001 год", или хотя бы более скромных "слуг" большей частью зависят от степени понимания природы естественного языка (что необходимо также и для машинного перевода), заключение Национальной академии наук наносит удар сразу по всем предсказаниям - в том числе и по предсказаниям М.Минского - о том, что уже следующее поколение в основном решит проблему создания искусственного интеллекта.
Решение задач
Толчок большинству работ по “искусственному интеллекту” , и особенно по моделированию игр и решению задач, на начальном этапе дали исследования А.Ньюэлла, Дж.Шоу и Г.Саймона в корпорации RAND и в Технологическом институте Карнеги*; эти исследования оказали влияние на последующие работы в данных направлениях. Упомянутые авторы назвали свой подход "моделированием процесса познания", так как основная методика, которую они использовали, заключалась в получении от испытуемых отчетов о ходе их рассуждений и последующем анализе отчетов с целью выявления эвристик, к которым испытуемые прибегали**. Затем на основе таких "чисто эмпирических правил" писалась программа для ЭВМ.
Наиболее существенные работы, содержащие описание результатов исследований, которые проводились в тот период, включены в вышедший в 1963 г. коллективный труд: E.Feiqenbaum and J.Feldman (eds.)-Computers and Thought. A collection of articles- New York-San Francisco- Toronto-London-
Под "отчетом*" - протоколом эксперимента - следует понимать устное изложение испытуемым процесса своего рассуждения при решении задачи. Вот типичный отчет человека, решающего логическую задачу: "Ну что же, взглянув на левую часть уравнения, нам сначала хочется уничтожить одну из частей, используя правило 3. Однако оно кажется слишком сложным для того, чтобы начинать с него. Тогда,.. нет, нет, R не могу этого сделать, так как я тогда уничтожу либо О, либо Р в том общем выражении. Я не хочу с этого начинать. Поищу-ка способ избавиться от "подковы" внутри лары скобок в левой и правой частях уравнения. Я не вмжу, как это можно было бы сделать. Ага, если применить правило 6 к обеим частям уравнения, то после этого станет видно, можно ли применить правило 7'' (Вычислительные машины и мышление, с. 287} 25.
35
И в данном случае начало работы было успешным: в 1957 г. программа "Логик-теоретик" Ньюэлла, Саймона и Шоу на основе эвристически направляемого метода проб и ошибок доказала 38 из 52 теорем из труда ' "Principia 'Mathematica". Спустя два года программа "Общий решатель задач" на основе более изощренной процедуры в терминах "средств и целей" решила задачу о людоедах и миссионерах, а также ряд других задач той же степени
сложности*.
В 1961 г. после сравнения машинной выдачи с протоколом
эксперимента (который до некоторой степени соответствовал машинному результату) Ньюэлл и Саймон сделали довольно осторожный вывод.
"Фрагментарные результаты, которые мы имеем на сегодняшний день, позволяют нам заключить, что "Общий решатель задач" дает неплохое первое приближение к теории информационных процессов, касающейся некоторых форм мышления и поведения при решении задач. Процесс "мышления" уже нельзя более считать полностью таинственным"**.
Вскоре, однако, Саймон приходит к более оптимистическим заключениям:
«Последующая работа подтверждает справедливость [наших] первоначальных догадок и показывает, что эвристики, или чисто эмпирические правила, образуют целостное ядро процессов решения проблем человеком. По мере проникновения в природу эвристик, которыми люди пользуются в процессе мышления, становятся еще менее загадочными такие [до сих пор] смутно понимаемые процессы, как "интуиция" и "рассудок"» *.
Но, как и в случае лингвистического перевода, трудности вновь и вновь напоминали о себе. На этот раз "загадочность" рассудка оказывает влияние на организацию программ по решению задач. Уже в 1961 г., когда энтузиазм Саймона достиг кульминационной точки. Минский хорошо видел трудности, которые неизбежно возникают при попытке использовать метод проб и ошибок для решения действительно сложных задач:
"Простейшие задачи, например программирование игры в крестики и нолики или доказательство самых элементарных теорем математической логики, могут быть решены с помощью простого рекурсивного использования имеющихся преобразований, применяемых к соответствующей ситуации; при этом отдельные подзадачи решаются по мере их возникновения.
* Н. A. S i m о п. Modeling Human Mental Processes.-The RAND Corporation, P-2221, 1961, February 20, p. 15. Следует иметь в виду, что эти задачи уже имели решение. Было опубликовано несколько обычных, не содержащих эвристик математических алгоритмов, дающих решение и подобных, и более сложных задач рутинного характера.
**А.Newell and H.A.Simon. Computer Simulation of Human Thinking.-The RAND Corporation, P-2276, 1961, April, 20; опубликовано
также в "Science", vol, 134, 1961, December 22, p. 19 (курсив моЛ.-Х.Д.) 27. ***H.A.Simon. Op. cit., p. 12
36
схемы
37
Такой метод становится непрактичным при решении более сложных задач,, поскольку пространство поиска увеличивается и каждая проверка требует все больших затрат времени и усилий. Здесь уже нельзя позволить себе простого отбрасывания неудачных вариантов с переходом к последующим. Поскольку каждая попытка решения трудной задачи требует очень больших усилий, нужно быть достаточно уверенным в том, что независимо от результатов эти усилил в какой-то мере себя оправдывают. Поэтому следует быть крайне осторожным и не допускать ни одной проверки без достаточно веских оснований"*.
Из сказанного, как полагает М.Минский, следует необходимость планирующей программы; однако далее он пишет:
"Методы планирования... оказываются под угрозой провала тогда, когда фиксированные наборы понятий, адекватных для простых задач, приходится заменять выражениями из дескриптивного языка"**.
В работе "Некоторые вопросы исходной организации Программ по решению задач" (1962) Ньюэлл, обсуждая некоторые проблемы, возникающие при организации шахматных программ - "Логика-теоретика" и особенно "Общего решателя задач" - откровенно признает, что "большинство [этих проблем] либо решены частично, либо полностью не решены, либо найденное решение неудовлетворительно в том или ином аспекте"***. С тех пор не появилось никаких данных, свидетельствующих о разработке удачной иерархической организации эвристических программ. (Любопытно, что величайшее достижение в области машинного доказательства теорем - программа, созданная Хао Ваном28, которая доказала менее чем за 5 минут все 52 теоремы, с которыми экспериментировали Ньюэлл, Шоу и Саймон,- абсолютно не использует эвристик.)
Однако публичное признание того факта, что работа над "Общим решателем задач" зашла в тупик, произошло значительно позднее. В 1967 г., спустя ровно десять лет после предсказания Г.Саймона, А.Ньюэлл (и Дж.Эрнст) спокойно, трезво, хотя несколько неопределенно, заявил, что работа над GPS прекращается****. Ясно, что программа GPS не выдержала тяжести своей собственной организации. Раздел их работы, названный "Общность и GPS", кончается словами:
"Размеры программы и объем соответствующей тщательно разработанной структуры данных сильно ограничивает предполагаемые возможности
# М.М i n s k у. Descriptive Languages and Problem Solving,-In; Proceedings of the 1961 Western Joint Computer Conference; перепечатано в: Semantic Information Processing, M.M i n s к у (ed), Cambridge, Mass., 1968, p- 420.
** Ibid, p. 420.
*** A. Newel I. Some Problems of Basic Organization in Problem-Solving Programs.- The RAND Corporation, RM-32S3-PR, 1962, December, p. 4.
****G. W.Ernst, A.Newelf. Generality and GPS,-Carnegie Institute of Technology, 1967, January, p. I
38
GPS- Сама программа занимает внушительную часть запоминающего устройства машины, и построение новых структур данных в процессе решения задачи быстро исчерпывает остатки памяти. Поэтому GPS предназначена для решения только простых задач, представление которых не слишком запутано. Несмотря на то что больший объем запоминающего устройства сделал бы более приемлемым расточительное использование машинной памяти, характерное для GPS, тем не менее концептуальные трудности остались бы непреодоленными"*
Этот переход от первых успехов к энтузиазму, а потом к разочарованию в полученных результатах в меньшем масштабе можно проследить и в случае программы для доказательства геометрических теорем Г.Гелернтера (1959). Поначалу успешная работа с теоремами, подобными теореме pons asinorum, послужившая поводом для тех предсказаний, о которых мы говорили ранее, оказалась полностью дискредитированной. В статье, опубликованной в 1960 г., Гелернтер, объясняя характер эвристик, используемых в его программе, в заключение говорит29: 'Три года назад преобладало мнение, что геометрическая машина не будет создана к настоящему времени. Ныне же специалист вряд ли будет оспаривать, что через три года машина будет доказывать интересные теоремы из области арифметики"** (то есть в 1963 г.). С тех пор от Г.Гелернтера ничего не было слышно, равно
как ничего не слышно и о дальнейшем прогрессе в области "чисто механической математики".
Распознавание образов
ч
Эту сферу исследований мы рассматриваем в последнюю очередь, так как трудности, препятствующие дальнейшему развитию программирования игр, машинного решения задач и автоматического перевода, могут быть преодолены только после продвижения в машинном распознавании образов (для чего в свою очередь необходимо решить вопросы, возникающие в вышеупомянутых областях). Как подчеркивают в своей ставшей классической работе "Машинное распознавание образов" О.Сэлфридж и У.Ниссер:
"В каждый момент на человека через органы чувств обрушивается лавина информации, из которой он абстрагирует образы, имеющие отношение к его деятельности в данный момент. Его способность решать задачи, доказывать теоремы и вообще существовать зависит от этого типа восприятия. Мы полагаем, что до тех пор, пока не будут созданы программы.
* Ibid., р. 45.
**ГГелернтер,Дж.Хазен и Д. Л з в л е н г.Экспериментальное
исследование машины для доказательства геометрических теорем.-В кн.: Вычислительные машины и мышление, с. 173
39
воспринимающие образы, всякое достижение в машинном решении задач будет просто отдельным техническим успехом"*-
Как обычно, и в этой области исследований в начале ее развития наблюдается блестящий успех. Так, в лаборатории Линкольна группа под руководством Б.Гоулда составляет программу для распознавания рукописных знаков азбуки Морзе. Позднее пишутся программы распознавания ограниченного набора рукописных слов и печатных букв различных шрифтов. Все эти программы осуществляют поиск заранее заданных топологических признаков подлежащих распознаванию букв и затем сверяют найденные характеристики с "определениями" каждой буквы, данными в терминах этих признаков. Эти определения либо формулируются заранее, либо вырабатываются в процессе обучения. Все дело в том, чтобы найти существенные свойства изображений, то есть такие, которые остаются инвариантными при изменениях их размеров, ориентации и прочих искажениях. Как это ни удивительно, такой подход действительно приводит к успеху в тех случаях, когда узнавание зависит от небольшого числа специфических признаков.
Однако ни одна из этих программ не может претендовать на принципиальное решение задачи распознавания образов. Каждая из них- маленький триумф изобретательного программиста,, решение ad hoc, придуманное для специфической задачи, которое не допускает обобщения и распространения на другие задачи30. М-Иден - один из ведущих специалистов в данной области-пишет в своем обзоре работ по распознаванию образов, выполненных до 1968 года:
"В тех случаях, когда удавалось создать искусственные устройства, способные к распознаванию образов, это было достигнуто с помощью методов, выбранных специально для каждой данной задачи; иными словами, эти эффективные методы обеспечивают надежную классификацию той конкретной совокупности образов, для которых они были разработаны, но, по-видимому, не представляют сколько-нибудь значительной ценности применительно к задаче классификации какой-либо другой совокупности образов"**.
Да и в каждом специальном случае, как справедливо отмечают О. Сэлфридж и У. Ниссер, "машина может получить адекватный набор признаков только от программиста"***. Их статья заканчивается словами, которые можно назвать скорее вызовом, чем предсказанием;
*О. G.Selfridge and U. N е i s s e r. Pattern Recognition by Machine,-In: Computers and Thought, p. 238.
** Распознавание образов. Исследование живых и автоматических распознающих систем^! (гл. VIII "Другие задачи распознавания и некоторые обобщения", написанная М.Иденом), М., 1970, с. 246-247.
***О. G.Sel fridge and U.Neisser. Op. cit., p. 224
40
"Пока еще мы ничего не знаем о самом важном аспекте процесса обучения: ни одна из существующих программ не может сама генерировать признаки, по которым ведется распознавание. Эффективность всех этих программ раз и навсегда ограничена заложенными в них изобретательностью или произволом написавших их программистов. Как избавиться от этой ограниченности, сейчас можно только догадываться, но до тех пор, пока это не сделано, "искусственный интеллект" будет иметь налет искусственности"*.
Однако, быть может, и эти замечания слишком оптимистичны, поскольку основная трудность заключается отнюдь не в генерировании признаков- Относительный успех программы Л.Юра и Ч.Фосслера, которая строит и оценивает свои собственные операторы, показывает, что эта задача до какой-то степени может быть решена**. Но машинное распознавание, которое использует ограниченный набор признаков - независимо от того, специальны ли они или имеют общий характер, заложены ли в программу заранее или вырабатываются самой программой,- почти исчерпало свои возможности. Число признаков, которые можно просмотреть за некоторый обозримый период времени, ограниченко, и сегодняшние программы уже приблизились к этому технологическому пределу- В работе, представленной на Международной конференции по методологии распознавания образов (Гавайи, 1968), Л.Кэнел и Б.Чандрасекаран так характеризуют создавшееся безвыходное положение:
"Очевидно, что инженерный подход неразрывно связан с некоторыми ограничениями. Существует определенный уровень сложности, начиная с которого не помогают уже никакие программистские трюки. Так, хотя опыть^ по распознаванию печатного текста с различным шрифтом были достаточно успешными, тем не менее, несмотря ни на какие усилия, удовлетворительного решения задачи распознавания рукописного текста найти не удается. Столь же большой разрыв существует, по-видимому, между распознаванием речи, состоящей из отдельных частей, и слитной речи. Надежды, возлагавшиеся на моделирование процессов распознавания у человека, также не оправдались. Вполне вероятно, что именно те проблемы, которые с таким трудом поддаются инженерной мысли, удастся решить только после того, как более глубоко и подробно будут изучены распознающие системы человека. Во всяком случае, ясно, что ощущение кризиса, возникшее в этой области исследований, тесно связано с тем же ощущением в других областях "искусственного интеллекта"-программировании игр и автоматическом переводе"***.
* Ibid,, p. 250.
**См:Л. Юр, Н. Фосслер. Программа распознавания образов, которая вырабатывает, оценивает и улучшает свои операторы. - 8 кн.; Вычислительные машины и мышление, под ред. Э.Фейтенбаума и Дж.Фельдмана. М., 1967.
*** L. К a n a I, В, Chandrasekaran, Recognition, Machine Recognition and Statistical Approaches.-In: Methodologies of Pattern Recognition. New York, Academic Press, 1969, p. 318-319
41
События разворачиваются здесь по той же схеме; на смену оптимизму приходит крушение иллюзий. Зачастую у тех, кто прошел этот путь, даже нет отчетливого понимания, почему их надежды не оправдались; но их недоумения тонут в хоре обещаний и сообщений о небольших технологических достижениях. Один из таких недоумевающих - В.Джулиано, работавший ранее в "Arthur D.Little Corporation ". Будь его оценка заблуждений, имевших место в распознавании образов, несколько более подробной и глубокой, ее, пожалуй, можно было бы сравнить с заключениями А.Эттингера и И.Бар-Хиллела. В. Джулиано пишет:
"Как и многие мои коллеги, я страстно желал найти пути создания того, что мы иногда называем искусственным интеллектом... В середине 50-х годов была начата разработка множества многообещающих проектов, целью которых было наглядное доказательство способности вычислительных машин к обучению и, следовательно, к смысловому переводу, ведению свободного и непринужденного разговора с человеком, распознаванию речи с выводом ее на печать, диагностике заболеваний. Все эти виды деятельности включают в себя выделение и изучение сложных образов.
Всего несколько лет назад мы действительно верили, что в конце концов вычислительным машинам можно будет полностью поручить решение такого рода задач, если суметь запрограммировать их соответствующим образом.
Увы! На мой взгляд, многие наши ожидания, по всей вероятности, опираются на идеи, напоминающие фарфоровые яйца: сколько их ни-высиживай, никто из них не вылупится. Это объясняется тем, что мы возлагаем задачу открытия нового на машину саму по себе. Однако проблемы, связанные с открытием, требуют человеческих способностей"*.
Заключение
К 1962 г., если судить по опубликованным работам, начала вырисовываться общая схема (правда, в некоторых случаях это стало очевидно несколько позже); быстрый и эффектный успех, связанный с нетрудоемкими, простыми задачами, либо весьма неудовлетворительное решение сложных задач; затем снижение эффективности работы, разочарование, подчас пессимизм. Такой ход развития нельзя объяснить давлением, оказываемым на исследователей теми, кто с интересом следит за их работой (как скептики, так и доброжелатели) и требует слишком многого за короткий срок. Для того чтобы понять незначительность полученных результатов, достаточно сравнить обещания с фактами.
Впрочем, даже когда общая ситуация безнадежна, энтузиасты всегда могут обратиться за поддержкой к своему собственному оптимизму. Такая тенденция подменять создание работающей программы долгосрочными прогнозами проскальзывает в ут-
* V.E.G i u I i a n о. How We Find Patterns.- International Science and Technology, 1967, February, p. 40
42
верждении Э.Фейгенбаума и Дж. Фельдмана о том, что предсказания в отношении моделирования познавательных процессов человека являются обнадеживающими*. Что касается предсказаний, то они всегда были таковыми. Однако насколько обнадеживающи перспективы! Фейгенбаум и Фельдман утверждают, что реальный прогресс постоянно ощущается, однако определяется он ими весьма осторожно - как "движение к конечной цели"**. Если следовать этому определению, получается, что первый же человек, взобравшийся на дерево, имеет право утверждать, что сделал шаг к Луне.
Однако вместо того чтобы карабкаться вслепую, не лучше ли попытаться понять, куда мы хотим попасть? Не пора ли серьезно задуматься над специфическими проблемами, стоящими перед создателями "искусственного интеллекта", и теми трудностями, которые стоят на пути их решения?
II. Причина неудач
Отрицательный результат, если, разумеется, мы признаем его таковым, может быть интересен сам по себе. Спад результативной работы, наблюдающийся вместо предсказывавшегося нарастающего успеха, быть может, свидетельствует о том, что мы столкнулись с каким-то неожиданным явлением. Существует, возможно, некая аналогия между исследованиями в области "искусственного интеллекта" и достижением все больших скоростей, где прогресс становится все более и более труднодоступным по мере того, как мы приближаемся к скорости света. Возможно также, что путь к успеху неровен и вместо того, чтобы прилагать все больше усилий в одном направлении, лучше прибегнуть к принципиально другим путям и методам работы, - стремясь к Луне, не обязательно взбираться на дерево.
Казалось бы, вполне естественно критически проанализировать именно эту сторону дела, однако в данной области, как ни странно, до сих пор это не сделано. Между тем если этим заняться, то обнаружится, что каждому из четырех рассмотренных выше направлений противостоят специфически человеческие формы "процессов переработки информации", позволяющие субъекту в сфере своей деятельности преодолевать или обходить трудности, неизбежно возникающие перед создателями "искусственной личности". Ниже мы выделяем четыре такие формы "переработки информации" человеком и сравниваем их с соответствующими машинными суррогатами.
· См : Вычислительные машины и мышление, М. 1967 ** См. там же
43
Эвристически направляемый поиск или периферийное сознание
Общеизвестно, что некоторые игры можно реализовать на современных ЭЦВМ с помощью современных методов программирования. Такие игры, как "ним" или "крестики и нолики", могут быть запрограммированы так, что каждую партию машина либо выиграет, либо сведет к ничьей. Однако существуют игры, которые не могут быть полностью решены на нынешних машинах, но которые тем не менее успешно программируются. Так, например, выясняется, что в игре в шашки существуют надежные способы определения вероятностной оценки хода, использующие такие параметры, как контроль над центром, развитие и другие. Если наряду с этим учесть, что количество ходов здесь относительно невелико, поскольку шашки блокируют друг друга и взятия обязательны, то можно исследовать все варианты на 20 ходов вперед, что вполне достаточно для отличной игры-
В шахматах, однако (хотя для них в принципе возможен полный просчет всех прямых и ответных полуходов), возникает задача, неизбежно связанная с выбором пути в лабиринте-и, значит, с экспоненциальным ростом. Число альтернативных вариантов возрастает настолько быстро, что мы не в состоянии оценить каждую из возникающих возможностей хотя бы на глубину, достаточную для того, чтобы решить, заслуживает ли данный ход дальнейшего исследования. А.Ньюэлл отмечает, что машине потребовалось бы слишком много времени для выбора интересного хода, если бы она исследовала одно за другим положения всех фигур на доске. Он также отдает себе отчет, что если этого не делать, то машина может подчас пропустить какую-нибудь важную и интересную комбинацию. "Мы не стремимся к тому, чтобы машина тратила все свое время на исследование последствий связок фигур; однако если она никогда не будет проводить таких исследований, то может пропустить реальные возможности выигрыша"*.
Первое, что предложил А.Ньюэлл для решения этой задачи,- это введение "случайного элемента". "Машина должна время от времени (то есть совершенно случайно. - Х.Д.) просчитывать варианты, в которых жертвуется ферзь"**. Но это решение неудовлетворительно, как, по-видимому, в настоящее время понимает и сам Ньюэлл. Машина должна не просто время от времени просчитывать последствия жертвы ферзя, а исследовать
* A.N swell. The Chess Machine.ln: The Modeling of Mind, K.M.S а у -re and F.J.Xrosson (edsj, South Bend, Ind, Notre Dame University Press, 1963, p. 80.
*• Ibid., p. 80.
44
те варианты, в которых такая жертва имеет смысл. Хорошие эвристики как раз и должны обеспечивать подобное поведение, приводя к сокращению числа подлежащих анализу ветвей при сохранении наиболее многообещающих альтернатив.
Однако ни одной такой эвристики на уровне мастера пока не обнаружено. Все существующие эвристики либо исключают некоторые потенциально хорошие ходы - ходы, которые не ушли бы от внимания мастера,- либо оказываются перед лицом экспоненциального роста. Г, Саймон тем не менее убежден (его доводы обсуждаются в части II), что шахматные мастера пользуются такого рода эвристиками- Отсюда его уверенность в том, что если изучать отчеты мастера о принимаемых им решениях, следить за движением его глаз и, быть может, допрашивать ого под светом юпитеров, то можно в конце концов обнаружить эти эвристики и встроить их в программу, сократив тем самым поиск по экспоненциально растущему дереву игры. Давайте, однако, рассмотрим более пристально те данные, из которых якобы следует, что процесс игры в шахматы управляется эвристиками.
Обратимся к протоколу эксперимента, цитируемому Саймоном, придавая особое значение тому, как он начинается (а не тому, чем заканчивается). Шахматист говорит;
"Я опять замечаю, что одна из фигур противника, ладья, не защищена; наверняка существуют какие-то пути использования этого преимущества. Например, я могу продвинуть пешку и напасть на слона; если слон отступит, ферзь противника окажется под ударом и я смогу взять ладью-Если же../' и т. д.*
В конце мы видим пример процесса, который я буду называть "просчитыванием", - продумывание различных возможных вариантов путем простого перебора ходов. Каждому из нас знаком этот процесс: считается, что именно такая процедура, управляемая различными эвристиками, реализуется в игре шахматных мастеров. Однако как же наш шахматист заметил, что ладья противника не защищена? Он что, действительно последовательно (или одновременно) исследовал положение всех фигур противника и возможные способы защиты, до тех пор пока не наткнулся на уязвимую ладью? Для этого ему понадобилось бы рассмотреть слишком много вариантов, ибо, как пишут Ньюэлл, Шоу и Саймон, "по наиболее достоверным данным, человек при выборе хода рассматривает значительно менее ста позиций"**. Что же касается поведения шахматиста, то ему для оценки ситуации пришлось бы в приведенном выше примере рассматривать еще
*A.Newell, H.A.S i m о п. Computer Simulation of Human Thinking.-- The RAND Corporation, P-2276, 1961, April 20, p. 15.
** A. H ь ю э л л, Дж. Шоу, Г С а й м о н. Программа дли игры в шахматы и проблема сложности.- В кн.: Вычислительные машины и мышление, с. 44.
45
массу возможных позиций, которые следуют из незащищенности ладьи противника. Нет необходимости обращаться к интроспекции, чтобы выяснить, что именно делает игрок до того, как начинает просчитывать варианты. Непосредственно из протокола ясно, что игрок "фокусирует внимание" на перспективном варианте ("я замечаю, что одна из фигур противника не защищена") . Только после того, как шахматист обратил внимание на некоторую особенность позиции на доске, он действительно начинает просчитывать и проверять, что можно из нее извлечь.
Анализ шахматной программы "Мак Хэк", составленной Р. Гринблатом, наглядно иллюстрирует разницу между тем, как человек схватывает шахматную позицию, и тем, как машина производит сплошной перебор- Даже "Мак Хэк" не в состоянии просчитать все альтернативы. В программу включен рационально действующий генератор ходов, который оставляет для рассмотрения только более или менее многообещающие варианты. И тем не менее, когда в одной из партий турнира программа однажды крепко "задумалась", она затратила на один ход 15 мин и просчитала 26 000 вариантов, в то время как человек может просчитать их только 100, от силы 200. Программа "Мак Хэк" нашла отличный ход, что, впрочем, отнюдь не означает, что мастер-шахматист не нашел бы лучшего; но в данном случае для нас существенно важно не качество хода, а количественное различие между просчетом в 26 000 и 200 вариантов. При таком разрыве естественно предположить, что человек, играя в шахматы, не только просчитывает варианты, но и производит действия совсем иного порядка. Именно этот вопрос нас и интересует: что же делает человек, благодаря чему ему удается, рассмотрев всего 100 - 200 альтернатив, найти более сильный ход, нежели машина, "прокрутившая" их 26 000,
Шахматист, отчет которого мы цитировали выше, даже не осознает, что он фактически проверил (или фактически исключил из рассмотрения) несколько сот позиций, которые пришлось бы просчитать для того, чтобы путем перебора оценить конкретную ситуацию на шахматной доске. А ведь та конкретная ситуация, на которой в конце концов останавливается внимание испытуемого, зависит от общей позиции. Для того чтобы понять, как все это возможно, рассмотрим феномен, который У.Джемс называл "периферийным сознанием". Тот факт, что мы замечаем тиканье часов только тогда, когда они остановились, являет собой простой пример подобного рода краевого сознания. Другим, более сложным и подходящим к делу примером является то расплывчатое восприятие лиц, какое имеет место, когда мы ищем в толпе знакомого.
Однако невозможно привести вполне адекватный пример
46
феномена такого рода, поскольку речь идет о явлении, которое противоположно процессу явного осознания, основанному на просчитывании. Ни в одном из подобных примеров нельзя с уверенностью сказать, что испытуемый действительно использует информацию, остающуюся на периферийных полях его сознания. Пример с шахматами лучше всего представлять себе в терминах данного М. Поляным общего описания способности краевого сознания концентрировать информацию, относящуюся к нашей "периферической" психической деятельности,
"Эта способность присуща той области, которая имеет тенденцию действовать как фон, потому что располагается она где-то вокруг центрального объекта нашего внимания. Наблюдаемая уголком глаза или хранящаяся в закоулках нашей памяти, эта область неизбежно влияет на то, как мы воспринимаем объект, находящийся в центре внимания. Можно даже сказать, что мы осознаем эту едва замечаемую нами область гпавным образом потому, что на ней мы выделяем тот объект, который привлек наше внимание"*.
Если мы, например, знаем, что такое "дом", то его передняя сторона будет выглядеть "толще", чем собственно фасад, потому что подсознательно мы чувствуем за ней сам дом. Так и в шахматах: связи, соединяющие между собой различные фигуры, оставаясь в периферийном сознании, привлекают внимание шахматиста к ситуациям на шахматной доске, которые он воспринимает либо как многообещающие, либо как опасные или просто стоящие внимания.
А, Ньюэлл и Г.Саймон сами отмечают:
«В шахматной игре человек использует категории гораздо более
* М.Р о I а п у i. Experience and Perception of Pattern.- In: The Modeling of Mind, p. 214. Насколько я знаю, первым, кто обратил внимание на то, что такого рода гештальтистский анализ имеет отношение к "искусственному интеллекту", был Ф. Кроссон. В предисловии к книге "Модели разума "он пишет: «Некоторые функции человеческого мышления подчас реализуются путем использования информации или неявных ориентиров^, которые не переводятся в точную форму и находятся как бы "не в фокусе"; по-видимому, это свидетельствует о фундаментальных различиях между этими функциями и теми процессами, посредством которых они моделируются в терминах автоматов. Причина такого различия заключается в том, что ЭЦВМ, на которых реализуются соответствующие модели, оперируют бинарными кодами. Вследствие этого всякая функция, которую машина может реализовать... должна на каждой стадии удовлетворять принципу "все или ничего", то есть быть в достаточной степени конкретной и четкой, с тем чтобы на все связанные с ней вопросы можно было ответить "да" или "нет"» (The Modeling of Mind, p. * 21). Впрочем, Кроссон четко не определяет особенности и функции этой "внефокусной" формы восприятия, в результате чего остается неясным, можно ли в принципе, с его точки зрения, выразить в явной форме любое смутное содержание и что будет потеряно (и будет ли потеряно вообще) в модели, которая имеет дело только с четко выраженным материалом
47
глобальные, нежели те, о которых мы говорили выше; например, "развитие фигур", "контроль над центром", "выигрышная позиция", "слабый королевский фланг", "закрытая позиция"»* ,
Более того, они признают:
«Иногда в эксперименте де Гроота испытумый употреблял очень общие выражения, такие, как "для белых эта позиция выигрышна"; при этом невозможно было определить структуру или характеристику позиции, ведущую к этой оценке^**.
Именно к таким выражениям прибегают Ньюэлл и Саймон, когда они не видят, как в терминах эвристически направляемого просчитывания процесса можно подойти к анализу того, каким образом возникает данная глобальная оценка. И вполне справедливо-но, по-видимому, не отдавая себе отчета в том, как это скажется на правдоподобии предсказаний Саймона,- они продолжают:
"На сегодняшний день работа над шахматными программами мало прибавила к нашему пониманию подобных понятий более высокого уровня"'*3^*.
Это типичный пример неопределенности высказываний Саймона и Ньюэлла. Что они имеют в виду? Что более совершенные статичные оценки, то есть более совершенные эвристики для выделения удовлетворительных ходов, позволят промоделировать явление фокусировки внимания? Их неослабевающая вера в возможность создания "машинного шахматиста", играющего на уровне мастера, приводит нас именно к такому толкованию. Однако предпринятый ими анализ игры мастера, основывающийся на работе де Гроота, мог бы послужить достаточным основанием для пессимизма, (Как мы видели, сам де Гроот говорит, что он не очень-то надеется на существенное улучшение эвристической шахматной программы.)
А. Ньюэлл и Г.Саймон замечают далее:
"В конце концов де Гроот нашел способ отличать сильных игроков от слабых с помощью теста на восприятие, заключающегося в воспроизведении по памяти шахматной позиции после предъявления ее на короткий
* A.N е w e I I, H.S imon, An Example of Human Chess Play in the Light of Chess Playing Programs,-Carnegie Institute of Technology, 1964, August, p. 10-11.
** Ibid, p. 13 (курсив мой. -X.Д.).
*** Ibid., p. 11. Далее А-Ньюэлл и Г.Саймон пишут: "И вообще психология мало что может сказать о том, как глобальные понятия организуют поведение". Это, конечно, проявление крайней узости кругозора- Ведь гештальтпсихологи почти ни о чем больше и не говорят. Ньюэлл и Саймон же имеют в виду, что психология такого рода, с которой они предпочитают иметь дело, - то есть психология, использующая в качестве объясняющей модели программу для вычислительной машины, - не имеет доступа к подобным глобальным процессам.
48
промежуток времени (3-7 сек) . Гроссмейстер оказался в состоянии полностью воспроизвести позицию; по мере ухудшения качества игры шахматистов заметно ухудшались и их результаты в этой проверке Это привело де Гроота к выводу, что перцептивные способности и организация восприятия чрезвычайно существенны для очень хорошей игры1'*,
В статье, которую мы уже обсуждали, мастер по шахматам
3. Херст делает еще один шаг к выяснению сущности процесса
восприятия и причин, по которым этот процесс не поддается
программированию:
"Очевидно, мастер воспринимает расположение фигур на доске крупными блоками, такими, как пешечная структура и взаимодействия фигур... Если он все же делает ошибку, то это нередко объясняется тем, что он помещает какую-нибудь фигуру на определенное поле, стремясь создать выгодную для себя позицию"**.
Э. Херст резюмирует свою точку зрения следующим образом:
"В связи с множеством первичных ассоциаций, которыми располагает опытный игрок, он видит шахматную позицию не как конгломерат шахматных полей со стоящими на них деревянными фигурами, а как определенным способом организованную структуру (подобную образу, "гештальту" или целостной конфигурации, играющей столь существенную роль в гештальтпсихологии) "***.
Опираясь на эти высказывания, вернемся к анализу приведенного выше отчета шахматиста о своих рассуждениях. Мы можем сделать вывод, что знакомство нашего испытуемого с глобальными характеристиками шахматной игры и с предыдущими ходами данной конкретной партии дало ему возможность увидеть линии давления на противника, слабые и сильные стороны своей позиции и ее специфические особенности. Он видит, что позиция противника уязвима в таких-то пунктах (подобно тому как человек, имеющий представление о домах вообще и о некотором конкретном доме в частности, всегда воспринимает этот последний в неразрывной связи с той частью дома, которая расположена за его фасадом) и, фиксируй на этом внимание, обнаруживает незащищенную ладью. Этот шаг можно рассматривать как отдельную ступеньку в динамике восприятия структуры позиции.
Ни в одной из существующих шахматных программ не делается даже попытки использовать в этом плане опыт, накапливающийся в ходе игры. Наоборот, каждый ход ищется заново, как если бы это была отдельная шахматная задача из учебника. Программист вынужден считаться с таким положением дел, ибо в
* Ibid, p. 14.
** E.Hearst Psychology Across the Chessboard.-Psychology Today, 1967, June, p. 35, *** Ibid, p-37.
49
противном случае программа, обрастая информацией о прошлых положениях каждой фигуры, вскоре потонет в нарастающей массе данных. В действительности необходимо, чтобы программа отбирала из накапливающейся информации о ходе игры именно то, что существенно и для выработки собственной стратегии, и для понимания стратегии противника. Но поскольку в существующих программах вообще не присутствует долгосрочная стратегия, остается единственный выход - порция за порцией накапливать и рассортировывать данные, хотя это требует очень больших затрат времени34. Без глобального рассмотрения - восприятия целостных образов или структур, по-видимому, невозможно избежать ситуации экспоненциального роста и преодолеть ограниченные возможности эвристик в выборе вариантов, подлежащих рассмотрению*.
Итак, глобальная форма "информационного процесса" (или "процесса переработки информации"), при которой информация рассматривается не в четкой форме, а остается, скорее, в периферийной сфере сознания и учитывается неявно, действует постоянно, непрерывно организуя наше эмпирическое познание. Поэтому нет оснований полагать, что обнаружение незащищенной ладьи является результатом осуществляемого испытуемым быстрого подсознательного просчета вариантов, продолжающегося до тех пор, пока наступит момент, когда последний переходит в область явного сознания. Более того, есть убедительные причины для того, чтобы отбросить это предположение, поскольку с ним связано больше вопросов, чем позитивных решений.
Если испытуемый подсознательно, пользуясь прекрасными эвристиками, просчитывает тысячи альтернатив для того, чтобы достичь момента, в который он фиксирует свое внимание на ладье, то почему этот подсознательный процесс не продолжается до конца, то есть вплоть до того момента, когда шахматисту вдруг приходит в голову, какой ход является наилучшим? Если, с одной стороны, подсознательное просчитывание столь быстро и точно, почему тогда в какой-то момент-а именно когда испытуемый замечает ладью - он обращается к обремени-
* М- Минский осознает эти трудности, однако сохраняет уверенность в том, что должно существовать какое-то их эвристическое решение: "Наверно, это можно произвести с помощью некоторого эвристического метода, который сделает возможным учет относящихся к делу факторов, или с помощью логики, позволяющей извлекать из них соответствующие следствия. В этом последнем случае неудобство заключается в том, что антецеденты есех утверждений должны содержать описание состояния данной системы, а для сложных систем оно становится слишком громоздким. Иные - регулярные систематические - решения проблемы, по-видимому, также неприемлемы. По всей вероятности, это одна из тех задач, которая настоятельно требует именно эвристического решения" (Semantic Information Processing, p. 422).
50
тельному методу медленного и трудного сознательного просчиты-вания? Если же, с другой стороны, подсознательного просчиты-вания недостаточно для адекватного решения задачи, то каковы преимущества переключения на осознанный вариант того же процесса?
Такого рода "телеологические" рассуждения сами по себе не могут служить доказательством недискретного характера функционирования подсознания. Тем не менее при таком подходе становится ясно, что бремя доказательства должно лечь на плечи тех, кто выдвигает предположение о дискретности подсознательных процессов или даже считает его обязательным. Нет никаких данных, ни поведенческих, ни интроспективных, свидетельствующих о том, что просчитывание является единственной формой "информационного процесса", используемого при игре в шахматы, и что "существо задачи - это поиск в пространстве возможностей, число которых растет по экспоненциальному закону"*/ Скорее, наоборот, все протоколы экспериментов свидетельствуют о том, что при игре в шахматы используется два типа поведения:
фокусировка, фиксация внимания - путем глобальной организации поля восприятия - на области, ранее находившейся в
периферийном сознании; в результате интерес к другим областям,
все еще находящимся на периферии сознания, повышается;
явное просчитывание альтернатив.
Такое разделение объясняет столь характерный для первых работ по моделированию процесса познания первоначальный успех и позднейшие неудачи. Во всех игровых программах быстрый успех был получен при программировании таких игр или таких частей игр, для которых применим метод эвристически направляемого просчитывания. Неудачи же начинаются там, где в силу большой сложности задачи становится необходимым глобальное восприятие образов, с тем чтобы избежать непомерного экспоненциального роста числа возможностей, подлежащих просчету.
Бесконтекстная точность или допустимая
неоднозначност ь?
В программировании игр отчетливо проявилась необходимость обработки "информации", не рассматриваемой в явном виде, но и не исключаемой из рассмотрения, то есть информации,
* А, Н ь ю э л л, Дж. Шоу, Г. С а й м о н. Программа для игры в шахматы и проблема сложности. - В кн.: Вычислительные машины и мышление, с. 65.
51
находящейся на периферии сознания. Приостановка работ по
машинному переводу была связана со второй непрограммируемой формой "обработки информации": умением человека учитывать нечеткие ситуации, не прибегая к замене их точными описаниями.
Мы видели, что И.Бар-Хиллел и А.Эттингер - одни из самых уважаемых и знающих исследователей в области автоматического перевода - сошлись в своих пессимистических оценках возможности дальнейшего прогресса в этом направлении. Оба они пришли к выводу, что, для того чтобы переводить с одного естественного языка на другой, требуется нечто большее, чем машинный словарь {каким бы полным он ни был) и правила грамматики (сколь совершенными они ни оказались бы). Порядок слов в предложении не дает машине достаточной информации для того, чтобы решить, какой из возможных грамматических разборов данного предложения наиболее приемлем в соответствующем случае, а стоящие рядом слова (письменный контекст) не всегда дают возможность определить, какое из нескольких допустимых значений данного слова имел в виду автор.
Рассматривая различные системы синтаксического анализа предложений, допустимых в данной грамматике, Эттингер говорит:
"К настоящему времени опыт такого анализа показал, что как в русском, так и в английском языках степень допустимой синтаксической неоднозначности гораздо выше, чем это предполагалось ранее. В этой связи, а также в связи с относительной нечеткостью границ между грамматически правильным и неправильным предложениями возникает серьезный вопрос о принципиальной возможности создания системы эффективной, полностью автоматизированной обработки русского или английского текста, пригодной для любых целей перевода или обмена информацией"*.
Работа А.Эттингера над машинным словарем была на первых порах успешной; позднее он вместе с Куно и другими работал над системами синтаксического анализа. Тем не менее он не берет на себя смелость утверждать, что туман, окутывающий процессы понимания естественного языка, начинает рассеиваться, оставляя неясными лишь некоторые наиболее трудные проблемы. Скорее наоборот, Эттингер обращает внимание на "чрезвычайно загадочные семантические процессы, благодаря которым большинство людей в своих рассуждениях интерпретируют большинство осмысленных предложений в большинстве случаев однозначно"**
Здесь мы видим еще один пример важности краевого сознания. Не вызывает сомнения, что человек, владеющий естественным языком, не осознает всех тех смутных мотивов, неявных
52
ориентиров, которые помогают ему в решении вопроса о синтаксической структуре и смысле высказывания. В то же время ничто не указывает на подсознательное использование этих скрытых ориентиров. И действительно, имеется два соображения, которые исключают возможность учета этих скрытых ориентиров в какой-либо последовательно или даже параллельно работающей программе*.
Во-первых, это доводы И. Бар-Хиллела (в гл. 6 мы разберем их более подробно), указывающего на то, что таких смутных, ориентиров может быть бесконечно много. Во-вторых, даже если бы число таких неявных факторов не превосходило некоторых разумных пределов, это бы нас все равно не спасло, так как для того, чтобы составить программу, использующую эти факторы для определения значения словосочетания, нам пришлось бы сформулировать некоторые синтаксические и семантические критерии в виде строгих правил; а ведь при пользовании языком мы не опираемся на строгие правила и это не приводит к неясностям. Еще Б.Паскаль писал о том, что разум в процессе восприятия функционирует втихомолку, "про себя", естественно и не по правилам технического характера. Эту глубокую идею в применении к языку тщательно исследовал Л.Витгенштейн:
"Мы не в состоянии точно описать понятия, которыми мы пользуемся, не потому, что не знаем их реальных определений, а потому, что таких "реальных определений "не существует- Предположение, что они непременно должны существовать, равносильно предположению, что всякий раз, когда дети играют в мячик, они играют в какую-то игру со строгими правилами''**.
Естественным языком люди пользуются в ситуациях, в которых они преследуют те или иные цели. Эти внелингвистические
*При последовательной переработке информации программа задает последовательность операций, в которой каждая операция зависит от результатов выполнении предыдущих. При параллельной переработке одновременно производится несколько таких последовательных вычислений. Параллельная переработка может быть промоделирована последовательной программой; однако между этими двумя случаями имеется важное логическое различие: если программа носит последовательный характер, то каждый шаг определяемых ею вычислений зависит от предыдущих шагов; если же программа параллельна, то операции, входящие в каждую последовательность, не зависят от операций, выполняемых в других последовательностях,
** L. W i 11 g e n s t e i n. The Blue and Brown Books, Oxford, Eng., B, BTack-well, 1960, p. 25. (M. К och e n, D.M.MacKay, M.E.Maron, M.Scriv e n, L. U h r. Computers and Comprehension, The RAND Corporation, RM-4065-PR, April 1964, p. 12.) Участники симпозиума "Вычислительные машины и процессы понимания", проведенного корпорацией RAND, высказывали предположения о преимуществах и психологической обоснованности такого "нерегулярного" характера естественного языка. "Все определяется тем фактом, что язык представляет собой комбинаторный набор вариантов с неограниченным числом возможных комбинаций, значение которых может быть выведено из конечного множества "правил", управляющих значениями компонент. (Так называемые "правила" вырабатываются при
53
цели, сами по себе не предполагающие ни точной формулировки, ни даже ее возможности, и определяют для человека те скрытые ориентиры, которые служат ограничению неоднозначности высказываний, причем настолько, насколько это необходимо для решения соответствующей задачи. Фраза типа "Держись ко мне поближе" может означать все что угодно, начиная от "Держись рядом со мной" и кончая "Находись от меня на расстоянии километра"- в зависимости от того, обращаются ли с ней к ребенку на многолюдной улице или к товарищу-космонавту во время экспедиции на Луне. Эта фраза никогда не имеет совершенно однозначного смысла, одинакового во всех ситуациях, что, впрочем, вполне разумно; но ее значение в каждой конкретной ситуации всегда может быть сделано достаточно определенным для того, чтобы можно было достичь желаемого результата.
Наша способность использовать глобальный контекст для
требуемого уменьшения неоднозначности, не прибегая при этом к формализации (то есть к полному исключению неопределенности), выявляет вторую фундаментальную форму "переработки информации" человеком, которая вытекает из первой. Периферийное, краевое сознание учитывает неявные ориентиры, заключенные в контексте, а также, вероятно, некоторые возможные грамматические конструкции и смысл, значение- все то, что на выходе машины должно быть сформулировано в четкой форме. Присущее человеку ощущение ситуации позволяет ему исключать из рассмотрения большинство возможных вариантов до всякого точного их анализа. Будем называть эту способность сужать спектр возможных значений в соответствии с ситуацией "допустимой неоднозначностью".
Высказывание и понимание предложения естественного языка предполагают имплицитное знание того, как предложение зависит от контекста. Поэтому, как и предполагал Тьюринг, единственный способ заставить ЭЦВМ понимать и переводить естественный язык - это, по всей видимости, составить программу, которая даст машине возможность познавать мир. "Я не допускаю возможности,- говорит И. Бар-Хиллел,- что машины, программы которых не позволяют им обучаться в подлинном смысле этого слова, смогут когда-либо надежно осуществлять высококачественный перевод"*. Признавая время от времени, что применение существующих методов наталкивается на известные трудности, энтузиасты "искусственного интеллекта" в качестве панацеи пред-
обучении е_ виде наборов ответных реакций, и они лишь частично поддаются формализации.) "
* Y.B a r-H i И е I. The Present Status of Automatic Translation of Language, -In: Advances in Computers, p. 105-106.
54
лагают прибегнуть к обучению. С, Пейперт, проводящий исследования в Массачусетсом технологическом институте, например, недавно заявил, что нельзя ожидать от машины действий, подобных поведению взрослого человека, если машина не прошла предварительного обучения, и что задача сводится к тому, чтобы создать ЭЦВМ, обладающую той же способностью к обучению, что и ребенок. Однако такой подход, как мы увидим ниже, только уводит нас от рассматриваемой проблемы.
В области обучения языку единственной интересной и удачной программой была программа Э. Фейгенбаума ЕРАМ («Elementary Preceiver and Memorizer» - "Система элементарного воприятия и запоминания"). ЕРАМ моделирует процесс обучения ассоциациям бессмысленных слогов, который Э.Фейгенбаум называет упрощенным вариантом вербального обучения*. Однако обучение бессмысленным слогам вообще не является обучением языку. Обучение ассоциациям бессмысленных слогов фактически есть не что иное, как приобретение своего рода условного рефлекса в смысле И,П. Павлова. Экспериментатор последовательно предъявляет испытуемому карточки с надписями DAX и JIR; но он мог бы с тем же успехом включать сначала красную, а потом зеленую лампочки. После достаточного числа этих последовательных экспозиций испытуемый научается предугадывать второй элемент пары. В эксперименте такого рода субъекту отводится абсолютно пассивная роль, В некотором смысле он ничему не обучается - просто с ним что-то проделывают. Кем бы ни был испытуемый - слабоумным, ребенком, взрослым человеком,- эффект обучения бессмысленным слогам будет совершенно одним и тем же. В конце XIX в. такая форма выработки условной связи была предложена Г.Эбингаузом специально для того, чтобы исключить какое бы то ни было влияние уже сложившихся ассоциаций на процесс осмысленного разбиения на классы или обращения к контексту.
Неудивительно поэтому, что в таких случаях отчеты испытуемых и машинный результат почти точно соответствуют друг другу. Однако это весьма сомнительный успех, ибо единственный случай удачного моделирования познания имитирует процесс, в котором отсутствует понимание и который поэтому нельзя считать познавательным.
Обучение языку является значительно более сложным и загадочным процессом, нежели тот род условного рефлекса, который лежит в основе научения ассоциациям бессмысленных слогов. Для того чтобы объяснить человеку значение какого-либо
См.: Э. Фейгенбаум. Моделирование вербального поведения. - В кн.: Вычислительные машины и мышление, с. 302-316.