1. ВВЕДЕНИЕ
Одной из главных тенденций современного развития искусственного интеллекта является интеграция и гибридизация разных моделей, направлений и технологий. В первую очередь, речь идет об интеграции различных моделей представления знаний и способов рассуждений, а также о "схождении" различных направлений ИИ, необходимом для расширения возможностей интеллектуальных систем [23]. Здесь характерными примерами являются фреймово-продукционные модели знаний и синтетические методы рассуждений (сочетающие механизмы индукции, абдукции, дедукции) [28], нейронечеткие системы [33,34] и нейрокомпьютинг, основанный на знаниях [31], модели мягких вычислений [38] и вычислительного искусственного интеллекта [40]. Среди "первых ласточек" в этой области надо, безусловно, указать предложенную еще в 60-е годы XX-го века концепцию интегрированного логико-лингвистического моделированияД.А.Поспелова [17], согласно которой логические средства могут использоваться для обработки информации, представленной в лингвистической форме. В русле этой концепции требуется проведение своего рода "инженерного анализа" естественного языка, причем первым шагом такого анализа является указание в лексике языка групп, несущих определенную функциональную нагрузку при описании тех или иных объектов и ситуаций [18].
В настоящей работе выделяются и рассматриваются четыре основных этапа развития логико-лингвистических моделей в ИИ: 0) предварительный этап (предыстория), связанный с осмыслением основных функций лингвистики и логики в информатике и ИИ; а также с установлением исходных соотношений между логическими и лингвистическими моделями; 1) начальный этап (история), на котором появились интегрированные логико-лингвистические модели, формируемые по схеме "от логики к лингвистике"; 2) современный этап, характеризуемый продвижением в обоих направлениях: как "от логики к лингвистике", так и "от лингвистики к логике"; 3) прогнозируемый будущий этап широкой реализации гибридных лингвологических и логико-семиотических моделей,
2. ОСНОВНЫЕ ПОЛОЖЕНИЯ ТРАДИЦИОННОЙ ЛИНГВИСТИКИ.
СВЯЗИ МЕЖДУ ЕСТЕСТВЕННЫМИ И ИСКУССТВЕННЫМИ ЯЗЫКАМИ
Связи между философией и логикой, психологией и логикой, лингвистикой и логикой всегда были предметом острых споров и дискуссий многих поколений ученых. Но лишь в последние десятилетия ввиду широкого распространения междисциплинарных исследований и разработок, направленных на создание интегрированных систем практически во всех сферах науки и техники, эти обсуждения стали приобретать важное практическое значение. В данном разделе мы остановимся на основных положениях лингвистики как науки об общих законах формирования и развития языка. Особое внимание будет уделено вопросам семантики, т.е. значений и смысла языковых выражений [14].
Cледуя В.В.Налимову [16], будем выделять три основных класса подходов к исследованиям языка: 1) традиционные подходы лингвистики, ограничивающиеся изучением обыденного языка людей; 2) семиотические подходы, рассматривающие язык как одну из знаковых (семиотических) систем; 3) экстралингвистические подходы, в рамках которых рассматриваются нестандартные естественные и искусственные языки, например, генетический код, язык жестов, язык музыки, языки программирования.
В классической лингвистике язык понимается как основное средство передачи информации об окружающем мире [15], т.е. главное значение имеет его денотативная функция. Общепринятыми являются следующие положения [41]: 1) предложения естественного языка (ЕЯ) что-то говорят о мире, - истинное или ложное; 2) cлова (члены) предложения - существительные, глаголы, прилагательные - служат для обозначения объектов, свойств, отношений реального мира; 3) предложение ЕЯ имеет объективный смысл независимо от акта его интерпретации; 4) то, что в предложении говорится о мире, является функцией содержащихся в нем слов и их взаимного расположения.
В целом, для ЕЯ характерны следующие свойства [40]: а) формирование путем последовательного обогащения; б) полисемия (многозначность), связанная с богатством семантической компоненты; в) трудность или невозможность полной формализации.
Любой искусственный язык (ИЯ) создается путем формализации с использованием аксиом и правил построения. В противоположность ЕЯ, где слова наделены некоторым смыслом, символы формального языка не имеют первоначального смысла (последний придается им только в том или ином приложении). Для ИЯ смысл должен быть строго определен посредством методов интерпретации формальных систем.
Каждому предложению ЕЯ могут быть поставлены в соответствие одна или несколько интерпретаций в ИЯ (например, в исчислении предикатов первого порядка), для которого определены правила рассуждений. Таким образом, изучение смысла включает: а) перевод предложений ЕЯ в соответствующие формальные структуры; б) рассмотрение логических правил, связываемых с этими структурами. При этом считается справедливой следующая основная гипотеза: существует система правил (включающая контекстуальные или прагматические соображения), согласно которым предложения ЕЯ могут быть переведены на ИЯ, так что в целом их смысл будет сохранен.
Неклассическая теория языка, получившая название теории речевых актов, была разработана в 60-е годы XX-го века Дж.Остином и Дж.Серлом (см., в частности, [19,32]). В ней речевое общение понимается как разновидность целенаправленного поведения, подчиненного определенным правилам. При этом происходит смещение акцентов от денотативной к конативной функции языка (любая коммуникативный акт преследует некоторую цель).
Интересную мысль о близости семиотики и логики высказал Ч.Пирс, который, рассматривая семиотику как общую теорию знаков, определял ее как "логику в самом общем смысле, формальную доктрину знаковых систем" [20]. Он считал, что "в более узком смысле логика есть наука о необходимых условиях достижения истины. А в более широком смысле, это - наука о необходимых законах мысли, общая семиотика, трактующая не просто истину, а общие условия бытия знаков знаками" [20].
Основным исходным элементом семиотической системы является знак. Знак имеет три аспекта: синтаксис, семантику и прагматику или в других терминах: план выражения, план содержания и план значения [26]. Таким образом, любой язык как семиотическая система существует и развивается в трехмерном пространстве синтактика, семантика, прагматика . Синтактика - это часть семиотики, занимающаяся изучением "внутренних отношений" между знаками. Семантика охватывает сферу отношений между знаками и тем, что они обозначают, а прагматика - сферу отношений между знаками и теми, кто ими пользуется. Следовательно, прагматика учитывает требования конкретного адресата сообщения, в то время как у семантики его нет.
В настоящее время в семантике существуют (согласно У.Куайну). два основных направления: сильная и слабая семантика [14, 22]. Оба направления считают предметом семантики значения единиц языка и языковых выражений, но слово значение понимают по-разному. Лингвистика в основном исследует слабую семантику, а логика - сильную семантику. Cильная семантика как вариант логической семантики занимается рассмотрением интерпретаций логического исчисления в той или иной модели мира. В рамках этого направления описать значение языкового выражения - значит сформулировать правила, по которым можно установить, что соответствует этому выражению в действительном мире (или в некоторой модели мира). Слабая семантикасчитает значения языковых выражений ментальными сущностями, принадлежащими не описываемому миру, а сознанию человека.
Несомненно, общепринятая в логике классическая интерпретация истинности как соответствия высказывания действительности, предложенная еще Аристотелем и развитая Тарским [33], имеет прямое отношение к денотативной функции языка. Можно указать и ряд других интересных фактов влияния естественного языка на формальную логику, например, выделение логических категорий языка, напоминающих грамматические части речи, связь формальной семантики с генеративной лингвистикой Н.Хомского, и др.
Тем не менее, в целом можно утверждать, что на предварительном этапе осмысления связей между логикой и лингвистикой господствовали идеи несовершенства лингвистических моделей, вызванного противоречивостью, неоднозначностью, неточностью конструкций ЕЯ, и необходимости их "очищения" с помощью аппарата формальной логики.
3. ЯЗЫКОВЫЕ ФУНКЦИИ ЛОГИКИ: ОТ ПРЕДСТАВЛЕНИЙ ЛОГИЦИЗМА К ПЛЮРАЛИЗМУ ЛОГИК В ИСКУССТВЕННОМ ИНТЕЛЛЕКТЕ
Одним из главных направлений развития логики во второй половине XX-го века стало ее активное применение в информатике и искусственном интеллекте [11]. Обычно выделяются три "языковые" функции логики в ИИ [32,34]: а) логика как язык представления знаний (суждений, мнений) и формализации рассуждений; б) логика как язык программирования; в) логика какинструмент исследования естественного языка (включая синтаксический и семантический анализ лингвистических моделей, определение правил и норм преобразования фиксированной в языке информации). Раскрывая последнюю функцию, А.А.Зиновьев утверждает, что логика есть наука об искусственных средствах оперирования языком [9]. В этом плане язык можно представлять как множество правил и схем конструирования лингвистических единиц (слов, предложений) вместе со способами осмысливания и интерпретации языковых конструкций.
Многолетняя популярность логических методов в информатике и ИИ объясняется тем, что:
- требуемый результат можно (по крайней мере, принципиально) получить, отправляясь от достаточно простой совокупности начальных сведений (аксиом);
- процесс формализации приводит к понятию логического суждения и рассуждения, которое считается вполне адекватным естественному;
- логические суждения представляют собой сравнительно простые языковые конструкции, о которых осмысленно спросить: истинны они или нет;
- формальные рассуждения строятся с помощью довольно простых и общих правил, которые не зависят от проблемной области, что делает процесс рассуждений доступным для понимания и проверки
- результат формального рассуждения может быть получен как вывод в некотором исчислении, а процесс поиска вывода в исчислении с конструктивными правилами можно легко осуществить с помощью компьютера.
Успехи классической формальной логики привели к тому, что первоначально в качестве ведущего направления разработки математических оснований ИИ утвердился логицизм Б.Рассела и А.Н.Уайтхеда. Согласно представлениям логицистов, "математика является отраслью логики" (см., например, [12,34]). Математические конструкции следует определять в терминах логических понятий. По сути, логицисты стали продолжателями идей платонизма - учения об абсолютности логической (математической) истины.
В рамках логицизма фактически рассматриваются лишь те суждения и рассуждения, которые представимы средствами логических исчислений. Критикуя подобную позицию, В.К.Финн выразил ее следующим образом: "сначала исчисление, а потом рассуждение" [34]. Естественно, эта позиция не могла удовлетворить специалистов по ИИ, понимавших весьма ограниченную практическую применимость "точных и непротиворечивых" знаний, и уже в середине 60-х годов появились работы с новыми постановками логических проблем искусственного интеллекта.
Справедливости ради следует напомнить, что первые бреши в казавшемся целые столетия незыблемом здании аристотелевой логики были пробиты еще в первые десятилетия XX-го века в трудах основоположников многозначных логик Ч.Пирса, Л.Брауэра, Я.Лукасевича, Н.А.Васильева, Х.Маккола и др. Однако в первые десятилетия развития ИИ их результаты оставались невостребованными. И лишь появление основополагающих работ Дж.Маккарти по немонотонным логикам [16], Л.Заде по нечетким лингвистическим логикам на базе лингвистических переменных [8], Д.А.Поспелова по псевдофизическим логикам [22] и семиотическим системам [25] сыграло решающую роль в переходе от абсолютных представлений логицизма к новому взгляду на логику как "эмпирическую науку", тесно связанному с идеями относительности и множественности логик в информатике и интеллектуальных системах.
4. ЛОГИКО-ЛИНГВИСТИЧЕСКИЕ МОДЕЛИ И СИСТЕМЫ
Возникновение концепции плюрализма логик и ее распространение в ИИ привели к формированию нетрадиционных и интегрированных логических моделей, в частности, логико-алгебраических и логико-лингвистических моделей. Появление логико-лингвистических моделей, в первую очередь, связано с именами Л.Заде [8] и Д.А.Поспелова. Так у Л.Заде логико-лингвистические методы описания систем основаны на том, что поведение системы выражается в терминах ограниченного естественного языка и может быть представлено с помощьюлингвистических переменных. Неформально под лингвистической переменной (ЛП) понимается такая переменная, значениями которой могут быть не только числа, но и слова и словосочетания какого-либо естественного или искусственного языка. По сути ЛП представляет собой дескриптивную, иерархическую модель триады "понятие - его значения - их смысл". Формально она описывается набором вида
Нечеткая логико-лингвистическая система описывается набором значений входных и выходных лингвистических переменных, связанных между собой некоторыми эвристическими правилами. В частности, системы нечетких лингвистических рассуждений состоят из пяти функциональных блоков: 1) блока фазификации, в котором осуществляется преобразование исходных числовых физических величин в распределения, соответствующие термам лингвистической переменной, т.е. согласно (1) определяется нечеткое отображение М‾¹: X~>T; 2) базы правил, содержащей набор нечетких "если…,то"-правил; 3) базы данных, в которой определены функции принадлежности нечетких множеств, используемых в нечетких правилах; 4) блока принятия решений, совершающего операции вывода на основании имеющихся правил; 5) блока дефазификации, где происходит переход от дискретной лингвистической шкалы термов T к непрерывной числовой переменной X, т.е. согласно (1) определяется нечеткое отображение М: T ~> X.
В свою очередь, Д.А. Поспелов [25-27] с целью преодоления ряда существенных ограничений формальных систем, таких как: гипотеза о замкнутости мира, статический характер моделей знаний, жесткость интерпретации, монотонность вывода (см. таблицу 1), ввел понятие семиотической системы
Аргументируя в [25] необходимость использования семиотических моделей в ИИ, Д.А.Поспелов отмечает, что "все современные технические устройства работают на досемиотическом уровне, в силу чего они способны моделировать лишь простейшие формы поведения при решении творческих задач. В отличие от технических систем высшие животные и человек решают сложные задачи на семиотическом уровне, что позволяет им находить такие способы решения, которые невозможно реализовать на досемиотическом уровне".
Результаты сравнительного анализа формальных и семиотических систем даны в табл.1 (см. [25]).
Табл.1. Сравнение основных характеристик формальных и семиотических систем
ФОРМАЛЬНЫЕ СИСТЕМЫ | СЕМИОТИЧЕСКИЕ СИСТЕМЫ |
Замкнутые миры | Открытые миры |
Единственная классическая логика | Сосуществование различных логик |
Постоянная интерпретация | Переменная интерпретация |
Статические модели знаний | Динамические модели знаний |
Монотонные рассуждения | Возможность немонотонного вывода |
Нет мультирезолюции | Мультирезолюция возможна |
Согласно Ю.М.Лотману [15], основными вопросами всякой семиотической системы являются, во-первых, ее отношение к миру, лежащему за ее пределами, и, во-вторых, отношение статики к динамике. Развитие семиотических аспектов теории интеллектуальных систем предполагает сдвиг от классического "статического" определения знака к его динамической трактовке. При этом важную роль играет введенный Д.А.Поспеловым метауровень знака, что позволяет включить внутреннюю интерпретируемость действий в знаковые представления и снабдить знаковые системы свойством рефлексии [21].
Как было отмечено Т.А.Гавриловой [4], язык ситуационного управления и близкие к нему по идеям модели в RX-кодах и универсальный семантический код (УСК), по сути, отображавшие объекты и отношения между ними, на десяток лет опередили появление семантических сетей на Западе.
Учет особенностей реальных человеческих понятий, суждений и рассуждений требует создания принципиально новых логико-семиотических средств и теорий. Среди последних можно отметить несколько теорий, появившихся в 90-е годы XX-го века в России: прагматическую теорию неформализуемых понятий [20], квазиаксиоматическую теорию [42], формальную модель понятия [24] и др.
5. ЛИНГВО-ЛОГИЧЕСКИЙ ПОДХОД В ИСКУССТВЕННОМ ИНТЕЛЛЕКТЕ
Термин "лингво-логическая модель" появился в работе В.Б.Силова [27], где рассматривались многомерные модели сложных систем на основе нечеткой лингвистической логики. Здесь этот термин будет использоваться (в ином смысле) для выражения соотношений между естественным языком и языком математической логики, а именно, в плане развития подхода "от лингвистики к логике". Мотивы такого подхода хорошо описал А.В.Гладкий в [5,6]: "Едва ли не все, кто занимался проблемой соотношения между ЕЯ и языком математической логики шли "от логики к языку", рассматривая взаимоотношение между какой-либо единицей языка логики и "соответствующей" единицей естественного языка так, как если бы вторая произошла от первой"…"В действительности же, наоборот, логический язык произошел от естественного; поэтому правильнее идти "от языка к логике", направляя основное внимание на выяснение того, "откуда взялась" та или иная единица логического языка, т.е. какому элементу или элементам естественного языка она отвечает и насколько точно такое соответствие".
Именно такой подход реализовал в русле "инженерного анализа" языка Д.А.Поспелов [24], который представил естественный язык как восьмерку
Среди основных видов отношений в ИИ им были указаны: отношения классификации (класс - пример, элемент - класс), отношения принадлежности, временные отношения, пространственные отношения, причинно-следственные (каузальные) отношения, признаковые отношения, :которые выражают качественные характеристики понятий (иметь признаком, иметь значением), количественные отношения: (выражают такие количественные характеристики понятий как "иметь меру"), прагматические (инструментальные) отношения (служить для, быть средством для, способствовать), отношения сравнения.
Позднее, ученик Д.А.Поспелова Г.С.Осипов [20] на основе лингвистических исследований (отталкиваясь от типологии синтаксем) выделил различные виды семантических связей в языке (генеративная, дестинативная, директивная, комитативная, лимитативная, медиативная, потенсивная и др.) и определил их формальные свойства с помощью аппарата теории отношений.
В дальнейшем подобный подход "от лингвистики к формальным (в частности, теоретико-множественным и интервальным) моделям" был развит в работах А.С.Нариньяни [18,19]. В 1994 г. в докладе "НЕ-факторы и инженерия знаний: от наивной формализации к естественной прагматике" им была изложена концепция НЕ-факторов, которые выражаются словами (лингвистическими этикетками), имеющими негативные оттенки в естественном языке, слабо отражены в классической математике, но оказываются неотъемлемыми характеристиками человеческих знаний. Автор указывал на стратегическое значение исследования НЕ-факторов знаний, которые "ввиду своей универсальности играют ключевую роль не только в структуре реальных знаний, но и в приложениях, относящихся к сфере вычислительной математики" [18].
Были подчеркнуты два принципиально важных для инженерии знаний (и для математики в целом) момента:
- Реальность и наша система знаний о мире устроены совершенно по-иному, чем современные формальные аппараты, призванные эту реальность моделировать и эти знания представлять. Точность, полнота, определенность, непротиворечивость и пр. являются необходимыми атрибутами традиционных формализаций, в то время как для реальных знаний указанные свойства чаще всего являются искусственными и не соответствующими действительности.
- В тех случаях, когда специалисты берутся за создание моделей, отражающих особенности тех или иных свойств данных и знаний, они довольно часто ограничиваются "внешним сходством" формального и реального объектов, не проводя глубокого анализа соответствующих НЕ-факторов
Развитие лингво-логического подхода означает также проведение лингвистического (и экстралингвистического) анализа основных связок, модификаторов, квантификаторов логического языка (см., например,[6,13]). Блестящий пример экстралингвистического (социально-исторического) анализа связки НЕ был дан Д.А.Поспеловым в [30], где он обосновал тезис о множественности операций отрицания на полярных шкалах, их зависимости от факторов эволюции и коммуникации на примере человеческой истории.
6. МНОЖЕСТВЕННОСТЬ ОПЕРАЦИЙ ОТРИЦАНИЯ ПО Д.А.ПОСПЕЛОВУ: СОЦИАЛЬНО-ИСТОРИЧЕСКИЙ, СОЦИАЛЬНО-ПСИХОЛОГИЧЕСКИЙ И ФОРМАЛЬНЫЙ АНАЛИЗ
По мнению С.Л.Франка, отрицание совсем не должно быть отрицаемо, поскольку под этим вторым отрицанием подразумевается чистое уничтожение, как бы бесповоротное и совершенное изгнание отрицания из реальности, как это выражается в жестком принципе "либо, либо". Мы должны, напротив, сохранить положительный онтологический смысл, положительную ценность отрицания.
Отрицание есть не просто отклонение ложных мнений, а есть утверждение реального отрицательного отношения. Мы утверждаем реальность и в форме негативности. Речь идет об относительности всякого противоборства, всякой дисгармонии в бытии. Истинный смысл отрицания заключается в различении: А не есть В означает: А есть нечто иное, чем В.
Аналогично в первой главе своей книги "Моделирование рассуждений, названной "У истоков формальных рассуждений" [30], Д.А.Поспелов, развивая очень важную идею зависимости рассуждений от онтологических допущений о мире, исследовал, как изменяется толкование операции отрицания на оппозиционной (полярной) шкале. В качестве типовых, часто употребляемых примеров были выбраны шкалы "Мы - Они" и "Друг - Враг".
В первом случае им было условно выделено три этапа исторического развития человечества. На первом этапе, когда только произошло образование первобытных орд и племен, индивидуальное мышление всецело сливается с коллективным мышлением. Здесь слово "МЫ" характеризует представителей той общности, к которой принадлежит индивид. Все, кто входят в число "МЫ", живут по одним и тем же законам, в рамках одних и тех же норм или табу. А если кто-то пользуется другими законами, то он оказывается в оппозиции к тому, как надо правильно жить. Он не может принадлежать к "МЫ" и, следовательно, это "НЕ МЫ", а "ОНИ".
Данной ситуации соответствует пара четко разделенных пространств "МЫ" и "НЕ МЫ", свойства которых различны. Это позволяет считать, что "ОНИ" находятся вне наших законов, вне нашего опыта, и им можно приписывать все, что угодно. Возникает форма рассуждения, основанная на этой оппозиции "Кто не с "НАМИ", тот против НАС", которая оправдывается соображениями типа "Они не такие, как "МЫ", и, следовательно, "ИХ" надо уничтожать". Культурная (и подчас географическая) удаленность "ИХ" от "НАС" выражается на полярной шкале "МЫ"-"ОНИ" за счет большого расстояния между полюсами. В результате на этом этапе преобладают отношения полного антагонизма и конфронтации.
Значительно позже, на втором этапе, по мере развития средств коммуникации и появления регулярных контактов между племенами и народами, наступает их сближение. Тогда расстояние между полюсами на оппозиционной шкале постепенно сокращается, т.е. жесткая оппозиция, противостояние "МЫ"-"ОНИ" переходит в более мягкое и возможно регулируемое противоречие. Наконец, при дальнейшем взаимодействии и взаимопроникновении ранее жестко отделенных друг от друга полюсов бинарные шкалы начинают расщепляться, превращаясь сначала в тернарные шкалы, а затем и в шкалы с большим числом градаций.
Кто же такие "ВЫ"? Почему они появляются? Понятие "ВЫ" возникает в зоне контакта между "МЫ" и "ОНИ", причем "ВЫ" служат посредниками между двумя различными общностями: "НАМИ" и "ИМИ". Таким образом, "ВЫ" характеризуют динамику, переход "ИХ" в "НАС" и обратный переход от "НАС" к "НИМ".
Во втором случае, Д.А.Поспелов показал, что различные трактовки операции отрицания НЕ могут быть обусловлены психологическими типами людей, особенностями их восприятия друг друга. В результате анализа различных вариантов интерпретации шкалы "друг - враг" им было установлено, что у различных людей полярные шкалы понимаются и используются по-разному (в частности, подчеркивались гендерные и социальные отличия). Были выделены 4 основных случая: 1) жесткая поляризация, полное противопоставление друзей и врагов, формирование разбиения, которое соответствует классической двузначной логике и принципу исключенного третьего: "Кто не друг, тот враг" 2) абсолютизация друзей и игнорирование врагов, 3)амбивалентность, переплетение друзей и врагов; 4) непонимание, неспособность оценить людей на этой шкале и стремление перейти к какой-то другой системе оценок. ("И не друг, и не враг, а так…").
В [37] был предложен вариант формализации различных видов отрицаний для шкалы "МЫ-ОНИ". Зададим на множестве агентов А разбиение "МЫ"U"ОНИ", "МЫ"∩"ОНИ" =Ø, где "МЫ" = {A+|a A+ и A+А}, "ОНИ" = {A-|aA- и A-А}.
Следуя А.С.Есенину-Вольпину [6], будем считать, что отношения между двумя данными группами описываются логическими правилами деспотического (авторитарного, эгоцентрического) типа "В мире есть только "МЫ" хорошие = A+, а НЕ "МЫ" = "ОНИ" плохие = A-".
Прагматике жесткого оппозиционного НЕ (принцип "кто не с нами, тот против нас") в двухполярном мире соответствует классическое отрицание в двузначной логике. Когда область оценок на полярной шкале есть двузначная решетка L={-1,+1}(A+=+1 и A-=-1), то ¬+1=-1, ¬-1=+1.
В результате контактов между группами агентов может наступить их сближение, когда жесткая оппозиция "МЫ"-"ОНИ"переходит в противоречие. Здесь может использоватьсяинтуиционистское отрицание типа "НЕ "ОНИ" есть "МЫ", но НЕ "МЫ" не есть "ОНИ", т.е. ¬-1=+1, но ¬+1≠-1.
С появлением посредника между двумя различными группами агентов "ВЫ"="МЫ"∩"ОНИ", "ВЫ"≠Ø, имеем A+UA-≠А. Таким образом, каждый агент a из множества "ВЫ" может одновременно принадлежать к разным группам и наделяться с разными степенями противоречивыми свойствами, т.е. понятие "ВЫ" может интерпретироваться как двухосновное нечеткое множество {(а|μA+(a),μA-(a)}.
Наконец, окончательный переход от оппозиции к сосуществованию означает необходимость построения логических правил либерального типа (термин А.С.Есенина-Вольпина): "В мире изначально сосуществуем и "МЫ", И "ОНИ", т.е. А = (А+, A-), причем отрицание "ИХ" есть и отрицание "НАС" и есть нечто отличное от "НИХ" и от "НАС": ¬(А+,A-) =(¬А+,¬A-) =A°. Здесь по мере приближения к полюсам оппозиционной шкалы возникает эффект отталкивания.
В данном случае рассматриваем континуальное множество оценок на оппозиционной шкале L=[-1, +1]. Введем множества строгого уровня Aα=(А+α, A-α), -1<α<+1. Тогда A+α={a|μA+(a)>+α}интерпретируем как множество агентов, которых со степенью большей можно отнести к "НАМ", а A-α={a|μA-(a>+α}- как множество агентов, которых со степенью меньшей -α можно отнести у "НИМ". Область сосуществования (носитель контактов) между двумя группами агентов есть интервал [-α, +α]. Обозначим для простоты μA(a)=x. Для подобных ситуаций можно определить следующую операцию порогового отрицания:
7. ОТ ЛИНГВИСТИЧЕСКИХ ПЕРЕМЕННЫХ К ВЫЧИСЛЕНИЯМ СО СЛОВАМИ
Ключевой аспект ВС заключается в объединении обработки естественных языков и вычислений с нечеткими переменными. Это объединение - результат эволюции ВС в основополагающую методологию со своими правилами, широкими разветвлениями и приложениями.
Начнем наше объяснение ВС с некоторых определений. Понятно, что они предварительные и допускают исключения.
Как было установлено ранее, понятие, играющее ведущую роль в ВС есть гранула. Чаще всего гранула есть нечеткое множество точек, связанных сходством. Слово может быть атомарным(молодой) или составным (не очень молодой), как показано на Рис. 1.
8. ЛИНГВОЛОГИЧЕСКИЙ ПОДХОД: ЧТО ДАЛЬШЕ?
На наш взгляд, в ближайшем будущем все более широкое распространение в ИИ получат интегрированные, гибридные, синергетические подходы и модели. Среди них важную роль станут играть интегрированные лингвологические подходы и модели, ориентированные на тесное взаимодействие и взаимопроникновение методов и средств лингвистики и логики. Следует ожидать формирования и развития лингвологических (лингвоалгебраических, лингвологикоалгебраических, нейрологиколингвистических и т.п) процедур моделирования НЕ-факторов, которые могут включать следующие основные этапы [38]: 1) анализ сходства и различия между различными НЕ-факторами в ЕЯ, спецификация выбранного НЕ-фактора (группы НЕ-факторов); 2) выбор базовой модели описания НЕ-фактора (например, интервал, решетка, бирешетка, нечеткое множество, мера нечеткости и пр.); 3) подбор соответствующей логики; 4) идентификация классов операций логики (в первую очередь, классов отрицаний), зависящих от онтологии; 5) реализация процедур логического вывода и аргументации.
В более широком контексте, будет разрабатываться общая семиотикологическая методология ИИ, опирающаяся на следующие основные принципы.
- Принципы логического плюрализма, локальности и релятивизма (в частности, принцип множественности адекватных логических операций).
- Принцип учета тесной взаимосвязи между логикой и онтологией.
- Принцип взаимодополняемости различных теорий истины (теории соответствия, теории когерентности, теории полезности), а также дополнения истинности рядом других категорий.
- Принцип широкого использования неклассических (в частности, многозначных, бирешеточных, нечетких) семантик
- Принцип разнообразия семиотических систем и моделей.
- Принцип лингво-логико-алгебраического моделирования НЕ-факторов как весьма конструктивного механизма развития (в частности; принцип адекватного представления мягких оценок, мнений и рассуждений).
- Принцип единого алгебраического представления лингвологических структур с помощью расширенных логических и логико-семиотических матриц.
8.1. Формирование гибридных семиотических систем
Легко понять, что семиотическую систему в смысле Д.А.Поспелова (2) можно задать в виде
где {FS} - множество формальных систем, а М = {Mi}- семейство моделей модификации формальных систем.
В общем случае, формулу (6) можно естественным образом проиллюстрировать с помощью двухуровневой структуры, в которой на нижнем уровне расположены формальные системы, а на верхнем - различные модели, с помощью которых проводятся их модификации (рис.2).
Отсюда видны различные пути развития идеи семиотической системы согласно Принципу 5 в духе схождения и взаимодействия основных направлений ИИ и построения соответствующих гибридных структур:
- эволюционные семиотические системы [35,36], когда на втором уровне при изменении компонентов формальной системы используются эволюционные модели, в частности, эволюционные стратегии или генетические алгоритмы;
- нейросемиотические системы, в которых изменения компонентов формальной системы связаны с использованием алгоритмов обучения нейронных сетей;
- алгебраические семиотические системы (по Дж.Гогену);
- нечеткие семиотические системы управления [2], в которых нечеткие формальные системы рассматриваются вместе с правилами изменения их компонентов, основанными на расширенных операциях над нечеткими множествами.
8.2. От логической матрицы к логико-семиотической матрице
Для раскрытия принципа 7 напомним определение логической матрицы Тарского
Для раскрытия принципа 7 напомним определение логической матрицы Тарского
где V есть непустое множество значений истинности;Ω- множество операций над значениями истинности υ из V;DV - множество выделенных значений истинности.
Очевидно, что логическая матрица (5) может быть представлена в виде пары
где UA - универсальная алгебра с сигнатурой Ω. Иными словами, логическая матрица задает алгебраическое представление логики.
Отметим, что в логической матрице Тарского предполагается возможность получения истинностной оценки высказывания вне зависимости от контекста, от условий оценки.
Алгебраическое представление булевой логики имеет вид
где {0,1}-множество, состоящее из двух значений истинности; {1}-выделенное значение истинности;¬- одноместная, а ∩,U,-> суть двухместные операции над значениями истинности (отрицание, конъюнкция, дизъюнкция, импликация соответственно).
Примером расширения классической логической матрицы (8) является логическая матрица для произвольной модальной логики (- сильный положительный модальный оператор)
а примером переосмысления (8) - логическая матрица для нечеткой логики, основанной на треугольных нормах T и треугольных конормах S
где n -некоторая операция отрицания, например n(x)=1-x,x[0,1], а I(x,y)=S(n(x),y), x,y[0,1].
Итак, возможны следующие основные пути модификации классической логической матрицы (8) [39].
- Описание обобщенных значений истинности в интервале [0,1], решетке, бирешетке.
- Допущение нечетких и лингвистических значений истинности, т.е. применение лингвистической переменной ИСТИННОСТЬ [Заде,1976].
- Функционально-аксиоматическое задание операций над значениями истинности.
- Рассмотрение не одного, а двух и более выделенных (квазивыделенных) значений истинности.
- Применение логических (псевдологических) матриц для анализа не только описаний, но и предписаний, оценок, норм.
Следует отметить, что все эти пути 1.-5. модификации логической матрицы (8), как впрочем и схемы интерпретации модальных и нечетких логических систем (9-10), изложенные выше, по сути, сохраняют общий вид логической матрицы Тарского, расширяя те или иные ее компоненты: (само понятие истинности, множество значений истинности, понятие выделенного значения, определения операций над значениями истинности). Ниже описывается вариант переосмысления алгебраической интерпретации логики, связанный с попыткой представления зависимости вида логики от онтологических предпосылок с помощью логико-семиотической матрицы.
Подобно тому, как понятие семиотической системы было введено Д.А.Поспеловым с целью обобщения понятия формальной системы на случай открытых и динамических сред, логико-семиотическая матрица (ЛСМ), опирающаяся на идею логического пространства Л.Витгенштейна (см. [4]), а, в более общем плане, на концепцию семиотического пространства Ю.М.Лотмана [16], призвана показать контекст построения и область применимости описываемой логики. В качестве образующих логического пространства могут выступать типы атомарных логических предложений (оси трехмерного логическое пространство Н.А.Васильева), типы рассуждений, соответствующие различным режимам мышления (пространство А.С.Есенина-Вольпина), возможные миры, и пр.
Логико-семиотической матрицей называется система
где E - множество сред (семиотических пространств), служащее для моделирования отношений между логиками и онтологиями; V - множество логических значений ( значений истинности или прескриптивных оценок); Ω-множество операций над логическими значениями из V; D-множество выделенных (квазивыделенных) логических значений.
Таким образом, здесь отражается идея погруженности логик в различные среды и концепция сосуществования различных логических семантик в семиотической системе.
8.3. Мягкие оценки и интегральные мнения
Будем считать жесткими такие оценки, которые принимают значения на булевых шкалах. Тогда под мягкой оценкой в широком смысле понимается любая многозначная, нечеткая или лингвистическая оценка, пронизанная НЕ-факторами.
Мягкая оценка в узком смысле содержит НЕ-факторы нескольких (по крайней мере, двух) типов [40]. В частности, мягкая оценка объекта x на полярной шкале может быть представлена в виде μ={(μA+,μА-)}, где μA+ и μА- нечеткие множества, характеризующие лингвистические оценки одновременного проявления положительного свойства A+ и отрицательного свойства А-.
В общем случае, мягкие лингвистические оценки на шкалах описываются в виде SE=mM (X есть сС), где С - некоторое ограничение на значение переменной X, c-внутренний модификатор, характеризующий неточную лингвистическую оценку этого ограничения (например, с есть модификатор "очень" в оценке величины сС ="очень большая"), M - модальность, выражающая показатель неопределенности этой оценки (например, "возможно", "вероятно", "желательно" и пр.), m - внешний модификатор (например, "весьма", "довольно"). В случае полярных шкал имеем противоречивые мягкие оценки вида SE* = mM (C есть m1A+ И m2A-), где A+ и A- - положительная и отрицательная оценки, а m1 и m2 - соответствующие модификаторы.
Подобные мягкие оценки можно положить в основу инженерии индивидуальных и коллективных мнений, которые занимают промежуточное положение между знанием и незнанием и не могут быть общезначимыми. В отличие от инженерии знаний в инженерии мнений центральное место занимают процедуры описания НЕ-факторов и их взаимопревращений.
Определение 1. Интегрированной мягкой оценкой (ИМО) называется любое оценочное суждение, содержащее одновременно НЕ-факторы различных типов (например, неточность и неуверенность, или противоречие и неопределенность) и выражаемое словесно, с использованием качественных градаций
Канонический пример ИМО есть: mM(X is аA), где
A - простая (атомарная) лингвистическая оценка (свидетельство), например, "дешевый";
А - модификатор (например, "очень"),
аA - составная лингвистическая оценка 1 (например, "очень "дешевый");
CF - показатель уверенности (неуверенности), например, "возможно" "вероятно", "правдоподобно";
M CF - составная лингвистическая оценка 2 ("вполне вероятно", "мало правдоподобно").
Типичный пример интегрированной мягкой оценки: "вполне вероятно, что к Новому году доллар станет немного дешевле"
Предположим, что множество высказываний S состоит из множества истинностных суждений Sv и множества суждений с модальностями Sm: S = SvUSm.
Будем представлять истинностное суждение в виде пары: sv=(p,v(p)), svSv, где v(p) - функция мультиоценки (в смысле Дж.Данна) истинности высказывания pP, v:P->V4, V4 ={T,F,B,N}. Здесь T - "истина", F -"ложь", B - "истина и ложь одновременно" (противоречие), N - "ни истина, и ни ложь" (полная неопределенность).
Согласно Н.Белнапу, четыре истинностных значения из V4 образуют логическую решетку L4 или аппроксимационную решетку А4 (получаемую в результате поворота логической решетки на 90 градусов. В то же время, определив на множестве V4 два различных отношения порядка (порядок истинности t и порядок информативности i) вместе с условием связи между ними в виде унарной операции ¬, такой что: 1) если ptq, то ¬pt¬q; 2) если piq, то ¬pi¬q; 3)¬¬p=p, p, qP, получаем представление четырехзначной семантики в виде простейшей бирешетки 22 =4 [13,14]. Ее представимость в виде двойной диаграммы Хассе вытекает из выполнения условий FtBtT, FtNtT и NiTiB, NiFiB. Отметим, что в случае бирешетки 4 условие связи между порядками t и I выражается через отрицание Белнапа
Теперь рассмотрим аналогичный вариант описания различных классов модальностей с единых позиций. Возьмем в качестве двух базовых характеристик любой модальности ее "знак" и "силу". По аналогии с V4 имеем в простейшем случае четырехзначное множество модальностей М4={L, U, W, Y}, где L-сильная положительная модальность; U - слабая положительная модальность, W - слабая отрицательная модальность, Y - сильная отрицательная модальность.
Таким образом, любое модальное суждение можно также представить в виде пары: sm= (p, m(p)), smSm, где m(p) - функция модальной мультиоценки высказывания pP, m:P->M4, M4 ={L, U, W, Y}.
Тогда норму как предписание к действию можно выразить четверкой NR = (AG, act, M4, W), где АG - множество агентов, которым адресована норма; actACT-действие, являющееся объектом нормативной регуляции (содержание нормы), W - множество миров, в которых применима норма (условия приложения, обстоятельства, в которых должно или не должно выполняться действие);.М4={L, U, W, Y}- множество базовых модальностей, связанных с действием act: здесь L - "обязательно", U - "разрешено", W - "необязательно", Y- "запрещено".
Путем соединения двух подобных моделей sv и sm получаем интегральную модель мнения агента в виде тройки bel (p)=(p,v(p),m(p)), где pP, v:P->V4, m:P->M4, V4 ={T,F,B,N}, М4={L,U,W,Y}. В частном случае, когда имеем V2={T, F} и М2={L,W}, интерпретация предложенной модели мнения агента сводится к четырем модализированным значениям истинности по Н.Решеру: LT - "необходимая истина", WТ - "случайная истина", WF - "случайная ложь", LF - "необходимая ложь". Отметим, что в четырехзначной логике Решера имеются два выделенных значения: LT и WТ.
Вернемся к представлению модальностей на координатной плоскости. На оси абсцисс обозначим единицей модальность положительного знака, а нулем - модальность отрицательного знака. Аналогично по оси ординат обозначим единицей сильную модальность, а нулем - слабую. Перейдем к соответствующему двухкоординатному описанию модальностей в единичном квадрате: L = (1,1), U = (1,0), Y = (0,1), W = (0,0). Такая интерпретация позволяет развивать общий подход к описанию модальностей различных классов в теории агентов (см. табл.2).
Табл.2. Примеры модальностей, рассматриваемых в теории агентов
Модальные характеристики разных классов имеют общие формальные свойства. Независимо от того, к какой группе относятся модальности, они определяются друг через друга по одной и той же схеме. В частности,
¬L=W (отрицание сильной положительной модальности есть слабая отрицательная модальность), ¬W=L (отрицание слабой отрицательной модальности есть сильная положительная модальность), ¬U=Y (отрицание слабой положительной модальности есть сильная отрицательная модальность), ¬Y =U (отрицание сильной отрицательной модальности есть слабая положительная модальность. Характерными примерами интерпретации этих модальностей являются связи между слабой нормой и сильной антинормой ("то, что не разрешено, запрещено") и наоборот ("то, что не запрещено, разрешено").
Другие определения связей между модальностями: U=LUW (cлабая положительная модальность выражается как дизъюнкция сильной положительной и слабой отрицательной), а W =¬L∩¬Y=¬(LUY) (слабая отрицательная модальность есть антидизъюнкция сильной положительной и сильной отрицательной модальности).
Зададим на произвольном непустом конечном множестве модальностей M два различных отношения порядка l и u следующим образом: p, qP, p =(x1, y1), q=(x2, y2), plq x1x2 и y1y2; p, qP, p=(x1,y1), q =(x2,y2), puq x1x2 и y1y2. Интерпретации этих двух порядков могут быть различными, например, порядок сильной нормы и порядок слабой нормы, порядок необходимости (определенности) и порядок возможности, порядок уверенности и порядок предположения и пр. В частности, для М4 имеем WlYlL, WlUlL и YuWuU, YuLuU.
Математическая структура (M,l,u) является биупорядоченным множеством, поскольку здесь M есть непустое множество, аl и u - два различных отношения порядка, причем упорядоченные множества (M,l) и (M,u) образуют полные решетки. Двум различным отношениям порядка соответствуют различные пары решеточных операций , и ∩ и U.
Литература
- Аверкин А.Н., Батыршин И.З., Блишун А.Ф. и др. Нечеткие множества в моделях управления и искусственного интеллекта/ Под ред. Д.А.Поспелова. - М.:Наука, 1986.
- Аверкин А.Н., Головина Е.Ю. Нечеткая семиотическая система управления// Интеллектуальное управление: новые интеллектуальные технологии в задачах управления. - М.: Наука, Физматлит, 1999. - С.141-145.
- Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах/ Под ред. В.Н.Вагина, Д.А.Поспелова. - М.: Физматлит, 2004.
- Вригт фон Г.Х. Логико-философские исследования. Избранные труды: Пер. с англ. - М.: Прогресс, 1986.
- Гаврилова Т.А. Логико-лингвистическое управление как введение в управление знаниями // Новости искусственного интеллекта. - 2002. - №6. - С.36-40.
- Гладкий А.В. Некоторые соображения о взаимоотношении между естественным языком и языком математической логики// Семиотика и информатика. Вып.12. Методы логики в проблемах искусственного интеллекта и информатики. - М.: ВИНИТИ, 1979. - С.182-184.
- Гладкий А.В. О значении союза ИЛИ// Семиотика и информатика. Вып.13. - М.: ВИНИТИ, 1979. - С.196-214.
- Есенин-Вольпин А.С. Избранное. - М.: РГГУ, 1999.
- Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений: Пер. с англ. - М.: Мир, 1976.
- Зиновьев А.А. Очерки комплексной логики. - М.: Эдиториал УРСС, 2000.
- Кандрашина Е.Ю., Литвинцева Л.В., Поспелов Д.А. Представление знаний о пространстве и времени в системах искусственного интеллекта. - М.: Наука, 1988.
- Карпенко А.С. Современные исследования в философской логике// Логические исследования. Вып.10. - М.: Наука, 2003. - С.61-93.
- Клини С.К. Введение в метаматематику: Пер с англ. - М.: ИПЛ, 1957.
- Клини С.К. Математическая логика: Пер с англ. - М.: Едиториал УРСС, 2005.
- Кобозева И.М. Лингвистическая семантика. - М.: Эдиториал УРСС, 2000.
- Лотман Ю.М. Семиосфера. - Санкт-Петербург: Искусство-СПб, 2000.
- Маккарти Дж., Хайес Р. Некоторые философские проблемы в задаче построения искусственного интеллекта // Кибернетические проблемы бионики. - М.: Мир, 1973. - С. 40-87.
- Налимов В.В. Вероятностная модель языка. - М.: Наука, 1979.
- Нариньяни А.С. НЕ-факторы и инженерия знаний: от наивной формализации к естественной прагматике// Сборник трудов IY-й Национальной конференции по ИИ (КИИ-94, Рыбинск, сентябрь 1994 г.). Т.1. - Тверь: АИИ, 1994. - С.9-18.
- Нариньяни А.С. НЕ-факторы 2004// Сборник трудов IX-й Национальной конференции по ИИ (КИИ-2004, Тверь, сентябрь 1994 г.). Т.1. - М.: Физматлит, 2004. - С.
- Непейвода Н.Н. Первые шаги к теории неформализуемых понятий// Логические исследования. Вып.1. - М.: Наука, 1993. - С.34-45.
- Осипов Г.С. Приобретение знаний интеллектуальными системами. - М.: Наука, 1997.
- Осипов Г.С. От ситуационного управления к прикладной семиотике// Новости искусственного интеллекта. - 2002. - №6.- С.3-7.
- Пирс Ч. Избранные философские произведения. - М.: Логос, 2000.
- Плесневич Г.С. Понятийно-ориентированные языки в инженерии знаний//Новости искусственного интеллекта. - 2003. - №6. - С.3-9.
- Попов Э.В. Общение с базами данных на ограниченном естественном языке: прошлое, настоящее, будущее// Новости искусственного интеллекта. - 2002. - №1. - С.11-26.
- Попов Э.В. Общение с ЭВМ на естественном языке. - М.: Едиториал УРСС , 2004.
- Поспелов Д.А. Системный подход к моделированию мыслительной деятельности// Проблемы методологии системного исследования. - М.: Мысль, 1970. - С.333-358.
- Поспелов Д.А. Логико-лингвистические модели в системах управления. - М.: Энергоатомиздат, 1981.
- Поспелов Д.А. Ситуационное управление: теория и практика. - М.: Наука, 1986.
- Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. - М.: Радио и связь, 1989.
- Поспелов Д.А., Осипов Г.С. Прикладная семиотика// Новости искусственного интеллекта. - 1999. - №1. - С.9-35.
Комментариев нет:
Отправить комментарий