Очевидно, недостаточно резких, кардинальных, взаимоисключающих, крайних суждений о высказываниях, подразделяющих их на истинные и ложные. Жизненный опыт говорит, что стопроцентной правды не бывает.

Таким образом, необходимо ввести понятие достоверности высказывания, которая идеально представляет вероятность того, что данное высказывание о свершении события истинно, т. е. представляющая его логическая переменная равна 1.

В этой оценке достоверности вновь практически преобладает субъективный фактор. Поэтому при построении экспертных систем применяется двойная оценка: оценка, данная экспертом по запросу, и вес самого эксперта. Здесь эффективно используется аппарат нечетких множеств.

Говоря о сложных высказываниях, отображаемых деревьями логических возможностей , тем более трудно судить о достоверности высказывания о событиях , особенно тех, которые отображаются концевыми вершинами.

Пример. Информатор сообщает Агенту о том, что видел своими глазами, как Объект 1 передал Объекту 2 пачку денег. Напрягая богатый опыт, Агент рассуждает логически:

1. Насколько можно доверять Информатору, который три дня не мылся и от которого дурно пахнет?

2. Мог ли находиться Информатор в это время в нужном месте, чтобы "видеть своими глазами"?

3. Насколько верно то, что в переданной пачке были деньги?

4. Можно ли оперативно воспользоваться существующими математическими методами оценки (например, аппаратом нечетких множеств) заодно учитывающими другие факторы, как, например, личные финансовые затруднения, или необходимые оценки следует выполнить интуитивно, "с потолка"?

5. Так какова же должна быть формулировка отчета в Центр, для получения максимального вознаграждения за поимку взяточника?

Таким образом, видно, что оценка достоверности высказываний неизбежна, но представляет значительные практические трудности, тем более, — при требуемой оперативности этих оценок, столь важной в реальных системах управления и принятия решений.

Итак, на основе алгебры высказываний можно создавать электронные системы принятия решений: на входе задавать ситуацию, на выходе получать указание на правильную реакцию. Все дело лишь в интерпретации предметной области – во вскрытии причинно-следственных связей, в исследовании личного или коллективного опыта, в изучении теории. Необходимы и схемотехнические навыки запоминания связей.

Однако смущают два обстоятельства:

1. Неопределенность исходной информации о ситуациях, исключающая точный ответ на вопрос о наличии или отсутствии события и делающая неправомерным использование исключительно булевых переменных. Высказывания не бывают истинными и ложными, как это предполагается в классической математической логике. Высказывания оцениваются своей достоверностью, которая принимает действительные значения на отрезке [0, 1], и подчиняется известным положениям теории вероятности.

2. Способность человека логично мыслить на неформальном уровне не реализуется с помощью конъюнкторов и дизъюнкторов в составе мозга. Именно вскрытие механизмов мышления, особенно того, которое мы называем рефлекторным, привлекает внимание исследователей. Необходимо искать механизмы мышления, оперирующие не с булевыми переменными, а с действительными, несущими смысл достоверности.

Пусть рассмотренные выше переменные-высказывания ${x_i}$ , образующие факторное пространство, могут принимать значения достоверности ${P_i}, 0 \le P_i \le 1,\ i = 1, …, M.$

Так как факторное пространство формируется на основе исчерпывающих множеств событий , то внутри каждого такого множества выполняется известное правило нормировки: сумма достоверностей событий каждого такого множества равна единице.

Перегруппируем события и дополним дерево логических возможностей , представленное на рис.3.1, указав на его ветвях (стрелках), в качестве весов этих ветвей, значения достоверности событий (рис.3.5). Получим вероятностное дерево логических возможностей].

При организации ветвления в этом дереве также предполагаются все возможные альтернативы, т. е. исчерпывающие множества событий . Поэтому сумма вероятностей всех событий, отображаемых вершинами, которые связаны входящими стрелками, исходящими из некоторой вершины, равна единице.

В отличие от дерева логических возможностей , вероятностное дерево явно отображает зависимость событий. События, зависимые от данного, отображаются более низкими уровнями ветвления. Такая зависимость определяется на уровне смыслового анализа факторного пространства.

Вероятностное дерево логических возможно

Рис. 3.5. Вероятностное дерево логических возможностей

Например, логично предположить, что формы труда, отдыха и спортивных развлечений зависят от времени года, затем, — от распорядка приема пищи. Такая зависимость и отображается на рис.3.5.

Тогда достоверность событий формируется с помощью условных вероятностей, зависящих от путей, по которым достигаются эти события. Поэтому на вероятностном дереве логических возможностей целесообразно повторять вершины одного смыслового содержания, в результате чего размножаются варианты ветвления, а дерево существенно разрастается. От совмещения путей страдает наглядность, и не более того.

Чтобы найти вероятность некоторого события b при условии свершения события а (событию а может соответствовать корневая вершина, тогда речь идет о полной, а не условной вероятности), необходимо найти все пути, ведущие из a в b. По каждому пути необходимо перемножить все веса ветвей. Полученные по всем путям произведения необходимо сложить.

Пример. Найдем вероятность того, что отдыхающий весной и летом в произвольно выбранный момент времени совершает прогулку верхом:

$0,25\times0,33\times0,5\times0,4 + 0,25\times0,33\times0,3 = 0, 04125.$

Пример. Найдем вероятность того, что в произвольно выбранный момент времени в течение года отдыхающий совершает прогулку верхом:

$0,25\times0,33\times0,5\times0,4 + 0,25\times0,33\times0,3 + 0,25\times0,33\times0,2 = 0,05775.$

4.6. Система принятия решений на основе высказываний

Изменения, внесенные в дерево логических возможностей и представленные на рис.3.5, отобразим в электронной схеме системы принятия решений, представленной на рис.3.4. Теперь исходными данными (рис.3.6) для конъюнкторов и дизъюнкторов, принимающих эти данные, становятся не булевы, а действительные значения, для которых логические операции не определены. Так перейдем к понятию нечеткой логики.

Система принятия решений на основе достоверности событий

Рис. 3.6. Система принятия решений на основе достоверности событий

Следуя далее по пути приблизительных оценок (ибо практически достоверность, как категория теории вероятностей, принадлежит области весьма приблизительных оценок), разработаем некоторый суррогат операций конъюнкции и дизъюнкции на основе передаточной функции или функции активации некоторого порогового элемента. Этот элемент преобразует сумму входных величин в выходные значения, которые приближенно "напоминают" результаты упомянутых логических операций. Данный путь – путь ухода от точного выбора решения в сторону выбора решения на основе степени похожести ситуаций на уже известные, — путь ассоциативного мышления. Так мы перейдем к рассмотрению тех нейроподобных элементов, что реализованы в природе.

Существует множество вариантов подбора пороговой передаточной функции, или функции активации, лежащей в основе такого элемента.

Введем сквозную нумерацию всех узлов схемы, реализующих дизъюнкцию и конъюнкцию. Пусть i – номер такого узла, j – номер входа этого узла при количестве Тi активных входов (в данном примере каждый узел имеет два входа), $\omega_j$ – вес входа. Тогда простейшая функция активация f_i , реализуемая i - м узлом для замены логических операций конъюнкции и дизъюнкции, имеет вид

$f_i = \begin{cases} \sum \limits_{j=1}^m {V_j \omega_{i},\ &если \sum \limits_{j=1}^{m_i} {V_j \omega_{j} - h \ge 0\\ 0,\ &в\ противном\ случае \end{cases}$

(3.6)

Здесь f_j — величина сигнала, поступающая на j - й вход.

Тогда элемент N_1 , подобный конъюнктору, может быть реализован при $\omega_j = 1/m_i, j =1, …, m_i$ , с помощью существенно высокого порога (рис.3.7), где значение $\delta_i$ обусловлено некоторой поправкой, достаточной, чтобы для преодоления порога сигналы возбуждения с большой степенью уверенности поступали обязательно по всем входам.

Элемент N1

Рис. 3.7. Элемент N1

На этапе настройки и верификации СПР предполагается, что входные сигналы есть булевы переменные, принимающие значения 0, 1. Тогда, целесообразно выбрать значение $\delta_i < 1/m_i$ . Очевидно, что для того, чтобы преодолеть порог, на всех входах должны быть "1"; недостаток хотя бы одной "1" приведет к тому, что сумма поступивших сигналов будет более чем на меньше указанной суммы весов.

При переходе к действительным переменным, когда вместо событий рассматриваются, например, лишь предполагаемые вероятности их наступления, экспериментальное уточнение значения $\delta_i$ может обусловить ту границу, когда считаться с возможностью данной комбинации событий нецелесообразно.

Элемент N_2 , подобный дизъюнктору, реализуется, наоборот, при низком значении порога и при $\omega_j = 1, j = 1, …, m_i$ (рис.3.8). Порог выбирается так, чтобы уже при возбуждении на одном входе возникал сигнал возбуждения на выходе. При этом если дизъюнкция задана на исчерпывающем множестве событий, как это чаще всего бывает (рис.3.4), сигнал на выходе не превышает "1", а значение $\delta_i$ выбирается экспериментально достаточно малым.

Элемент N2

Рис. 3.8. Элемент N2

Задав на входе СПР значения достоверности переменных - высказываний и рассчитав значения на выходах пороговых элементов, на выходах схемы получим некоторые значения. Максимальное из этих значений "голосует" в пользу соответствующего решения.

Предложения, касающиеся создания пороговых элементов и , носят лишь рекомендательный характер. Здесь неограниченный простор для творчества.

Напомним, что корректность задания исходной информации (соблюдение условия нормировки на исчерпывающих множествах событий, оценки достоверности с помощью вероятностного дерева логических возможностей) гарантируют практически приемлемый результат. Если же на входах задавать что угодно, то СПР преобразует это в какую угодно рекомендацию по принципу: "каков вопрос — таков и ответ".

На рассмотренном жизненном примере проанализируем принимаемые бабушкой решения на основе двух вариантов СПР: с помощью электронной схемы (рис.3.4), использующей определенность знания о ситуации, и с помощью схемы, основанной на неопределенности, на предполагаемой достоверности этих знаний (рис.3.6). Положим (на основе интуиции) $\delta_i$ = 0,3 для всех i.

Данные сведены в таблицу 3.1.

Таблица 3.1. Сравнительные оценки получаемых решений
Переменные	Решение по электронной схеме	Решение на основе достоверности событий

1				1
	1			1		1
1		1					Нет решения	Нет решения
0,8	0,2			0,4	0,5		Решение не определено
0,2	0,4	0,6	1			0,5	Решение не определено

Более точный выбор значения $\delta_i$ производится на этапе верификации СПР по известным вариантам нахождения решения. В данном случае представляется, что этот выбор произведен успешно.

4.7. Минимизация длины логической цепочки

Отметим, что замена логических операции операцией суммирования при счете передаточной функции приводит к актуальности однократного учета всех входящих переменных, т. е. к единственности вхождения переменных в каждое логическое выражение, составляющее описание системы принятия решений. Выше с целью обеспечения такого единственного вхождения переменной был использован прием размножения решений .

При разработке электронных схем исследуется понятие "длина логической цепочки" — под ней подразумевается максимальное количество электронных элементов, которое должен преодолеть сигнал на входе схемы, пройдя последовательное тактируемое преобразование, чтобы на выходе схемы сформировался сигнал. От этой длины, определяющей время переходного процесса, зависит быстродействие схемы. Поэтому актуальной задачей является минимизация максимальной длины логической цепочки при возможности параллельного выполнения всех таких цепочек (что характерно для прохождения электрического сигнала по схеме).

Очевидно, что в схеме на рис.3.4 максимальная длина логической цепочки равна двум.

Применим ко всем выражениям (3.5), каждое из которых является или может быть преобразовано в дизъюнкцию конъюнкций (прием размножения решений) . Теперь (рис.3.9) схема состоит из цепочек единичной длины. Каждый входной сигнал подвергается обработке только конъюнктором. Так как электронная схема полностью определяет конструкцию системы принятия решений на основе достоверности событий, то можно преобразовать полученную электронную схему в однослойную схему СПР, показанную на том же рисунке.

Таким образом, доказано следующее утверждение:

Любая СПР, сформированная на основе логического описания булевыми функциями, способом размножения решений преобразуется в однослойную СПР на основе достоверности событий.

Преимуществом таких СПР является то, что они представляют собой таблицы с ассоциативной выборкой по принципу наибольшей похожести.

Конечно, можно за каждым решением закреплять один выход СПР, на котором объединить общее решение, полученное по разным путям, в виде текста. При корректно заданных исходных данных – на основе правил использования исчерпывающих множеств событий – СПР будет "работать" правильно, выдавая адекватные ответы. Тогда рекомендация "Прими решение R" будет выдана, а информация о пути, приведшему к этому решению, будет утрачена.

Преобразование электронной схемы с единичной длиной логической цепочки в однослойную систему принятия решений

Рис. 3.9. Преобразование электронной схемы с единичной длиной логической цепочки в однослойную систему принятия решений

При составлении "электронной" схемы такое объединение производится с помощью операции дизъюнкции, что приводит к длине логической цепочки, равной двум. Но ведь если, формируя структуру СПР, строго следовать порядку построения "электронная схема $\to$ система принятия решений", то и СПР будет иметь максимальную логическую цепочку с длиной, равной 2.

Таким образом, размножение решений – операция, целесообразность которой свойственна СПР, что делает ее построение отличающимся, развивающим "схемотехнический" подход. "Электронные" схемы целесообразно использовать на начальном этапе исследования логического описания СПР, а далее, оттолкнувшись от них, перейти к более совершенной однослойной структуре.

Размножение решений имеет важное достоинство. Оно позволяет установить причину, найти объяснение принимаемого решения. Это означает, что текст решения может быть дополнен указанием причины принятия именно такого решения.

Например, получив информацию о необходимости заказа велосипеда в отделе спортинвентаря, Хможет воспользоваться и важным объяснением: "… потому что сейчас, скорее всего, весна, а Вы, вероятно, только что сытно позавтракали" (рис.3.10).

Таким образом, построен алгоритм параллельных (бесформульных) вычислений [5] сложных логических конструкций в области действительных переменных, предназначенный для реализации высокого быстродействия в системах управления и принятия решений. Более того, сведение СПР к однослойной нейронной сети приводит к применению лишь тех передаточных функций (элементов на рис.3.6 и 3.9), которые имитируют конъюнкторы. Это служит повышению достоверности оценок, стандартизации и адекватности природным процессам.

От логических операций совершен переход к их некоторым суррогатам на основе передаточной функции. Операционной основой этой функции является сложение взвешенных сигналов на входе. Логические переменные оказались замененными действительными – достоверностью высказываний.

Логическая нейронная сеть БАБУШКА

Рис. 3.10. Логическая нейронная сеть

Изображая передаточную функцию буквой N, и уже назвав ее функцией активации, мы предварительно подразумеваем нейрон, нейроподобный элемент - исполнитель этой функции активации, способный участвовать в образовании, подобно кирпичику, сложных сетевых структур. Теперь мы можем на рис.3.9 заменить квадратики кружочками, подразумевая нейроны, как это было сделано в разделе 2.3, и теперь отображено на рис.3.10.

При этом функции активации являются простейшими (монотонно возрастающими по каждому сигналу на входе). Как говорилось выше, операция сложения взвешенных сигналов на входе является основой такой функции. Практически всегда весами являются "нули" или "единицы".

В данном примере можно рекомендовать функцию активации:

$V_i = \begin{cases} \sum \limits_{j} {V_j - h,\ &если\ \sum \limits_{j} {V_j - h \ge 0\\ 0,\ &в\ противном\ случае \end{cases}$

j "пробегает" по входам с единичными весами

Значение h = 1 гарантирует выполнение условия $0 \le V_i \le 1$ . Это упрощает применение формируемого на выходном слое сигнала для входа в следующую нейронную сеть длинной логической цепочки.

4.8. Ключевые термины

Исчерпывающее множество событий образуют события, объединенные по смыслу так, что сумма вероятностей их наступления равна единице.

Дерево логических возможностей формируется на основе композиции исчерпывающих множеств событий. Позволяет упорядочить эти множества на основе последовательного ввода их в рассмотрение при предположении о выполнении ранее рассмотренных. Применяется при изучении вариантов совместного выполнения событий.

Факторное пространство событий образуется всеми рассматриваемыми исчерпывающими множествами событий.

Достоверность высказываний о событиях - предполагаемая вероятность наступления события.

Ассоциативное мышление – выбор эталона, на который более всего похож исследуемый объект. Часто этот выбор производится методом усреднения о нескольких эталонах, на которые этот объект похож с некоторыми весами.

Размножение решений – результат разбиения логического выражения на отдельные конъюнкции (до того объединенные операцией дизъюнкции), определяющие одно и то же решение.

Однослойная нейронная сеть отображает только связи вида

<конъюнкция высказываний о событиях> $\to$ <решение>.

Выводы

1. Корректно составленная система принятия решений оперирует исчерпывающими множествами событий.

2. Несколько исчерпывающих множеств событий, являющихся предметом исследования при построении системы принятия решений, образуют факторное пространство событий.

3. Взаимосвязь событий различных исчерпывающих множеств целесообразно отображать деревом логических возможностей. Оно позволяет выделять множества совместных событий, находить вероятности их наступления, строить факторные подпространства событий.

4. Дерево логических возможностей позволяет корректно строить логические функции в основе системы принятия решений.

5. Реализация логических функций по технологии "электронных" схем позволяет построить систему принятия решений, оперирующую с булевыми переменными. Применение исчерпывающих множеств событий исключает необходимость операции НЕ.

6. Переход от булевых переменных к действительным – к достоверностям высказываний о наступлении событий – возможен с помощью нечеткой логики, основанной на приближенном исполнении схем И и ИЛИ на нейроподобных элементах.

7. Дальнейший переход к нейронным сетям при сохранении правильной работы системы принятия решений также оказывается результативным.

8. Структура нейронной сети может быть значительно упрощена по известным в математической логике и в схемотехнике методам сокращения максимальной длины логической цепочки. Так формируются однослойные нейронные сети.

5. Обучение логической нейронной сети

5.1. Что означает обучение нейросети?

— Аннушка… Аннушка?.. — забормотал поэт, тревожно озираясь, — позвольте, позвольте…

К слову "Аннушка" привязались слова "подсолнечное масло", а затем почему-то "Понтий Пилат". Пилата поэт отринул и стал вязать цепочку, начиная со слова "Аннушка". И цепочка эта связалась очень быстро и тотчас привела к сумасшедшему профессору.

М. Булгаков, "Мастер и Маргарита"

… Бытует теоретико-практическая предпосылка, объявляющая, что нейросеть формируется "под задачу". Однако в природе есть идеальная, универсальная, "унифицированная" нейросеть — наш мозг!.. И каждый из нас не испытывает серьезных технических трудностей, если, совершая жизненную ошибку, становится не коммерсантом-коробейником, а, скажем, блестящим специалистом по реликтовым захоронениям в мезозойский период. Более того, говорят, что если человек талантлив в одном, то он талантлив во всем.

Итак, мы научились строить уже обученные простейшие логические нейронные сети. Они обучены, ибо представляют собой законченные функциональные устройства специального назначения. Более того, мы умеем приводить их к однослойным сетям, - к таблицам с ассоциативной выборкой: на что более всего похож предъявленный образ, или на какую известную похожа сложившаяся ситуация, и какие действия предпринять?

Однако столь несложные построения настораживают шефа. Он боится, что такие примитивные результаты обесценивают долгие и трудные поиски его коллектива.

– Нет! – говорит он и открывает ящик стола. – Вот красивый и сложный граф с достаточным количеством входных и выходных вершин. Интерпретируйте его логической нейронной сетью и произведите обучение этой сети в соответствии с логическим описанием СПР.

Под обучением логической нейронной сети понимается запись в ней причинно-следственных связей вида "если... то...". Эти связи создаются с помощью высоких значений одних синапсических весов при сохранении исходных низких значений других. Объясним это.

Предварительно введем понятие обобщенного эталона.

Под обобщенным эталоном будем понимать совокупное множество всех событий, фигурирующих в отдельном логическом выражении из описания СПР, такое, что единичное возбуждение закрепленных за ними рецепторов – части или всех одновременно - приводит к самому высокому возбуждению нейрона выходного слоя, указывающее на решение, соответствующее данному логическому выражению.

Например, в ранее рассмотренном примере, приводящим к решению R1, является А1&В1&С1&С2&С3&С4&С5. При этом, по смыслу задачи, единичное возбуждение получают комбинации А1&В1&С1, ..., А1&В1&С5. Обобщенный эталон, приводящий к решению R2 – А1&В2&В3&С1&С2&С3 и т. д. Здесь знак & указывает на взаимодействие событий с помощью функции активации. В общем случае логическое описание системы принятия решений (в виде ряда логических функций) может содержать скобки, которые нельзя игнорировать при обучении. Тогда эти скобки указываются в обобщенном эталоне на своих местах, возможно, - в порядке вложенности. В этом случае имеем структурированные логические описания.

Важно подчеркнуть, что обобщенный эталон отражает единственность вхождения переменных – событий. Это требование следует из того, что при переходе от логических переменных описания СПР к действительным (отображающим достоверность принадлежности) суррогатом логических операций становится некоторая функция активации. А в основе такой функции лежит операция сложения, то есть суммирования сигналов.

Таким образом, каждая логическая функция из описания СПР – прообраз обобщенного эталона - должна быть преобразована так, чтобы все ее переменные входили в текст лишь один раз. Заметим, что эти преобразования служат не достижению абсолютной правильности выводов, а лишь максимизируют эту правильность.

Указанное преобразование достигается "вынесением за скобки". Поскольку в основе операции вынесения за скобки в алгебре логики лежит симметричное свойство дистрибутивности конъюнкции относительно дизъюнкции и дизъюнкции относительно конъюнкции, то такое преобразование можно назвать дистрибутивным . Если дистрибутивное преобразование невозможно, выражение следует разбить относительно некоторой операции дизъюнкции (любое логическое выражение легко преобразуется в "дизъюнкцию конъюнкций") и для каждой части отдельно указать, что ее значение "истина" приводит к тому же самому решению. Этот прием называется размножением решений. В конечном итоге это и есть путь получения однослойных логических нейронных сетей.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5

Теория нейронных сетей (стр. 4 )

4.6. Система принятия решений на основе высказываний

4.7. Минимизация длины логической цепочки

4.8. Ключевые термины

Выводы

5. Обучение логической нейронной сети

5.1. Что означает обучение нейросети?

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы