Отметим, что по убыванию величин возбуждения нейронов выходного слоя, вновь полученный результат полностью совпадает с полученным по "схемотехнической" сети (рис.2.10), так что и величина средней прибыли будет близка найденной ранее.

3.6. Переход к однослойной нейронной сети

На практике широкое распространение получили так называемые однослойные сети. Построим такую сеть и для нашего примера (рис.2.12).

Однослойная нейросеть

Рис. 2.12. Однослойная нейросеть

Возьмем ту же функцию активации с теми же параметрами и рассчитаем те же примеры, отображенные в табл. 2.1. Составим для них табл. 2.2.

Даная нейросеть также оказывает предпочтение решению R5, хотя порядок убывания величин возбуждения выходного слоя отличен от ранее полученного. Предпочтительность решений R2 и R3 меняется местами.

Таблица 2.2. Примеры расчета решений по однослойной нейросети
Ситуация	Требуемое решение	$V_{Вых1}$	$V_{Вых2}$	$V_{Вых3}$	$V_{Вых4}$	$V_{Вых5}$
{A1, B1, C3}	R1	2.2	1.4	0.6	0.6	1.4
{A1, B2, C2}	R2	1.4	2.2	1.4	0.6	1.4
{A1, B3, C3]	R2	1.4	2.2	1.4	1.4	0.6
{A1, B2, C4}	R3	1.4	1.4	2.2	0.6	1.4
{A1, B3, C5}	R3	1.4	1.4	2.2	1.4	0.6
{A2, B3,C1}	R4	1.4	1.4	0.6	2.2	1.4
{A2, B1, C3}	R5	1.4	0.6	0	1.4	2.2
{A2, B2, C4}	R5	0.6	0.6	1.4	1.4	2.2

3.7. Проблема обучения "готовых" нейросетей

Справедливо желание построения универсальных моделей нейросетей в составе программного обеспечения компьютера, снабженных механизмами приспособления под задачу пользователя. Еще более справедливо желание построить набор аппаратных средств — нейросетей (нейрокомпьютеров, НК), сопряженных с компьютером и по выбору пользователя участвующих в решении сложных задач. Такие аппаратно реализованные нейросети, как приставки или внешние устройства компьютера, например, определяют специальное направление использования ПЛИС — интегральных схем с программируемой логикой.

Однослойная нейросеть

Пусть первоначально дан граф, который можно интерпретировать однослойной нейросетью, составленной по принципу "каждый с каждым" (рис.2.13).

Формирование однослойной нейросети

Рис. 2.13. Формирование однослойной нейросети

Для задачи закрепим 10 нейронов рецепторного слоя за исходными данными, 5 выходов — за решениями. Этим мы выделим интересующую нас подсеть, как показано на том же рисунке.

Выберем все ту же функцию активации (2.3):

Тогда, для реализации системы принятия решений, представленной на рис.2.14, предстоит подобрать значения . Значения hi для упрощения можно положить равными нулю.

В данном случае результат очевиден, поэтому обратим внимание на некоторый общий подход.

Установим веса связей между нейронами В1, А1, С1, С2, С3, С4, С5, с одной стороны, и нейроном Вых1 — с другой, равными единице, оставив нулевыми веса связей этого нейрона с другими нейронами входного слоя. Таким образом полностью исключается влияние других нейронов входного слоя на данный выходной нейрон. Конкретная задача может потребовать корректировки, учета взаимного влияния всех входных ситуаций в результате тщательного экспериментального исследования задачи.

Здесь вновь прослеживается преимущество нейросети, способной элементарно просто учитывать наблюдаемые или интуитивно предполагаемые поправки, требующие в других случаях огромных исследований и расчетов.

Поступив также со всеми выделенными нейронами выходного слоя, получим окончательный результат, частично представленный оставшимися стрелками с единичными весами на рис.2.14. (Напоминаем, что в заданном графе стрелки шли от каждой вершины первого уровня к каждой вершине второго уровня.) Построенная нейросеть полностью соответствует специальной сети "под задачу", представленную на рис.2.12.

Нейросеть на основе графа произвольной структуры

Предположим, мы располагаем некоторым банком "красиво" изображенных графических схем, которые можно положить в основу структуры нейросети. Понравившуюся структуру мы решаем интерпретировать как нейросеть, дополнив ее функцией активации и обучив решению поставленной задачи.

Пусть выбранная нейросеть имеет 12 входов, 5 выходов и реализует ту же передаточную функцию с начальными значениями весов $\omega_{ij} = 0$ и порога h = 0.

Однако сеть обладает специфической топологией, затрудняющей ее обучение. Сеть многослойная, что исключает связи "через слой", присутствующие, например, на рис.2.13, как результат построения нейросети "под задачу".

Будем использовать метод трассировки, расширяющий использованный выше "схемотехнический" подход. Суть метода - в трассировке соединений, в назначении высоких (как правило – единичных) весов некоторых связей, превращающих нейросеть в законченное функциональное устройство, реализующее заданную зависимость значений сигналов на выходах от значений сигналов на входах. При такой трассировке обучение производится на эталонах в полном смысле этого слова, на вполне определенных (достоверных) ситуациях, например, на отсутствии (0) события или на его наступлении (1). После обучения сеть должна выдавать наиболее близкое решение при недостоверной информации, т. е. согласно вероятности наступления того или иного события. Хотя, как показано на примерах, можно выйти и за рамки теории вероятности, не требуя полноты множества событий и условий нормировки, но взвешивая события на основе каких-то других принципов.

Применив принципы комбинаторики и эвристики, выполним трассировку нейросети (рис.2.14), заключающуюся в присвоении единичных значений некоторым весам связей (красные стрелки на рисунке). Другие веса остаются нулевыми. На рисунке наглядно показано, какая нейросеть была предоставлена, насколько она "неповоротлива", скажем, по сравнению с однослойной, реализующей принцип "каждый с каждым".

Результат трассировки многослойной нейросети

Рис. 2.14. Результат трассировки многослойной нейросети

Систематизируя муки комбинаторного мышления, проанализируем принимаемые действия:

1. Анализ слой за слоем, постоянно помня цель — пять комбинаций ситуаций, каждая из которых должна возбудить один из нейронов выходного слоя. Пока мы не вводили жесткое закрепление решений за этими нейронами.

2. В каждом слое мы собирали частную комбинацию — терм, который можно использовать в последующем, — из доступных термов предыдущего слоя.

3. Термы, которые пока не могут быть использованы при конструировании из-за их взаимной удаленности, мы запоминали без изменения на анализируемом слое, пытаясь их "подтянуть" в направлении возможного дальнейшего объединения.

4. Мы старались не "тянуть" термы "поперек" всей сети. В противном случае мы сталкивались бы с проблемой: как избегать пересечений и искажения уже сформированных термов. Все это заставило нас долго не закреплять нейроны выходного слоя за решениями, что, в конце концов, привело к нарушению естественного порядка следования решений.

Таким образом, возникает задача дальнейших исследований: как построить все необходимые пути возбуждения так, чтобы они, возможно, пересекались, — но только для формирования общих термов? А способна ли выбранная нами "готовая" нейросеть вообще справиться с поставленной задачей или предпочтительнее принцип "нейросеть под задачу"? Эти исследования отражены в [1 - 5].

3.8. Ключевые термины

"Схемотехническая" модель – схема реализации системы логических функций подобно электронному устройству с помощью логических элементов – конъюнкторов и дизъюнкторов.

Конъюнктор – элемент, реализующий логическую функцию И, при которой на выходе образуется единица лишь в том случае, когда единицы подаются на все входы.

Дизъюнктор – элемент, реализующий логическую функцию ИЛИ, при которой на выходе образуется единица, если единица подается хотя бы на один вход.

Выводы

1. Распознавание символов (после центровки и масштабирования) целесообразно производить с помощью заключения эталонов в области экрана (эталонные области, ловушки), достаточно широко (с учетом искажений испытываемых символов) охватывающие эти эталоны. Исследуется, какую из известных эталонных областей в наибольшей степени и с превышением порога покрывает испытываемый символ. Для этого функция активации строится на основе суммирования сигналов в каждой эталонной области. Если при проверке всех известных эталонных областей порог распознавания не был превышен, подаваемый символ признается неизвестным.

2. Нейронная сеть строится посредством непосредственной связи всех рецепторов, образующих одну эталонную область ( $\Delta$ ) с нейроном, говорящим: "Это символ (буква) $\Delta$ "

3. Тактическая игровая система строится на основе знания всех возможных ситуаций пространства событий и соответствующих им решений. Рецепторы, на которые подается достоверность событий, характеризующих ситуацию, непосредственно связываются с нейронами, "отвечающими" за решения по данной ситуации. Максимально возбудившийся в результате счета значения функции активации нейрон определяет принимаемое решение.

4. Построение более сложных систем принятия решений производится на основе их логического описания. Воспроизведение промежуточной схемы нейронной сети подобно схемотехническому ее воплощению с помощью конъюнкторов и дизъюнкторов.

5. Переход к нейронам для использования нечетких данных на входе производится с помощью нечеткой логики –построения конъюнкторов и дизъюнкторов с помощью нейронов.

6. Так как трудно себе представить специализацию нейронов "в голове", то выяснилось, что единообразные, "стандартные" нейроны вполне способны в составе полученной схемы определять правильное решение. Так производится переход и от нечеткой логики к чисто нейронной сети.

7. Важным представляется дальнейший шаг к упрощению нейронной сети - переход к однослойной логической нейронной сети, применяемой практически во всех случаях, не требующих обратных связей.

4. Система принятия решений на основе математической логики событий

4.1. Исчерпывающее множество событий

Следующие ниже построения не могут не затронуть смысловых особенностей высказываний о событиях. Кроме чисто формальных свойств высказываний, выражающихся в их истинности или ложности, невозможно полностью абстрагироваться от содержательной сути или от контекста, в котором они звучат.

Определение. Исчерпывающее множество событий (ИМС) образуют те события, совокупность высказываний о которых покрывает весь возможный смысловой диапазон проявления объекта высказывания и каждая допустимая ситуация характеризуется тем, что значение ИСТИНА (1) может принимать единственное высказывание из этой совокупности. (Значение 0 могут принимать все высказывания.)

Рассмотрим примеры.

1) В состав редколлегии входят трое: Иванов, Петров, Сидоров. Тогда провозглашение фамилий этих фигурантов определяет исчерпывающее множество событий при выдвижении единственного представителя коллектива в президиум собрания.

2) Наказуемое превышение скорости автомобиля делится на диапазоны: до 10%, от 10% до 20%, свыше 20%. Однако, если в регламентирующем документе заданы только диапазоны до 10% и от 10% до 100% (а что далее?), то это не будет соответствовать исчерпывающему множеству событий . Такие нестрогие определения возможного диапазона ситуаций являются причиной юридической казуистики, требующей дальнейшего исследования прецедента.

Итак, ИМС, которому соответствует множество высказываний $А = \{x1, …, xn\}$ , характеризуется тем, что при соответствующих обстоятельствах одно и только одно высказывание из этого множества может принимать значение 1. Это и определяется операцией ИСКЛЮЧАЮЩЕЕ ИЛИ.

Очевидны главные свойства высказываний о событиях из ИМС:

$\overline{x_i} = x1\dot\lor … \dot \lor x_{i-1}\dot \lor x_{i+1}\dot \lor … \dot \lor x_n.$	(3.1)
$x_i \land x_j= \begin{cases} 0,\ &при\ i \ne j\\ x_i,\ &при\ i=j \end{cases}$	(3.2)

4.2. Дерево логических возможностей. Факторное пространство событий

Для строгого логического мышления, исключающего неопределенность, приходится оперировать не отдельными событиями и даже не исчерпывающими множествами таких событий (высказываниями о них), а композициями таких множеств. Между событиями, принадлежащими различным множествам, возможна зависимость, порождающая сложные высказывания. Да и сами ИМС могут определяться и инициироваться обстоятельствами, обусловленными событиями из других ИМС. Связи между ИМС, образующие сложные высказывания, отображаются деревом логических возможностей.

Пример. Пансионат для ветеранов труда обеспечивает постояльцам активный отдых круглый год. Представим схемой (рис.3.1) распорядок дня отдыхающих. Такая схема и определит дерево логических возможностей.

Полное дерево логических возможностей

Рис. 3.1. Полное дерево логических возможностей

Уровни ветвления могут формироваться разными способами. Например, первый уровень можно сформировать на основе времен года и т. д. Однако в порядке рекомендации можно следовать правилу: события располагаются на более низких уровнях по сравнению с теми уровнями, которые занимают события, от которых зависят данные события.

Бабушка пишет внуку: "Зимой я после завтрака катаюсь на лошади, и летом я после завтрака катаюсь на лошади, а также весной после завтрака прогулка бывает на лошади". …Что-то ей не нравится, и она строит схему своего составного высказывания: . Несколько поразмыслив, бабушка использует вынесение за скобку: $f = x1 \land x14 \land (x5 \lor x7 \lor x4 \land x10)$ . Тогда окончательный текст сообщения принимает вид: "После завтрака я катаюсь на лошади летом или зимой, а также, бывает, и весной, — вместо прогулки". Как же бабушка определила форму того логического выражения, — функции, отображающей все возможные варианты, и даже пути, ведущие к свершению интересующего события?

Ответ следующий: необходимо на каждом пути в дереве логических возможностей , ведущем к заданному событию, построить конъюнкцию событий, образующих этот путь. Затем все такие конъюнкции объединить операцией дизъюнкции. Поскольку используются только исчерпывающие множества событий , очевидно, что эта дизъюнкция выполняется с помощью операции $\dot \lor$ , т. е. ИСКЛЮЧАЮЩЕЕ ИЛИ (хотя можно пользоваться значком $\lor$ , опираясь на действительный, "физический" смысл возможных событий).

Полученная таким способом функция вызывает естественное желание быть подвергнутой дистрибутивному преобразованию — "вынесению за скобки".

Отметим, что в результате такого способа построения искомая функция принимает вид, при котором каждая используемая переменная-высказывание входит не более одного раза.

Например, функция, отображающая такое событие в жизни бабушки, как езда на велосипеде, имеет вид: .

Однако далее будет показано, что не всегда единственного вхождения переменных можно добиться с помощью дистрибутивных преобразований. Иногда требуются дополнительные действия для его осуществления.

Определение. Совокупность всех исследуемых в данном контексте событий, т. е. множество – объединение всех рассматриваемых ИМС, образует факторное пространство событий .

Как и ранее, точку факторного пространства (ситуацию) будем обозначать ${x_1, …, x_n}$ .

Итак, показана возможность построения логических функций на основе высказываний о событиях из факторного пространства. Как видно из примера, факторное пространство событий отображается ветвящейся структурой на основе отдельных исчерпывающих множеств событий , входящих в его состав. Тогда подмножества, состоящие из таких ИМС, тоже являются факторными подпространствами, которые в некотором контексте можно исследовать отдельно.

Факторное подпространство для исследований финансовых затрат на питание

Рис. 3.2. Факторное подпространство для исследований финансовых затрат на питание

Например, можно отдельно исследовать факторное подпространство, сформированное на основе первых двух уровней ветвления (рис.3.2) в приведенном на рис.3.1 дереве логических возможностей . Это может быть необходимо при планировании финансовых расходов пансионата на питание.

Можно, в соответствии с поставленной задачей (в контексте исследований), формировать другие факторные пространства событий . Например, планирование использования спортивного инвентаря по времени года приводит к целесообразности факторного пространства, структура которого показана на рис.3.3.

Факторное пространство для планирования спортивного инвентаря

Рис. 3.3. Факторное пространство для планирования спортивного инвентаря

4.3. Система принятия решений

Для некоторой логической функции f от переменных из факторного пространства событий воспользуемся операцией следования (импликации) и сформируем логическое выражение вида

$f(x_1, …, x_n) \to R.$	(3.3)

Здесь f следует рассматривать как выражение, определяющее условие, сложившуюся ситуацию, посылку, а R – высказывание, которое рассматривается как следствие: правило поведения, значение векторной функции, указание к действию и т. д. Таким образом, возможно формирование связей вида "посылка – следствие", "если … то". При этом функция f задается на множестве ситуаций и указывает на то, что, если на некоторой ситуации она принимает значение 1 (ИСТИНА), то такое же значение принимает высказывание R, являясь руководством к действию, к принятию определенного решения.

Подобно (3.3) можно описать множество логических выражений, определяющих стройную систему управления или принятия решений в соответствии со складывающейся ситуацией в факторном пространстве событий :

$f_1(x_1, ..., x_n) \to R_1\\ ............................\\ f_m(x_1, ..., x_n) \to R_m$

(3.4)

Определение. Система логических выражений вида (3.4), заданная на факторном пространстве (подпространстве) событий, обладающая полнотой и непротиворечивостью, называется системой принятия решений (СПР).

Поясним важность свойств, указанных в определении.

То, что система функций f_1, …, f_m является полной, означает, что любая точка факторного пространства событий входит в область задания хотя бы одной из этих функций. Непротиворечивость означает, что по каждой ситуации одна и только одна из этих функций принимает значение 1, приводящее к истинности соответствующего высказывания – решения. Однако отметим, что, в действительности, на основе смыслового содержания задачи, по каждой или некоторой ситуации может быть известно более одного правильного решения, приводящего к успешным действиям. В таком случае высказывания об этих решениях могут быть объединены операцией ИЛИ, что приводит к приведенному выше предположению о непротиворечивости.

Приведем теорему, которая дает обоснование общего вида логического описания любой системы принятия решений – того вида, к которому на пути упрощения задачи рекомендуется приводить описание СПР для нейросетевой реализации.

Теорема. Любая логическая функция, входящая в состав описания системы принятия решений, может быть приведена к дизъюнкции конъюнкций высказываний о событиях.

Доказательство. Из основ математической логики (в частности, - теории булевых функций) известно, что каждая такая функция может быть представлена дизъюнктивной нормальной формой. Однако в ней, наряду с переменными, участвуют их отрицания. Ориентируясь на применение исчерпывающих множеств событий, воспользуемся (3.1) для выражения таких отрицаний. "Раскроем скобки", вновь выделив конъюнкции, объединенные операциями дизъюнкции. Упростим эти конъюнкции с помощью (3.2). Получим форму, объявленную в теореме. Теорема доказана.

Данная теорема объясняет, почему в последующих примерах преимущественно принимается именно объявленная форма описания СПР, или легко сводящаяся к ней, а отрицания событий не рассматриваются.

Пусть некий Х планирует занятия физкультурой и спортом во все времена года по времени дня: после завтрака, после обеда и после ужина. Объединяя высказывания по принципу "если … то" и пользуясь обозначениями на рис.3.1, Х формирует систему принятия решений, не полагаясь на память, и которой намерен строго следовать, добившись согласия администрации.

Система принятия решений имеет вид:

$1.\ x_1 \land x_4 \to R_1 = "Прогулка\ на\ велосипеде";\\ 2.\ x_1 \land x_6 \lor x_2 \land x_4 \to R_2 = "Шахматы";\\ 3.\ x_2 \land x_5 \lor x_1 \land x_7 \to R_3 = "Верховая\ езда";\\ 4.\ x_1 \land x_5 \lor x_2 \land x_6 \to R_4 = "Байдарка";\\ 5.\ x_3 \land (x_4 \lor x_6) \to R_5 = "Дискотека";\\ 6.\ x_2 \land x_7 \to R_6 = "Пешая\ прогулка";\\ 7.\ x_3 \land (x_5 \lor x_7) \to R_6 = "Пешая прогулка".$

(3.5)

Планируя пешую прогулку, Х первоначально получил следующее выражение:

$(x2 \land x7 \lor x3 \land x5) \lor (x3 \land x7) \to R6= "Пешая\ прогулка".$

Однако выше не напрасно обращается внимание на целесообразность однократного вхождения переменных в подобное выражение. Ведь далее, при переходе к функции активации нейрона, возможно неоднократное суммирование одних и тех же переменных. Выражение, полученное первоначально, с помощью эквивалентных преобразований привести к такому виду не удается. Тогда Х решает разбить это выражение на два подобных, сформировав получение одного и того же решения ("размножив" решение) на основе двух условий. Это и послужило появлению в (3.5) двух выражений, определяющих одно решение .

Легко убедиться, что все возможные ситуации факторного пространства событий охвачены, что демонстрирует полную ясность действий Х.

Системы принятия решений могут образовывать сложные иерархические структуры. В этом случае необходимо, чтобы высказывания - решения отображали события, образующие ИМС.

4.4. "Схемотехническое" представление системы принятия решений

Отобразим (c нарушением некоторых стандартов) схемотехнически СПР для Х, подобно электронной схеме (рис.3.4) с помощью конъюнкторов и дизъюнкторов. На вход будем подавать значения истинности переменных-высказываний (ситуации) так, чтобы на одном из выходов формировалась единица – значение истинности соответствующего решения. Задавать значение ситуаций следует корректно, чтобы соблюдать требования вхождения переменных в исчерпывающие множества событий .

"Электронная" схема системы принятия решений

Рис. 3.4. "Электронная" схема системы принятия решений

Реализовав эту схему на логических элементах, Х получит реальное средство подсказки: что он должен делать в данное время года и суток.

Например, Х хочет вспомнить, чем он должен заниматься летом после обеда. Для этого полагаем x_2 = x_5 = 1 при нулевых значениях других переменных и запускаем программу, моделирующую работу электронной схемы. На выходе формируется сигнал, соответствующий высказыванию "Верховая езда".

Электронная схема, имитирующая систему принятия решений, требует корректного задания исходной информации, т. е. корректной формулировки вопроса в соответствии со смыслом задачи. Одновременно должна существовать уверенность в получении единственного решения, в том числе предполагающего задание альтернативных вариантов, если это предусмотрено при построении СПР. В таком случае окончательный выбор альтернативы может быть предусмотрен при развитии системы, при анализе новых вводимых факторов. При некорректной формулировке вопроса возникнут коллизии, неоднозначные или неправильные выводы. Таким образом, СПР может отвечать только на те вопросы, на которые она настроена.

4.5. Достоверность высказываний о событиях

Говоря о высказываниях, как о логических переменных, предполагается наличие субъективного фактора - это кто-то сказал. И можно сказать: "Я мало доверяю этому человеку, но он сказал …, а дыма без огня не бывает".

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5

Теория нейронных сетей (стр. 3 )

3.6. Переход к однослойной нейронной сети

3.7. Проблема обучения "готовых" нейросетей

3.8. Ключевые термины

Выводы

4. Система принятия решений на основе математической логики событий

4.1. Исчерпывающее множество событий

4.2. Дерево логических возможностей. Факторное пространство событий

4.3. Система принятия решений

4.4. "Схемотехническое" представление системы принятия решений

4.5. Достоверность высказываний о событиях

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы