|
| ||
сАМАРСКИЙ ГОСУДАРСТВЕННЫЙ АРХИТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ | |||
ТЕОРИЯ НЕЙРОННЫХ СЕТЕЙ | |||
лекции | |||
Рассматривается модель нейронной сети (НС). Приводится методика построения обученных логических НС. Разбирается система принятия решений на основе математической логики событий. Приводится технология обучения нейронной сети. |
Автор
2012
Оглавление
1. Модель нейронной сети. 3
1.1. Модель мозга. 3
1.2. Нейронная сеть. 5
1.3. Ввод и "разглядывание" эталонов и образов. 9
1.4. Формирование информации на рецепторном слое. 17
1.5. Пространство признаков. 21
1.6. Максимальное возбуждение нейронов выходного слоя. 23
1.7. Кора. 29
1.8. Ключевые термины.. 30
Выводы.. 32
2. Построение обученных логических нейронных сетей. 34
2.1. Нейронная сеть для распознавания символов. 34
2.2. Построение простой логической нейронной сети. 37
2.3. Построение обученной нейронной сети "Железнодорожная рулетка". 41
2.4. "Схемотехнический" подход к построению нейросети "под задачу". 46
2.5. Построение нейросети "под задачу". 51
2.6. Переход к однослойной нейронной сети. 53
2.7. Проблема обучения "готовых" нейросетей. 55
2.8. Ключевые термины.. 60
Выводы.. 61
3. Система принятия решений на основе математической логики событий. 63
3.1. Исчерпывающее множество событий. 63
3.2. Дерево логических возможностей. Факторное пространство событий. 64
3.3. Система принятия решений. 68
3.4. "Схемотехническое" представление системы принятия решений. 72
3.5. Достоверность высказываний о событиях. 73
3.6. Система принятия решений на основе высказываний. 78
3.7. Минимизация длины логической цепочки. 83
3.8. Ключевые термины.. 89
Выводы.. 90
4. Обучение логической нейронной сети. 92
4.1. Что означает обучение нейросети?. 92
4.2. Обучение нейросети для распознавания букв. 95
4.3. Обучение нейросети игре в железнодорожную рулетку. 99
4.4. Матрица следования. 99
4.5. Обучение нейросети для "современной" системы принятия решений. 103
4.6. Ключевые термины.. 119
Выводы.. 120
Литература. 122
2. Модель нейронной сети
2.1. Модель мозга
Мозг представляет собой нейронную сеть содержащую узлы — нейроны (рис.1.1) и их соединения — синапсические связи.

Рис. 1.1. Нейрон
Тело нейрона является средством выполнения пороговой функции активации над сигналами, пришедшими по входам нейрона – дендритам. (Нейрон мозга содержит до 10 тыс. дендритов.) Для того чтобы перейти в возбужденное состояние, в теле нейрона выполняются около 240 химических реакций. Величина возбуждения нейрона с помощью ветвящегося аксона передается на дендриты других нейронов.
Важными управляющими элементами связей нейронов являются синапсы. Синапс аналогичен переменному сопротивлению, определяющему вес связи (вес дендрита). Этот вес является коэффициентом, с которым дендрит принимает возбуждение нейрона, связанного с данным. Поэтому связи между нейронами называются синапсическими.
Изменение весов синапсических связей позволяет регулировать направления и пути распространения возбуждений в нейронной сети , т. е. в множестве взаимосвязанных нейронов. Так в этой сети образуются связи вида "если... то".
Поэтому настройка весов синапсических связей является основной задачей обучения нейронной сети , когда возбуждение некоторого множества нейронов обязательно должно приводить к возбуждению определенного нейрона. Это важнейший элемент выполнения мозгом функций распознавания, управления и принятия решений.

Рис. 1.2. Модель нейрона
Математическая, абстрактная, модель нейрона во взаимодействии с другими нейронами сети представлена на рис.1.2.
Здесь
— импульсы возбуждения, выработанные другими нейронами и поступившие на дендриты нейрона
— веса дендритов,
— пороги. В свою очередь, выработанный импульс
также направляется на дендриты нейронов, с которыми связан нейрон
с помощью ветвящегося аксона. Значение импульса возбуждения
находится, как говорилось ранее, в результате счета функции активации, возможный вид которой приведен на рисунке.
Еще раз обращаем внимание на то, что значения весов синапсических связей
и значения порогов
могут регулироваться. Такое регулирование, во многих вариантах реализованное в разных моделях, и определяет возможность обучения и самообучения сети. Оно задает направление распространения возбуждений через сеть, простейшим образом формируя связи "посылка — следствие".
2.2. Нейронная сеть
На рис.1.3 показан фрагмент нейросети, по которому можно представить следующее.

Рис. 1.3. Фрагмент нейронной сети
1. В сети распознают входной (рецепторный) слой, воспринимающий сигналы внешнего возбуждения (например, экран, на который подается видеоизображение), и выходной слой, определяющий результат решения задачи распознавания или принятия решений. Работа сети тактируется для имитации прохождения по ней возбуждения и управления им.
2. Каждый нейрон обрабатывает сигнальную информацию (это важнейший принцип логической нейронной сети!) в диапазоне от нуля до условной единицы. Исходные данные в виде сигналов поступают (от пользователя, от блока обработки ситуации на входе, от другой нейронной сети и т. д.) или формируются (например, с помощью видео ввода) на рецепторном слое.
3. Функции активации бывают различны, но просты по объему вычислений. В простейшем случае такая функция совпадает с линейной формой, где аргументы, показанные на рис.1.2, связаны операцией вычитания. Часто удобно не вычитать порог, а только лишь сравнивать с ним указанную сумму. Другие, не менее простые, функции активации будут рассмотрены в соответствии с целесообразным их применением.
4. Найденная взвешенная сумма, превысившая порог, или величина превышения порога является величиной возбуждения нейрона либо определяет значение величины возбуждения (например, в некоторых моделях величина возбуждения всегда равна единице, отсутствие возбуждения соответствует нулю). В некоторых моделях допускают и отрицательную величину возбуждения. Значение возбуждения передается через ветвящийся аксон в соответствии со связями данного нейрона с другими нейронами.
5. По дендритам может передаваться как возбуждающее, так и тормозящее воздействие. Первое может соответствовать положительному значению веса синапсической связей , второе — отрицательному. В нейронной сети возможны обратные связи.
6. Нейронная сеть работает в двух режимах: в режиме обучения и в режиме распознавания (рабочем режиме).
В режиме обучения на рецепторном слое сети предъявляются эталоны. Веса связей на пути прохождения возбуждения формируют таким образом, чтобы на выходном слое максимально возбудился нейрон, с которым связано решение по данному эталону. Например, если показан эталон буквы А, то (по прошествии нескольких тактов, в течение которых промежуточные нейроны считают значения функции активации и передают результаты далее в соответствии со своими связями) максимально должен возбудиться нейрон, связанный с решением: "Это буква А". В рабочем режиме (в режиме распознавания), в результате показа буквы А, даже искаженной и "зашумленной", должен максимально возбудиться соответствующий нейрон выходного слоя. Так достигается эффект ассоциативного мышления.
Таким образом, "подкручивая" веса, мы учим сеть по эталонным ситуациям, по которым мы знаем решение, а затем в рабочем режиме она выдает нам решение во всем диапазоне ситуаций. При этом она автоматически решает проблему, на какую "знакомую" ей ситуацию похожа более всего предъявленная ситуация, и, следовательно, какое решение следует выдать. Конечно, — с определенной вероятностью правильности.
Это открывает широкие возможности "живого" моделирования, не только в сфере развлечений, как показано на рисунках 1.4 и 1.5, но и в сфере интеллектуального отображения. Например, "реагирующие объекты" могут своим поведением указывать на нарушение технологического процесса, на перегрузку коммуникационной сети, предвещать стихийные бедствия и т. д.
Однако то, что изображено на рис.1.3, больше соответствует воплощению в природе – в мозге. Искусственные нейронные сети значительно проще. Они сводятся к однослойным, где сигналы с рецепторов сразу обрабатываются нейронами единственного слоя, являющегося выходным. Да и формирование весов, в природе связанное со сложными биохимическими процессами, на логическом уровне реализуется исключительно просто. Как это происходит, будет рассмотренно далее на примерах построения систем принятия решений.

Рис. 1.4. Реакция на угрозу

Рис. 1.5. Реакция на поощрение
2.3. Ввод и "разглядывание" эталонов и образов
Устройства ввода информации — эталонов, исходных ситуаций — имеют определяющее значение для нейросети. С их помощью формируются и поддерживаются возбуждения входного слоя . Сегодня успешно решается проблема видео-ввода. Однако ввести в компьютер "картинку" — это лишь часть дела. Картинку надо обработать — в целом и по частям, чтобы по максимуму интересующей информации получить полные и достоверные выводы – сформировать реакцию. Здесь мы ищем аналоги нашего восприятия действительности.
Нужно совершить обзор представляемой картины тремя способами:
- сканированием сектора обзора, разбитого на элементарные сегменты (рис. 1.6); спонтанным обзором, обусловленным привлечением внимания к цветовому или скоростному всплеску, быстрым увеличением размера (угрожающим приближением) объекта, указанием извне (целеуказанием) и т. д. (рис. 1.7); сканированием сектора обзора с выделением зон особого внимания (рис. 1.8).
При первом и третьем способах анализ сложнее, т. к. требует согласования всего виденного по сегментам. Это, в свою очередь, требует включения высших уровней логического вывода (интеллекта).
Второй способ также требует сканирования сектора обзора, однако со значительно меньшими энергетическими затратами. При этом способе можно добиться избирательности, чрезвычайности реакции, например, на резкие движения, на бег, появление яркой расцветки в одежде и т. д. Это может с успехом использоваться в развлекательных, игровых системах.
Все способы реализуются легче, если речь идет об единственном объекте единовременного распознавания, например, буквы, хозяина квартиры, подписи и т. д. Ибо любая сцена, например, туристская группа, пришедшая полюбоваться "умным" монстром, требует не только детального, но и совместного анализа этим монстром всех (многих) ее составляющих.

Рис. 1.6. Сканирование по строкам

Рис. 1.7. Реакция на внезапность

Рис. 1.8. Поиск зон особого внимания
Говоря о туристах, можно говорить о конечной, усредненной реакции на всю группу. Ведя обзор, сеть постепенно, по критериям обучения "это хорошо — это плохо", воспринимая "настроение" как последовательное добавление элементов радости и огорчения, приходит к некоторому окончательному состоянию, обусловленному тем, сколько того и другого она увидела. Тогда для разных групп туристов или экскурсантов это состояние будет разным. Это может стать источником веселья и шутливого "поощрения" той группы, которая привела объект в радость, и "осуждение" группы, ввергнувшей его в печаль.
Итак, в каждом такте обзора, формируется сегмент, содержимое которого необходимо распознать. Чаще всего целесообразно допущение о том, что в элементарном сегменте при дискретном сканировании находится не более чем один значимый объект. Пусть это — максимальная область текста, вмещающая единственную букву, написанную с допустимой долей небрежности. Как помочь себе же разглядеть эту букву? По-видимому, следует пытаться разместить эту букву на входном слое так, чтобы она максимально соответствовала тому размещению эталонов, с помощью которых производилось обучение. Тогда распознавание заработает правильно (рис.1.9). Такой процесс "разглядывания" может предполагать:
- поиск возможности совмещении условного центра элемента изображения и центра экрана — входного (рецепторного) слоя сети (фокусировка); поиск варианта масштабирования элемента изображения (приближение — удаление); поиск угла наклона и др.
В результате таких пробных действий может вдруг "запуститься" процесс распознавания, хотя, возможно, и ошибочного.
Напомним, что работа нейросети тактируется. Тогда развитие сценария в увлекательной многофункциональной детской игре с обучаемым компьютерным человечком КОМПИ может быть таким, как представлено на рис.1.10.
Однако следует отметить, что обработка изображений, особенно – для распознавания, представляет сложную проблему компьютерного зрения, которой посвящено много исследований. Отметим здесь лишь монографию [11].

Рис. 1.9. Поиск условия узнавания

Рис. 1.10. Реакция на распознавание в реальном времени
2.4. Формирование информации на рецепторном слое
Определим возбуждение рецепторного слоя, учитывая то, что по нейросетевым технологиям решаются сложные, чаще всего трудно формализуемые задачи. Исходная информация этих задач может быть настолько несовместима по смыслу, типам данных и единицам измерения, что приведение ее к некоторому количественному воплощению — величине возбуждения нейронов входного слоя — представляет серьезную проблему.
Например, как объединить величину превышаемой водителем скорости и тип автомобиля иностранного производства со вчерашним неудачным выступлением любимой автоинспектором футбольной команды, — при нахождении величины штрафа? Ведь каждый из перечисленных факторов должен определить некоторые общие, приведенные значения возбуждения.
Такое приведение также зависит от задачи. Поскольку нейроны — нечто стандартное для данной задачи или класса задач, то каждая характеристика нейрона — величина возбуждения, веса его синапсических связей, порог, функция активации — должны быть одинаковы или принадлежать общему (по каждой характеристике) для всех нейронов диапазону возможных значений.
Дадим рекомендации, основанные на "событийном" принципе.
Разобьем скорость на диапазоны штрафования, например, [90, 100), [100, 110), [110, 120), [120, 200]. За каждым диапазоном скорости закрепим нейрон входного слоя — рецептор.
Универсальный подход основан на связывании величины возбуждения рецептора с достоверностью – вероятностью того, что величина скорости принадлежит одному или нескольким диапазонам. Такому подходу будем следовать в дальнейшем.
А именно, хотя бы интуитивно (а интуиция основана на изучении Инструкции) определим достоверность того, что интересующая нас величина принадлежит данному диапазону. С какой достоверностью она принадлежит второму диапазону? А третьему?
Грамотный инспектор помнит, что должен исходить из свойств ИМС - исчерпывающих множеств событий, с которыми имеет дело. Для ИМС сумма вероятностей событий равна единице. Тогда, в соответствии с высказанными положениями, инспектор не должен, например, задавать значение достоверности того, что скорость автомобиля находится в пределах 100 – 120 км/ч, равной 0,8, и в то же время достоверность того, что она находится в пределах 120 – 140 км/ч, равной 0,7. Более того, в соответствии с рекомендациями теории нечетких множеств он следует нормальному закону распределения плотности вероятностей. А именно, если он считает, что, скорее всего, скорость принадлежит диапазону 100 – 120 км/ч, и полагает достоверность этого высказывания равной 0,6 (математическое ожидание), то куда деть остальные 0,4? Инспектор распределяет эту величину между "смежными" по смыслу событиями, имитируя нормальный закон, например, полагая значения возбуждения рецепторов, как показано на рис.1.11.

Рис. 1.11. Распределение возбуждения рецепторов по нормальному закону
В случае не столь высокой грамотности, полагаясь на универсальность аппарата логических нейронных сетей, имитирующего массовое ассоциативное мышление, можно даже уйти от понятия достоверности, как вероятностной категории. Все ли мы на бытовом уровне знакомы с понятием исчерпывающего множества событий, связанного с условием нормировки, т. е. – с условием равенства единице суммы их вероятностей? Ведь часто можно услышать: "Даю голову на отсечение, что это так, хотя и допускаю, что все наоборот…" Главное, чтобы исходные оценки информации были относительными, отражающими принцип "больше – меньше". Это расширит популярность нейросетевых технологий, исключит необходимость специальных знаний. Ведь какие-то начальные возбуждения рецепторов, при их относительном различии, распространятся по нейросети, определяя предпочтительность принимаемого решения. Тогда, на этапе обучения нейросети, получится возможность формирования аналога некой таблицы, в соответствии с которой будет действовать инспектор.
Выделим нейроны, "отвечающие" за типы автомобилей: отечественного производства, "мерседес", "вольво", "джип" и т. д. Величину возбуждения этих нейронов будем полагать равной 1 — на этапе обучения, или равной достоверности события — в рабочем режиме. Аналогично выделим рецепторы, "отвечающие" за другие возможные события: степень интеллигентности водителя (так же по диапазонам изменения), выигрыш или проигрыш любимой команды и т. д.
Следовательно, на входном слое будут формироваться приведенные значения возбуждения.
В рабочем режиме мы, таким образом, будет получена возможность использования неопределенной, недостоверной информации. Например, инспектор не смог из-за высокой скорости отличить "ниву" от "чероки". Тогда он решает ввести значение 0,5 в графу "нива" (величина возбуждения рецептора, "отвечающего" за "ниву" станет равной 0,5) и 0,5 – в графу "джип "чероки" (такой же станет величина возбуждения соответствующего рецептора). Однако, подумав, он на всякий случай вводит величину 0,2 в графу ВАЗ 2104, что также во власти его сомнений. Также инспектор поступает и с другими характеристиками сложившейся ситуации в поисках наиболее достоверного решения по принципу наибольшей похожести.
Следует сделать важное замечание. Всегда ли обязательно разбиение параметров отражаемых непрерывными функциями на диапазоны изменения? Часто удобно закреплять рецепторы не за диапазонами изменения значений параметров, а за конкретными значениями, наряду с другими объектами, свойствами и др. В этом случае опыт носит дискретный характер.
Например, в этом же примере о штрафе может быть известен опыт вида:
"Если скорость автомобиля равна 100 км/час & <другие характеристики ситуации>, то размер штрафа составляет..."
"Если скорость автомобиля равна 120 км/час & <другие характеристики ситуации>, то размер штрафа составляет..." и т. д.
Тогда как задать возбуждение рецепторов, если инспектор точно установил, что скорость автомобиля при наезде на пешехода была равна 114 км/час?
По-видимому, он рассуждает на основе близости скорости к границам указанного интервала: "Достоверность того, что скорость автомобиля составляет 100 км/час, я найду как (114 – 100):(120 – 100), а достоверность того, что скорость автомобиля составляет 120 км/час, я найду как (120 – 114):(120 – 100). Следует обратить внимание на то, что сумма найденных достоверностей равна единице.
Таким образом, указан самый простой прием перехода от принадлежности достоверности событий к интервалам – к принадлежности достоверности этих событий к конкретным опытным данным. Этим обеспечивается единообразие отображения объектов любой природы (Вася, Петя), а также булевых переменных вида "да – нет" ("На дворе дождик – или дождика нет").
Следует обратить внимание на то, что в задании исходных данных для логической нейронной сети всегда присутствует фактор волюнтаризма, неопределенности, случайности и даже предвзятости личного мнения.
2.5. Пространство признаков
Простейшая система распознавания букв реализуется следующим образом.
Образ буквы, например, «А», налагается на входной слой нейросети — рецепторы. Конфигурация возбужденных рецепторов, порождая прохождение возбуждения через внутренние слои нейросети, образуя путь возбуждения, определяет возбуждение, если не гаснет по пути, одного из нейронов выходного слоя, говорящего "это буква А". Интуитивно ясно, что устойчивость такой схемы по отношению к огромному множеству конфигураций возбуждений рецепторов, соответствующих одной только букве А, вряд ли высока. Вглядываясь в себя, мы видим, что такое непосредственное распознавание осуществляется далеко не всегда, особенно — на этапе получения школьного образования, ибо наше образование получается на основе признаков и определений (правил вывода).
Как можно охарактеризовать строчную букву «а»? Это кружочек, справа примыкает палочка с хвостиком вправо.
А прописная А? Две палочки с перекладинкой. Но ведь буква Н тоже соответствует этому определению. Тогда мы добавляем: две палочки, соединенные вверху. Кстати, соединение вверху может быть в результате небрежности лишь обозначено. Тогда о намеке на него мы можем судить по наклону палочек. Дальнейшая небрежность может привести к неразличимости букв А и Н.
Значит, существует ряд признаков, лежащих в основе определений. И мы, на интуитивном уровне, понимаем, что такой способ распознавания гораздо более устойчив к искажениям и особенностям почерка, однозначен и надежен. Ведь при изображении буквы А можно допустить не только небрежность в верхнем соединении палочек, но и значительную разницу в общем наклоне буквы, в длинах боковых палочек, в месте расположения перекладины, в ее наклоне и длине и т. д. Искажение может привести к сомнениям лишь при крайней похожести на цифру 4, на телеграфный столб или на греческую
. Но даже в этом случае окончательный вывод может быть сделан на основе контекста, т. е. по использованию дополнительных признаков "по умолчанию".
Значит, необходимо ввести такие признаки, как наличие кружка, палочек, хвостиков, их взаимного расположения и т. д. То есть, необходимо построить пространство признаков, преобразовать входные изображения в это пространство, и тогда появится возможность получения более определенного и устойчивого к искажениям заключения.
Перевод входного изображения в пространство признаков значительно расширяет возможности "разглядывания" — масштабирования, размещения, поиска угла наклона и т. д., т. е. позволяет с более высокой достоверностью производить распознавание.
Например, изображение танка может в разных ракурсах ложиться на входной слой рецепторов. Конечно, можно запомнить, что "и это — танк", "и это — тоже танк" и т. д. Но если ввести хотя бы такое определение, как "массивный корпус на гусеничном ходу (тоже нуждается в определении), а сверху башня с дулом пушки, и все такое зелененькое", то это научит хотя бы принимать меры предосторожности.
2.6. Максимальное возбуждение нейронов выходного слоя
Как же реализуется принцип ассоциаций? Уместны предположения о том, как это реализовано в природе.
Представим себе отдельно выходной слой (рис.1.12).

Рис. 1.12. Области возбуждения выходного слоя
Рассматривая прохождение возбуждения, например, при подаче изображения буквы А, в модели нейросети, можно предположить, что не один нейрон, строго соответствующий этой букве, придет в возбужденное состояние, как это предполагается в логической модели. В его окрестности возбудятся и другие нейроны. Эта величина возбуждения будет угасать с ростом удаления. Нам же нужно, чтобы максимальной величиной возбуждения в этой окрестности обладал именно отмеченный нейрон. Более того, желательно, чтобы этот и только этот нейрон обладал высокой, существенно различимой, величиной возбуждения. Это обеспечит определенность и однозначность при дальнейшем использовании полученного вывода для принятия решения и для построения других логических цепочек, использующих это решение. Такая локализация сигнала возбуждения позволит ответить на вопрос: "на что более всего похож предъявляемый образ, несмотря на случайные отличия и оказываемые помехи?"
Способы максимизации и локализации уровня возбуждения основаны на нахождении экстремума функции возбуждения, построенной на области выходного слоя. Здесь нельзя обойтись без обмена тормозящими воздействиями между нейронами выходного слоя. Простейшая идея состоит в следующем. Все нейроны области выходного слоя имеют между собой синапсические связи такие, что каждый нейрон связан с ближайшими нейронами тормозящими связями, по модулю пропорциональными величине собственного возбуждения или алгебраической разности возбуждений. Тогда в итоге взаимодействия двух нейронов более "сильный" нейрон увеличит свой потенциал, сообщив более "слабому" нейрону тормозящее воздействие. Такое пошаговое "состязание" на фоне приходящего подтверждения от эталона и выделит сильнейшего. Более того, "слабый" нейрон может "слабеть" до тех пор, пока взвешенная сумма подаваемых ему сигналов не станет меньше его порога (рис.1.13).
Получается так, что области возбуждений оказываются "закрепленными" за типами объектов (рис.1.12)— за буквами, цифрами, продуктами питания и т. д. В развитой сети (как и в самом головном мозге), нейроны отдельных ее областей через нейроны внутренних слоев вновь порождают пути прохождения возбуждений в другие области нейросети и т. д.
Такой принцип локальности, пронизывающий всю структуру сети, в сочетании с принципом иерархии — возможностью построения новых выводов на основе сделанных, позволяет на деле реализовать связи каждый с каждым. Никакой вывод не может оставаться недоступным и неиспользованным при построении сложных умозаключений.
Принцип локальности не отвергает существования маловероятных связей каждого с каждым. Эта вероятность может быть высокой вследствие аномалий генетического характера. Например, человек, которого мы относим к уникумам, может видеть кожей вследствие того, что нейроны, воспринимающие кожные ощущения, сильно связаны с нейронами выходного слоя, "отвечающими" за зрение. И вместо того, чтобы возбуждение в сторону последних при слабых связях угасло, оно становится результативным. Ведь в целом все нейроны устроены одинаково.
Большое число связей способствует высокой надежности мозга. Ведь ежедневная гибель огромного числа нейронов, из-за алкоголя, наркотиков, токсикации, а также травм, компенсируются другими путями прохождения возбуждений, иногда даже связанными с необходимостью переобучения. Впрочем, ограниченный ресурс возможного не спасает, в конце концов, от деградации.

Рис. 1.13. Локализация возбуждения
Однако следует отметить, что локализация и максимизация возбуждения на выходном слое особенно важны тогда, когда действительно необходима высокая степень определенности. Это важно в том случае, если получаемый вывод (решение) немедленно участвует в цепочке последующих, использующих его, выводов. В конце концов, все обусловлено назначением сети, решаемой задачей. Можно представить себе возможный аттракцион — реакцию фантастического чудовища на изображение, как это представлено на рисунках 1.4 и 1.5. Там по виду изображения на экране инициируются те или иные программы действий: радости, гнева, поднятия лап, виляния хвостом и т. д. Возбуждение определенных нейронов выходного слоя связывается с запуском соответствующих программ. Величина возбуждения может являться основным параметром для этих программ. Программы не исключают друг друга, и в одном такте могут запускаться несколько программ.
Можно представить радостную модель гурмана-дегустатора (рис.1.14), по аромату блюда определяющего состав использованных ингредиентов и приходящего в восторг или в уныние от представленного букета.
В большинстве частных задач, где нейросеть обучается с помощью "учителя", т. е. на основе действий извне при ее настройке, присутствует элемент принудительного закрепления нейронов выходного слоя за выводами. В процессе последующего обучения преимущественно с помощью весов синапсических связей добиваются адекватной реакции сети.

Рис. 1.14. Нейродегустатор
2.7. Кора
Очевидно, мы не можем оставаться на том примитивном уровне, когда по предъявляемому изображению получается заключение типа "это буква х", "это — хорошо (вкусно)", "это — плохо" и т. д. В научном приложении на таких принципах можно построить модель собачки Павлова, демонстрирующей условный рефлекс при предъявлении этикетки "Pedigrее".
Но более серьезные применения должны использовать более сложные критерии логической выводимости.
Цепочки логических выводов, производимые человеком, содержат не одно, а много звеньев. Сделанные выводы вновь входят в конфигурацию изображений (входных векторов) для новых выводов, действий и т. д.
Буква нужна, чтобы распознать слово. Слово, — чтобы распознать предложение, уяснить его смысл, предпринять адекватные действия и т. д.
Тогда возникает вопрос о целесообразной структуре сети, где одни выводы, собираясь в различные конфигурации, как бы множась, вновь участвуют в формировании новых выводов. Здесь можно предположить как прямые, так и обратные связи, когда попутно сделанные выводы уточняют правильность всего умозаключения.
Технически возникает вопрос о такой концентрации выводов, когда совмещены понятия входного и выходного слоя. Это наводит на мысль о целесообразности существования такого универсального слоя — коры со связями между отдельными нейронами и целыми областями. На коре концентрируются выводы для немедленного участия в формировании других выводов.
2.8. Ключевые термины
Нейрон (нейроподобный элемент)– электронное, биохимическое или программное средство выполнения функции активации.
Функция активации – монотонно возрастающая по каждой переменной пороговая функция возбуждения нейрона. Переменные – величины возбуждения нейронов, связанных с данным, и раздельно подаваемые на его входы. При простейшем техническом (не биологическом) исполнении эти значения умножаются на веса входов (синапсических связей), складываются и, возможно, умножаются на нормирующий коэффициент, образуя величину возбуждения нейрона в случае преодоления порога.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 |



