Устройство с таким мозгом, которое, кстати, несложно реализовать на практике, отчасти ведет себя как живой организм. Сначала его поведение полностью определяется рефлексами и представляет собой реакцию на состояние датчиков. В рефлексы прошиты образы, узнавание которых вызывает ответные реакции. По мере накопления опыта возникает способность узнавать новые изначально неизвестные образы и реагировать на них. В условиях, когда датчиков, отображающих внешний мир, не так много, в памяти могут фиксироваться противоречивые воспоминания. При одной и той же картине одни и те же действия могут вести к разным результатам. Это означает, что либо из-за недостаточности информации были отождествлены две разные внешние ситуации, либо само явление носит случайный характер. Но в любом случае устройство начинает следовать такому поведению, которое с наибольшей вероятностью сулит положительное изменение состояния «хорошо – плохо».
Уместный вопрос: как задать изначальные безусловные рефлексы и рефлексы оценочного восприятия? Природа ответила на этот вопрос, запустив процесс естественного отбора и свойственный ему метод проб и ошибок. Для робота можно попытаться задать рефлексы экспертно, руководствуясь определенной логикой. А можно попытаться повторить путь природы, но тогда придется задать среду, естественный отбор и условия выживания и наследования.
Вся описанная конструкция – это одна из разновидностей персептрона. Персептрон — это нейронная сеть, состоящая из входных (S), ассоциативных (A) и реагирующих элементов (R), с переменной матрицей взаимодействия, определяемой последовательностью прошлых состояний активности сети. Термин был введен Фрэнком Розенблаттом в 1957 году. Ему же принадлежит первая реализация в виде электронной машины «Марк-1» в 1960 году. Персептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером (Rosenblatt, 1962).
Рисунок 11. Персептрон Розенблатта
Сам принцип, когда новый опыт изменяет структуру нейронной сети, называется «обучением с подкреплением». Для персептрона необходимо задать систему управления подкреплением. Задача этой системы - оценить успешность взаимодействия устройства со средой и на основе полученных знаний изменить веса ассоциативных элементов таким образом, чтобы повысить шансы устройства на последующий успех. Что считать успехом – это тот вопрос, который всецело зависит от системы управления подкреплением и соответственно тех задач, для решения которых она создается. В нашем случае система подкрепления — это внешняя среда, оценочное восприятие и характер его участия в формировании памяти.
Разработкой систем, которые действуют по принципу эмоционального управления, успешно занимается Александр Жданов. Описание теории и примеры работающих систем можно найти в его книге «Автономный искусственный интеллект» (Жданов, 2009), которую могу порекомендовать каждому, кто хочет найти строгое формализованное изложение. В свои модели Жданов закладывает те же эмоциональные принципы, что описываем мы в этой книге. В его интерпретации обобщенная схема мозга робота выглядит следующим образом: