Один из знакомых Карен Прайор увлекался игрой в сквош (род тенниса). Однажды он сказал, что попробует метод положительного подкрепления на своей игре в сквош. Через несколько дней этот человек рассказал вот что: «Сначала я чувствовал себя жутким дураком, приговаривая при каждом удачном ударе «Хорошо, Пит, молодец». Но потом моя игра начала улучшаться. Я побеждаю тех, у которых прежде не мог выиграть даже очко. И я получаю гораздо больше удовольствия. Я не ору на себя все время, не злюсь и не расстраиваюсь. Если удар не получается, ничего страшного, следующие будут хорошими. Мне теперь просто смешно, когда кто-нибудь другой делает ошибку, бесится, бросает ракетку. Я знаю - это его игру не улучшит».
Подкрепление - понятие относительное. Дождь, например, положительное подкрепление для уток, отрицательное - для кошек и довольно безразличное явление для коров. Пища не подкрепление для того, кто сыт. Улыбки и похвала не годятся в качестве подкрепления, если тот, кому они адресованы, хочет вывести вас из себя. Подкрепление - это ведь что-то приятное, а в этом случае ему скорее будет приятно, если вы разозлитесь.
В принципе, нужно знать, для какой ситуации какие подкрепления являются подходящими. Почти все дети любят, чтобы их хвалили. Но если у ребенка к вам явно отрицательное отношение, то ваша похвала для него не подкрепление.
Желательно иметь в своем распоряжении несколько различных подкреплений, чтобы «воспитываемый» не знал, чем именно его подкрепят в следующий раз.
Положительным подкреплением является, например, подарок. Выбирать подарки и дарить их - это искусство, Чтобы выбрать подарок, нужно знать, что интересует другого человека, что может быть для него приятным; очень важно также выбрать удачный момент для вручения подарка.
Отрицательное подкрепление
Если положительное подкрепление - это то, что обучаемый будет стремиться получить, то отрицательное - то, чего он будет стараться избегать.
Но нужно отличать отрицательное подкрепление от наказания. Наказание происходит после поведения, и избежать наказания, изменив поведение, нельзя, так как поведение уже осуществилось. Малыш, которого отшлепали за плохую оценку, не может изменить оценку, которую он принес. Отрицательное же подкрепление можно остановить изменением поведения, т. е. оно дается в процессе поведения. Допустим, сидя в гостях у тетушки, вы случайно положили ноги на журнальный столик. Тетушка неодобрительно нахмуривается. Вы опускаете ноги на пол. Лицо тетушки смягчается. Это и есть отрицательное подкрепление.
Обычно управление лошадью тоже основано на отрицательном подкреплении: лошадь поворачивает потому, что стремится избежать неприятного ощущения, возникавшего при натягивании повода.
Время подачи подкрепления
Подкрепление - это информация. Оно сообщает, что собственно вы хотите, что именно вам нужно. Поэтому подкрепление нужно давать вовремя.
Запоздалое подкрепление - это самая большая ошибка. Например, собака садится, но к тому моменту, как хозяин говорит «хорошая собака», она уже снова стоит. За то, думает собака, ее похвалили? За то, что она встала.
Раннее подкрепление тоже неэффективно. В зоопарке Бронкса был такой случай. В вольере жила горилла. Служителям было нужно, чтобы она выходила в вольер, когда нужно почистить внутреннюю клетку, а у нее была привычка сидеть в дверях. Служители клали снаружи пищу, подманивали ее бананами, - горилла либо не обращала на них внимания, либо хватала пищу и оказывалась возле авери, прежде чем ее успевали закрыть. Наконец позвали Дрессировщика. Он объяснил служителям, что они пытались подкрепить действие, которого не было. Это называется взяточничеством. Подкреплять же надо гориллу, когда она сама выйдет из двери и подойдет к решетке. Задача была решена.
Система вариабельного подкрепления лежит в основе всех азартных игр. Если бы вы, играя в рулетку, каждый раз выигрывали, то не стали бы играть.
Правило при вариабельном режиме таково: чем реже, непредсказуемей подкрепления, тем лучше.
Долговременная программа поведения
Иногда бывает необходимо использовать фиксированный и вариабельный режимы одновременно. Так бывает тогда, когда подкрепление в фиксированном режиме (т. е. когда обучаемый точно знает, когда и за что получает подкрепление) осуществляется через слишком большой промежуток времени. При этом часто проявляется феномен отсроченного начала, когда человек бесконечно откладывает начало какой-нибудь работы. В этих случаях нужно ввести подкрепление именно за старт либо разбить весь процесс на кусочки и давать за них подкрепления в вариабельном режима.
Карен Прайор рассказывает, что одно время она посещала вечерние занятия. Это требовало много времени, и каждый раз как приближался час занятий, у нее появлялось сильное желание не пойти. Тогда она разбила поездку на пять этапов: до метро, посадка, пересадка на другой поезд, путь до университета и, наконец, подъем в лифте до аудитории, и стала подкреплять их в вариабельном режиме кусочками шоколада. Через некоторое время она оказалась способной проделать весь путь без шоколада и без внутренней борьбы.
Чего можно добиться с помощью положительного подкрепления
Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мать девушки. Ока была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. «Не беспокойся, мама, - сказала дочь. - Поживем - увидим». Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей.
Процесс выработки поведения. Формирование высших форм поведения
Что такое процесс выработки? До сих пор мы говорили о том, как с помощью подкреплений закреплять поведение, которое уже имеется. Но как заставить своих подопечных делать то, чего они никогда не делают?
Оказывается, можно добиться и этого.
Нужно установить ряд последовательных целей (разбить задачу на этапы), найти какой-то элемент доведения, который осуществляется уже сейчас, и использовать его как первый шаг. Затем нужно шаг за шагом подвигаться к поставленной цели.
Вот, например, как К. Прайор обучила цыпленка вальсировать. Она давала ему подкрепление всякий раз, как он поворачивался налево. Скоро первая цель была достигнута: цыпленок стал поворачиваться часто. Тогда дрессировщица стала подкреплять только самые большие повороты и, наконец, только несколько поворотов сразу, т. е. она воспитала вальсирующего цыпленка.
Выработка поведения применяется при обучении большинству процессов физических и умственных навыков: при обучении печатанию на машинке, вязанию, обучении счету, письму и т. п.
Есть два аспекта выработки: способы и приемы, т. е. последовательность шагов, необходимых для выработки нового типа поведения, и закономерности, или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться.
Десять правил выработки
1. Повышайте требования постепенно, небольшими градациями, чтобы у ученика всегда была реальная возможность получить подкрепление. Если вы повышаете критерий так сильно, что ученику надо совершить усилие значительно большее, чем он совершал ранее на занятиях, вы сильно рискуете. Поведение может быть сорвано.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Хорошие преподаватели оставляют данную задачу, как только в ней достигнут успех, и переходят к другой. Однако когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием.