А потом произошла забавная вещь. Уоллаби начал предугадывать, когда Питер попросит его прыгнуть, и ждал от него сигнала, зная, что будет вознагражден. И уже скоро Уоллаби просек, что получит лакомство, только когда Питер скомандует ему: «Уоллаби, кенгуру!» По мере того, как Питер учился контролировать прыжки своей собаки, он также учил Уоллаби самоконтролю и в итоге превратил его прежде плохое поведение в забавный трюк, которым они оба наслаждались!
История Питера наглядно демонстрирует, что наказание совсем не обязательно должно выражаться в физическом воздействии, вроде удара собаке коленом в грудь, который вообще легко может отбить у Зака желание приближаться к Питеру. Наказание также может выражаться в отсутствии поощрения, если оно ослабляет только что продемонстрированное поведение собаки, так что оно с малой долей вероятности случится в будущем. Другими словами: Питер наказал Уоллаби. Но как? Если Уоллаби прыгал, кода Питер его об этом не просил, он не хвалил Уоллаби или не давал лакомство, просто отворачивался и игнорировал его. Отсутствие поощрения становится наказанием. Мы называем это отрицательным наказанием, и для Уоллаби это означает, что он не получил никакого поощрения, которое было ценно для него (внимание Питера или лакомство). Отрицательное наказание подобно запрету родителей выходить из дома для ребенка постарше, перерыв в занятиях ребенка помладше или запрет смотреть телевизор вечером. Это лишение привилегии.
Положительным наказанием для Уоллаби было бы, если бы Питер сделал ему физическое внушение, скажем, коленом в грудь, когда тот попытался бы прыгнуть. В отношении ребенка положительным наказанием является окрик или шлепок. Если бы родители только шлепали ребенка, когда он не слушался, то единственной наградой для него было бы не получить шлепка – это называется отрицательным подкреплением.
Данное представление об отрицательном и положительном не имеет ничего общего с сопоставлением плохого и хорошего. Отрицательное означает забирать; положительное – давать. Таким образом, положительное подкрепление означает дать подкрепление или поощрение. Отрицательное подкрепление означает не дать этого поощрения.
Дрессировка собак с помощью методики положительного подкрепления ориентирована на получение поощрения. Вот почему мы используем одновременно и положительное подкрепление (когда поощряем) и отрицательное наказание (когда лишаем поощрения). Традиционные методы дрессировки ориентированы на наказание. Те, кто им следуют, стремятся выделить положительное наказание (производя физическую коррекцию в форме резкого окрика или рывка поводка со строгим ошейником) и отрицательное подкрепление (лишение наказания, например, не дергать поводок со строгим ошейником).
Это различие между отрицательным и положительным может вызвать некоторое недопонимание, поэтому вернемся к Питеру и Уоллаби. Питер использовал модель положительного подкрепления, чтобы изменить поведение Уоллаби, убедительно говоря ему: «Мне нравится, что ты прыгаешь; сделай это еще несколько раз». Поощрение подкрепляло положительное поведение Уоллаби. Питер наказывал Уоллаби с помощью метода отрицательного наказания: никакой похвалы или лакомства, если Уоллаби прыгал, когда Питер не просил его об этом, что означало: «Ты можешь прыгать весь день, но я тебя игнорирую. Делать так не имеет никакого смысла».
Давайте представим, что Питер продолжил использовать традиционную аверсивную модель дрессировки. Если бы Уоллаби прыгнул на Питера, тогда он вынужден был применить положительное наказание, физический или вербальный выговор. Этим положительным наказанием он должен был сказать Уоллаби: «Не прыгай». Когда Уоллаби не прыгал, Питер не делал ничего, что является отрицательным поощрением: Уоллаби не получал наказания. Иными словами, Питер пытался сказать Уоллаби: «Когда ты не прыгаешь, это не значит плохо». Отрицательным поощрением является попытка подкрепить положительное поведение Уоллаби (не прыгать).