Что случится, если вы постараетесь научить дельфина простым прыжкам от вас по указанию, но не используя свисток? Во-первых, вы не сможете правильно выбрать время для вознаграждения рыбой, когда животное сделало плохой прыжок. Поэтому не имеет значения, какой прыжок сделало животное, ему всё равно потом дадут рыбу или не дадут рыбы вовсе. У вас нет возможности объяснить животному, почему один прыжок будет вознаграждён, а другой нет, или какой прыжок вам понравился больше. Был ли он достаточно высоким? Или вам понравилось, как животное уплывает или подплывает? Чтобы разработать прыжок нужной высоты, своевременности и направления, вы должны исключить все неточности методом проб и ошибок на многочисленных дрессировках. Вы будете счастливы, если животному не надоест (и дрессировщику тоже!), прежде чем исполнение будет правильным и точным.
Из-за отсутствия информации об этом, тот дрессировщик, который использует пищу как вознаграждение безусловного подкрепления обычно получает животное, которое работает энергично, но учится медленно. Мы наблюдали это и на собаках, которых вознаграждали многократно лакомством без какого-то ясного сигнала, который бы точно обозначил подкрепляемое действие. Эти собаки полны энтузиазма и дружелюбия, но они ничего не знают.
Дрессировка с лакомством эффективна всегда, но без условного подкрепления, например кликера, собака может стать одержимой попрошайкой.
К тому же если дрессировщик использует пищу без условного подкрепления, животное учится постоянно следить за дрессировщиком в ожидании пищи. Лошади суют нос вам в карман, а собаки лижут руки. Дельфины плавают вокруг дрессировщика и боготворят ведро с рыбой. Если животное постоянно следит за дрессировщиком, очень трудно научить дельфина прыгать в противоположном направлении, к публике.
Когда вы выработали условное подкрепление, вы сможете идентифицировать действие на расстоянии или когда животное двигается от вас. Поэтому хорошо обученное животное вместо того, чтобы надоедать вам своим попрошайничеством, будет делать своё дело, но одновременно внимательно слушать магический звук, чтобы оно ни делало: для лошадей и собак эта внимательность имеет огромное обучающее значение сама по себе.
Поскольку сигнал позволяет отмечать доли секунды, то свистком можно развить у животного точное понимание, чего хочет дрессировщик. Это позволит обучить животное, чему вы хотите, очень чётко и подробно. Например, пусть дельфин выучил одно правило (прыгать в заданном направлении), поэтому вы уверены, что он почти всегда прыгает в правильном направлении по вашему сигналу. Теперь добавим новые детали или правила. Вы решили: «Я буду подкреплять только высокие прыжки». Дельфин достаточно быстро учится новым деталям («Я должен прыгать в этом направлении и прыгать высоко»).
Этот постепенный процесс кажется очень тщательно разработанным, но на практике это фантастически короткий способ обучения сложному поведению. Даже с необученным дельфином дрессировщик может разработать эффектное и специфическое поведение по одному указанию (например, поклон на публику, который я описывала) за два-три дня, а иногда, если все идёт хорошо, и за один десятиминутный урок. Много раз за мою работу с дельфинами мне удавалось «схватить» определённое действие, сформировать его в нечто особенное и научить делать его по одному указанию всего за один урок, об этом говорят и другие дрессировщики дельфинов.
За один десятиминутный урок вы легко сможете переложить методы дрессировки дельфинов для собаки при использовании условного подкрепления. Некоторые собаки боятся свистков. Лучшим условным подкреплением для собак является кликер, маленькая коробочка, которая при надавливании на металлическую пластинку издаёт щелчок. Её можно купить в магазинах для животных или заказать по Интернету.
Как только вы увидите что собака напряжена и ждёт лакомства, знайте, что сигнал (щелчок) стал условным подкреплением
Возьмите с собой кликер и немного лакомства. Разделите лакомство на маленькие кусочки, так чтобы вознаградить собаку пятнадцать-двадцать раз, но не насытить её. Некоторые собаки будут работать за сухой корм, особенно перед кормёжкой, но обычно лучше взять что-то более соблазнительное.
Научите собаку распознавать щелчок кликера, щёлкая и давая лакомство раз пять в различных частях комнаты или сада (чтобы у собаки не появилось мысли, что кликер работает только в одном определённом месте).
Затем щёлкните кликером и помедлите с лакомством несколько секунд. Если вы увидите, что собака напряглась и ждёт лакомство, знайте, что сигнал стал условным подкреплением. Теперь вы можете создавать поведение, мы называем этот процесс «формированием».
Легче всего сформировать поведение под названием «Поймай свой хвост». Конечно, существует столько способов, как добиться этого поведения, сколько придумывают дрессировщики: вы можете повернуть собаку вокруг себя за ошейник, вы можете положить кусочек бекона на кончик хвоста, чтобы собака обернулась вокруг себя, чтобы полизать хвост. Но есть только один способ добиться этого сразу без принуждений.
Прекратите щёлкать кликером и немного подождите. Ваша собака может быть заинтригована и возбуждена, когда вы ничего не делаете. Она может крутиться и даже заскулить или залаять. В тот момент, когда собака движется или поворачивается в нужном вам направлении, щёлкните кликером. Дайте лакомство.
Опять подождите. Не обращайте внимания на все остальные действия собаки, за исключением правильного (не ждите чуда, один поворот головы или один шаг передней лапой в правильном направлении — это всё, что вам нужно). Если «поймали» это поведение, если у вас хорошее чувство времени, за три или четыре подкрепления вы можете добиться, что собака поворачивается в нужном направлении чаще и быстрее.
Теперь вам не нужно подкрепление после первого шага в нужном направлении, но вы должны подкреплять весь поворот в нужном направлении, который состоит из нескольких шагов, возможно, каждую четверть круга, а после того, как собака освоит эти четвертинки круга, обучение полному повороту пойдёт ещё быстрее.
Гриффа учат поворачиваться по кругу. За каждое правильное движение ему щёлкают кликером.
Это лучший момент прекратить первый урок: остановка после маленькой победы — вот золотое правило. На следующий день возьмите кликер, кучу лакомств и начните с первого шага, затем сделайте четверть круга, а затем полный круг, вы увидите, что во второй раз все пойдёт намного быстрее.
После обучения повороту на один круг переходите к следующему шагу — повороту на два круга, а затем уже к следующему и очень важному шагу — разнообразию подкрепления — в одном случае подкрепляйте половину круга, в другом два круга или один или три полных круга, или даже один с четвертью, такой порядок ваших действий заставит собаку быть очень внимательной. Когда собака поймёт, что от неё требуется, вы можете ввести знак рукой или словесное указание, чтобы собака выполняла этот трюк, только когда её попросят.