Выбрать главу
Рис. 7.2. Эдуард Торндайк, американский психолог (1874-1949). Он впервые стал изучать решение животными задач в лабораторных условиях. Работы Торндайка привели его к теории научения методом проб и ошибок и к закону эффекта, на котором основана эта теория.
Рис. 7.3. «Проблемная клетка», разработанная Торндайком в 1911 году. Кошка, помещенная в такую клетку, должна была методом проб и ошибок научиться нажимать на деревянную педаль, что благодаря системе блоков и веревок позволяло открывать дверцу.
Наблюдая за животными, Торндайк заметил, что сначала их действия были чисто случайными, но в конце концов кошка «нечаянно» задевала веревку или крючок, освобождалась и получала вознаграждение. Однако по мере увеличения числа попыток действия животных все больше сосредоточивались вокруг «ключевого» участка клетки, и число ошибок, а также и время, проведенное в клетке, быстро сокращалось. Торндайк представил эти результаты в виде кривых (рис. 7.4) и вывел закономерности, позволяющие объяснить эффективность такого метода «проб и ошибок». Согласно важнейшей из этих закономерностей — закону эффекта , — в случае, если какое-то действие приводит к желательным результатам, вероятность его повторения возрастает, а если к нежелательным последствиям — снижается (см. документ 7.2).
Рис. 7.4. Кривые научения методом проб и ошибок. Сходные кривые получал Торндайк по данным своих опытов на кошках. Видно, что чем больше проб совершает животное, тем меньше становится число ошибок.
Однако научение методом проб и ошибок само по себе не очень эффективно. Если бы новые формы поведения удавалось «изобрести» лишь случайным образом, было бы трудно объяснить быстрое приобретение новых навыков людьми и домашними животными. Без сомнения, вполне вероятно, что на протяжении миллионов лет именно такой процесс приводил к выработке различных навыков у наших предков. Но не менее очевидно, что по мере совершенствования этих навыков и упрочения власти человека над окружающей средой постепенно складывались новые способы формирования и передачи новых типов поведения. Скиннер — признанный вождь американских бихевиористов в последние 30 лет — систематизировал теорию Торндайка, пытаясь объяснить, каким образом в структурированной среде формируется множество различных типов поведения. При этом Скиннер вскрыл принципы оперантного обусловливания и формирования реакций путем последовательных приближений.
Формирование реакций
С точки зрения Скиннера, поведение не всегда возникает чисто случайным образом — нередко оно формируется в результате отбора под действием подкрепляющего фактора. Таким фактором может быть любой стимул, появляющийся или исчезающий после той или иной поведенческой реакции и повышающий вероятность того, что эта реакция будет повторена с целью получить подкрепление. Это позволяет объяснить формирование очень сложных поведенческих реакций поэтапно, каждый этап при этом будет подкрепляться. Исходя из этих соображений, Скиннер разработал способ формирования поведения путем последовательных приближений , составляющий основу оперантного обусловливания. Этот способ состоит в том, что весь путь от исходного поведения (еще до начала обучения) до конечной реакции, которую исследователь стремится выработать у животного, разбивается на несколько этапов. В дальнейшем остается лишь последовательно и систематически подкреплять каждый из этих этапов и таким образом подводить животное к нужной форме поведения. При таком способе обучения животное вознаграждают за каждое действие, приближающее его к конечной цели, и у него постепенно вырабатывается заданное поведение. Допустим, что нам нужно обучить голубя ударять клювом по маленькому светящемуся кружку, когда он захочет получить вознаграждение в виде зернышка (рис. 7.5). Вначале мы будем давать ему зернышко каждый раз, когда он зайдет в ту половину клетки, где находится светящийся кружок. Далее мы будем вознаграждать его лишь в том случае, если он не только зашел в эту половину клетки, но еще и повернулся головой к стенке, на которой находится кружок. На третьем этапе можно, например, давать зернышко при сочетании этих двух условий, если вдобавок еще клюв животного направлен в сторону кружка. Затем постепенно можно заставить голубя касаться клювом кружка и, наконец, ударять по нему с целью получить вознаграждение. Как мы видим, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе (рис. 7.6).