der, suit le stimulus inconditionnel, il semble bien qu’un conditionnement vrai soit impossible ; mais cette question est controversée.
Les méthodes actuelles d’étude
neurophysiologique, et plus particulièrement électrophysiologique, com-downloadModeText.vue.download 38 sur 587
La Grande Encyclopédie Larousse - Vol. 6
2865
mencent à permettre de suivre de façon directe l’évolution des activités des diverses régions du système nerveux central durant un conditionnement.
Après avoir jeté un doute sur le rôle du cortex cérébral, rôle que Pavlov croyait déterminant, elles semblent conduire à le réaffirmer.
On a pris l’habitude d’appeler ren-
forcement le fait de présenter le stimulus inconditionnel après le stimulus neutre (ou conditionnel) ; cet usage est justifié par le fait qu’au cours de la première phase du conditionnement cette présentation produit en effet une augmentation de la force (c’est-à-dire de la fréquence, de l’amplitude ou de la rapidité) de la réaction conditionnelle ; ensuite, celle-ci cesse de croître et, aux oscillations accidentelles près, demeure stable. On continue toutefois à parler de « renforcement » ; celui-ci est en effet nécessaire, même lorsque la réaction conditionnelle est bien établie et consolidée, pour le maintenir. Si on le supprime durablement, la réponse conditionnelle décroît progressivement
— tout en continuant à être produite normalement par le stimulus inconditionnel lorsqu’il est présenté isolé-
ment ; finalement, l’absence durable de renforcement conduit à la disparition complète de la réaction conditionnelle : c’est l’extinction.
Il faut toutefois souligner que, si, au lieu de supprimer complètement le renforcement, on se borne à le pré-
senter occasionnellement, de façon intermittente, alors la réaction conditionnelle subsiste dans toute sa force ; elle devient même plus résistante à une éventuelle suppression totale ultérieure du renforcement. Un tel renforcement intermittent tire son importance de ce que, dans de nombreuses situations réelles de l’existence des animaux ou de l’homme, on peut constater que la conjonction d’un stimulus conditionnel et d’un stimulus inconditionnel est tantôt présente, tantôt absente ; le fait que le conditionnement subsiste dans ces cas a pour l’individu une grande valeur adaptative.
Le second type de
conditionnement
Les caractéristiques fondamentales de la réaction conditionnelle telles qu’elles avaient été établies par Pavlov et son école ont été étendues à peu près simultanément par les physiologistes polonais Jerzy Konorski et Stefan Miller et par le psychologue américain Burrhus Frederic Skinner à un second type de conditionnement, dénommé
opérant (Skinner) ou instrumental.
Pavlov lui-même n’a jamais reconnu comme réelle la distinction entre deux types de conditionnement et a interprété les faits nouveaux dont il a eu connaissance en termes de conditionnement classique. Toutefois, la réalité et l’originalité du conditionnement instrumental ou opérant sont aujourd’hui reconnues par à peu près tous les chercheurs, même s’ils tentent d’en découvrir, à un niveau plus profond, l’unité fondamentale avec le conditionnement classique.
Le schéma de l’établissement d’une réaction conditionnelle instrumentale ou opérante repose sur l’existence pré-
alable d’une réaction originelle et d’un stimulus renforçateur. Dans l’expé-
rience princeps de Miller et Konorski, la réaction est celle d’un chien qui soulève une de ses pattes antérieures, et le stimulus est constitué par de la viande ou une solution acide ; dans la situation étudiée par Skinner, on utilise une boîte comportant à l’intérieur un petit levier ; si le rat qui y est introduit appuie sur celui-ci, une boulette de nourriture lui est délivrée. Le fait fondamental est que la réaction qui a été suivie de façon régulière par l’administration de nourriture devient de plus en plus fréquente jusqu’à ce qu’elle ait atteint un plateau ; si cette réaction a été suivie par l’arrivée de liquide acide
— ou par une autre sorte de stimulus
« négatif », tel qu’un léger choc électrique —, sa fréquence décroît et elle finit par disparaître. Cette conjonction de la réaction et du stimulus qui la suit est appelée renforcement ; dans le cas où l’effet produit est une diminution plutôt qu’une augmentation de la force — en fait de la fréquence — de la réponse, on parle, par convention, de renforcement négatif.
Cela nous conduit à remarquer qu’au contraire de ce qui se passe dans le conditionnement classique il existe ici deux catégories de renforçateurs, dont les effets sont opposés : les renforçateurs positifs font croître la réaction, et les renforçateurs négatifs la font dé-
croître ; dans la situation pavlovienne, il n’existe qu’une seule sorte de renforçateur, dont l’action est toujours positive.
Une seconde différence tient à ce
que le stimulus renforçateur du conditionnement instrumental (opérant) n’est aucunement le déclencheur originel de la réaction à conditionner ; en d’autres termes, renforçateur n’est pas ici synonyme de stimulus inconditionnel. Cette dernière expression n’a, dans le nouveau type de conditionnement, aucun sens, car il n’est pas nécessaire que le stimulus renforçateur suscite une réaction quelle qu’elle soit ; et il n’est pas davantage indispensable que la réaction à conditionner possède originellement un stimulus propre.
Une dernière différence avait été mise en avant par Konorski et Miller, et reprise par de nombreux auteurs : c’est que seule une certaine catégorie de réactions — celles qui sont exécu-tées par les muscles striés — aurait été conditionnable de façon instrumentale.
À ce titre, la distinction entre les deux types de conditionnement aurait pu être rapprochée de celle qui existe entre les comportements involontaires et « volontaires » ; Konorski, par exemple, n’a pas hésité à utiliser ce dernier terme à propos du conditionnement instrumental d’animaux. Sans aller aussi loin, Skinner a caractérisé le comportement opérant comme étant « émis » par l’organisme, par opposition avec le comportement « répondant », qui est dé-
clenché par un stimulus externe et dont le réflexe, inconditionnel ou conditionnel classique, est le prototype. La parenté entre la réaction conditionnelle instrumentale ou opérante et l’activité volontaire s’exprime bien dans le langage ordinaire lorsque l’on affirme spontanément, par analogie avec
l’homme, que le rat ou le chien exé-
cutent leur réaction « pour » obtenir de la nourriture. Le problème théorique ainsi posé, celui des critères de l’activité volontaire est loin d’avoir reçu une solution scientifique définitive. On doit noter que, sur le point précis indiqué plus haut, des travaux récents ont été conduits à l’appui de l’hypothèse contraire à celle de Konorski, à savoir que même des réactions gouvernées par le système neurovégétatif — par exemple le rythme cardiaque ou des activités viscérales — peuvent être modifiées si on les fait suivre régu-lièrement d’un stimulus renforçateur ; mais, en dépit de résultats positifs en ce
sens, même ce problème expérimental limité ne peut aujourd’hui être considéré comme tranché.
Quoi qu’il en soit cependant dans le détail de l’importance des différences entre les deux types de conditionnement, il importe de souligner nettement que, lorsque l’on parle de « renforcement » en matière de conditionne-
ment instrumental ou opérant, on fait référence à une réalité expérimentale autre que celle que recouvre l’emploi pavlovien classique du même terme.
En fait, le renforcement instrumental ne désigne pas autre chose que la loi de l’effet énoncée par Edward Lee Thorndike.