revenir sur l'accueil

Nos pages "conseils".

Divers textes glânés sur le net ou observations au seins de notre élevage de Shiba Inu, n'oubliez jamais que seul un vétérinaire ou un spécialiste peuvent vous conseiller et ceci uniquement après avoir ausculté votre chien !! sur le net tout est vrai, et tout est faux ou mal adapté car chaque chien est différent selon la race, son éducation et son environnement.



Le conditionnement selon Pavlov, Skinner



Définitions tirées de Pamela J.Reid dans son livre EXCEL-Erated Learning.

 

 

Stimulus = Réponse = Conséquence

 

 

Renforcement Positif : Le R+ implique la présentation d’une bonne conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis’ (stimulus), le chien s’assoie (réponse) et vous lui donner un biscuit (conséquence). Ceci sert à augmenter la possibilité d’une bonne réponse dans le futur. Majoritairement, l’entraînement d’un chien est basé sur des méthodes qui incorporent le R+. Le comportement humain est aussi régit par le R+ : l’enfant fait ses devoirs, l’enfant obtient une bonne note ; une personne travaille fort pour plusieurs mois, la personne profite ensuite d’une période de vacances.

 

Renforcement Négatif : Le R- implique le retrait d’une mauvaise conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis’ en tirant sur le collier étrangleur, le chien s’assoie et vous arrêtez la pression sur le collier (vous relâchez la laisse). Ceci sert aussi à augmenter la possibilité d’une bonne réponse dans le futur. R- est aussi une méthode commune pour contrôler le comportement : l’enfant fait ses devoirs pour éviter de se faire punir par maman; une personne frappe sur le mur pour se plaindre du bruit du voisin.

 

Punition Positive : La P+ implique la présentation d’une mauvaise conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis, le chien se couche, vous le replacer assis en tirant sur la laisse, vous relâchez dès que le chien est en position assise. Ceci sert à diminuer la possibilité de cette réponse (position couchée) dans le futur. On voit beaucoup de P+ : l’enfant frappe son frère, le père puni l’enfant; le chiot urine sur le plancher, le chiot reçoit un coup de journal roulé.

 

Punition négative : La P- implique le retrait d’une bonne conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis’, le chien se couche, vous mangez le biscuit que vous vouliez lui donner. Ceci sert aussi à diminuer la possibilité de la réponse (position couchée) dans le futur. L’enfant dérange à la table pendant le repas, la télé se ferme; la personne conduit en état d’ébriété, la personne perd son permis de conduire.

 

 

Action (Réponse)

 

 

 

Stimulus

 

Donner

Retirer

Bon

R+

Présenter quelque chose de bien

Renforci le comportement

P-

Retirer quelque chose de bien

Diminue le comportement

Mauvais

P+

Présenter quelque chose de ‘mal’

Diminue le comportement

R-

Retirer quelque chose de ‘mal’

Renforci le comportement

 

 

RENFORCEMENT positif ou négatif augmente la possibilité du comportement (réponse)

 

PUNITION positive ou négative diminue la possibilité du comportement (réponse)

 

Toujours selon Pamela, les 4 stages de l’apprentissage sont :

 

  1. acquisition (j’apprends)
  2. compréhension (j’exécute)
  3. généralisation (j’exécute peut importe l’environnement ou les distractions)
  4. maintenance (je pratique pour ne pas oublier)

 


Dans l'expérience de Pavlov, le chien reçoit un entraînement. On teste d'abord séparément l'effet du stimulus porteur de sens (1), la nourriture, et du stimulus neutre (2), la cloche, pour voir leurs effets sur l'animal. Une fois les résultats préliminaires obtenus, on associe le stimulus conditionnant (1) au stimulus neutre (2) de manière répétitive. Si le conditionnement réussit - que l'animal met en mémoire le lien entre les deux stimuli - le stimulus neutre seul (2) devient conditionné et entraîne les mêmes effets physiologiques que le stimulus conditionnant (1). Ce processus de conditionnement est également à l'œuvre dans la dépendance toxicomane.


Chez tous les animaux, les conditionnements consistent à associer un stimulus dit neutre avec un stimulus porteur de sens. Le plus parlant est certainement celui que l'on appelle du chien de Pavlov. Ivan Pavlov, un scientifique russe né au milieu du XIXe siècle, travaillait sur la salivation des chiens. Au cours de ses expériences, il s'aperçut que cette salivation débutait en fait avant la présentation de la nourriture à l'animal. Ce dernier savait d'une certaine manière que l'heure du dîner approchait et préparait son corps à la prise de nourriture. En testant différents stimulus sonores qu'il répétait chaque fois avant l'arrivée de la nourriture, Pavlov réussit à faire saliver les animaux dès la perception du son. L'animal avait alors appris à associer un stimulus neutre, le son, avec un stimulus porteur de sens, la prise de nourriture. Cet apprentissage laisse une trace dans la mémoire de l'animal, qui lorsqu'il entend le son seul, pense inconsciemment à la nourriture et se mettra à saliver même si les conditions ont changé et qu'aucune nourriture ne lui est apportée.

Ce processus de conditionnement arrive à chacun dans différents domaines et permet la mise en mémoire de nombreuses associations plus ou moins simples. La prise de drogue, qui s'accompagne généralement d'une sensation de bien-être, en est le parfait exemple : l'individu se sent mieux dès lors qu'il sait avoir son produit sous la main et être en mesure de l'utiliser quand il en a envie...

Principe du conditionnement classique : association entre un événement qui déclenche automatiquement une réponse ( stimulus dit inconditionnel) et un élément neutre (stimulus dit conditionnel).
Exemple, Le célèbre conditionnement  de Pavlov, La présentation de nourriture (stimulus inconditionnel) à un chien entraine forcement une salivation si on associe le nourriture au bruit d’une sonnette, après quelques répétitions la sonnette fera saliver le chien même sans nourriture
Principe du conditionnement opérant : Apprentissage par erreur et essai, car la réponse à des conséquence positives ou négatives qui entraîne une fixation du comportement ou son abandon.
Exemple: si on propose deux leviers bien distinct dans une cage, la pression sur l’un donne de la nourriture et l’autre une aspersion d’eau, il apprendra très rapidement à n’utiliser que le levier donnant la nourriture. La nourriture est un renforcement positif alors que l’aspersion d’eau est une punition.
Le conditionnement opérant définit les notions de punitions et de récompenses
1 Conditionnement opérant

La contribution théorique majeure de B.F. Skinner (1904-1990) à la psychologie est le concept de conditionnement opérant, qu'il distingue du conditionnement classique pavlovien ou conditionnement répondant (terme qu'il invente lui-même). Une classe de comportement constitue un opérant si la probabilité d'apparition de ces réponses est modulable par la manipulation des contingences de renforcement. En clair, on dira qu'une action est conditionnée de manière opérante quand sa fréquence augmente dans le comportement d'un organisme du fait de ses conséquences positives pour l'organisme. Dans le conditionnement classique un stimulus entraîne une réponse, dans le conditionnement opérant, on renforce une réponse par la manipulation des contingences.

2 Reforcement et punition

L'apprentissage skinnerien repose sur deux éléments, le renforcement et la punition, pouvant chacun être soit positif soit négatif. Ces termes doivent être pris dans le sens précis du conditionnement opérant :

Un renforcement ou une punition peut être soit :

3 Les différents types de conditionnement opérant

Ainsi, il existe 4 types de conditionnement opérant :

4 Les renforçateurs

Il existe 2 sortes de renforçateurs (éléments de renforcement) :


Un stimulus dont l’ajout va avoir tendance à renforcer un comportement sera appelé un renforçateur positif (R+).

De nombreuses expériences ont été faites sur les renforçateurs et sur les punitions utilisés séparément.
Je cherchais depuis quelques temps déjà un article scientifique  qui analyserait l’utilisation simultanée de renforçateur et de punition. La troisième partie de l’article traite justement de cela, je vais en faire un résumé, en ajoutant quelques exemples canins.

L’approche classique et l’état de l’art

Les études sur ce sujet portent généralement sur l’utilisation punitions et de récompenses utilisées simultanément. Ces études arrivent à la conclusion que les 2 stimulus s’annulent mutuellement, ou à minima, un des 2 perd de son influence. Et c’est quasiment toujours la punition qui prend le dessus sur le renforçateur, voire pire, sa conséquence s’en trouve augmentée.
Pas très encourageant pour une utilisation en dressage canin.

Mais d’autres études basées sur le pré-conditionnement ont montré que renforçateur et punition pouvaient interagir de façon efficaces. Ces études utilisent 4 « motivateurs »:

Certaines associations se renforcent, d’autres s’inhibent (voir graphique suivant)

image-association

Les pointillés indiquent les renforcements et les traits pleins les inhibitions.

Certaines inhibitions sont simples à comprendre. Par exemple, si le chien a systématiquement une récompense, il ne sera pas frustré par l’absence de l’arrivée de la récompense. Au contraire, cela sera vécu comme une punition (retrait d’une récompense qui est estimée comme étant due).

Les 2 combinaisons qui se renforcent mutuellement sont :

  • Espoir / soulagement
  • Peur / frustration

Arrêtons-nous un instant sur cela, et prenons un exemple canin.
Pour empêcher un chien de courir après les chats, on le punit à chaque fois qu’il démarre. Le chien étant têtu, et aimant particulièrement courir après les chats, il va sans arrêt recommencer, même en sachant qu’il sera puni systématiquement. Sa peur de la punition renforce sa frustration de ne pas courir après le chat, ce qui le motive encore plus à le faire.

Mais un jour, on se laisse surprendre, et il n’a pas la punition attendue (soulagement). Cela va renforcer son espoir de récompense (attraper le chat) , et donc renforcer son envie de courir après les chats …
Dans tous les cas, le maître est perdant.

Prenons un autre exemple : le chien connaît parfaitement un exercice, et sait qu’il débouche parfois sur une récompense (espoir). Mais un jour, il se laisse distraire, et sait qu’il risque d’être parfois puni pour cela (peur). Mais la punition n’arrive pas (soulagement), et il se remet alors sur l’exercice avec encore plus de motivation. Le soulagement a renforcé son espoir …. Le jour où vous vivez cette situation, je peux vous assurer que vous êtes fier de votre toutou, et vous pouvez être fier de votre dressage …..




 Toutes ces informations sur :


http://edutechwiki.unige.ch/fr/Conditionnement_op%C3%A9rant_(Skinner)_-_Enseignement_programm%C3%A9


Un grand merci pour cette explication claire.

© Copyright 2003-2023 temple-okami.com - tous droits reservés