Training & Learning – Blog 05 – Reward like a Pro

Training & Learning – Blog 05 – Rewarding like a Pro – Part 1

Training & Lernen – Blog 05 – Belohnen wie ein Profi – Teil 1

  • In the last Blog we discussed the role of punishment for training purposes – and we found out that it mostly is NOT a very useful tool for learning at all, because it does not accomplish what the giver wanted to achieve.
  • We want to change the every-day reward and punishment into  “indulgerlings and annoyerlings” – the difference being that those would truly trigger those feelings in the recipient, which you want him to experience as a consequence for his behaviour.

Pro-active punishment:

  • For punishment we already found the solution. We have to apply it, if at all, in such a way that the animal still has the possibility to change his behaviour for the better – and can thus earn himself a reward.  This is called “pro-active punishment”.

But not so simple:

  • For effective pro-active punishing one has to know one’s animal’s body language very exactly and has to react very quickly. That is not as easy as it sounds – so why not rather choose a method of training, which we can apply easier and more pleasantly – and which works always. We learn with Eva Wiemers to „reward like a professional“.

We give the animal a chance to earn a reward:

  • This time we look for characteristics which help the animal to draw conclusions from the failure, which we stopped with our pro-active action, toward a desired alternative solution.
  • This however can only succeed, if the horse already knows or is familiar with such an alternative action – knows it either by nature or from earlier lessons.
  • But how has he learned such an alternative solution – and learned it in such a way that he will remember it reliably at the right moment? To achieve this we have to turn a desired reaction by the horse into a good habit – so this reaction will change from a possible answer of the horse into an almost sure one.
  • E.W. „Choice and application of the consequences decide the success or failure of the learning procedure… (if they) are chosen and applied properly, then they pinpoint exactly each success and associate it with a feeling of happiness.”

Here we pick up the trail of true reinforcement!

  • Reinforcing is a scientific term, which we have to understand precisely.
  • In the series “Your horse’s IQ” we explained it in part 06 – in particular the meaning of “positive” versus “negative” reinforcement.

When does a reinforcer truly motivate the trainee?

  • “Reinforcement means that, caused by increased motivation, first the frequency of the desired behaviour increases, then also the intensity, with which it is presented… (only then) .. is it a true motivator. Otherwise it was just an “indulgerling”.”
  • So depending on whether the behaviour has “paid off” (meaning: has been perceived as fitness-improving) in the eyes of the horse, he will show it more often or more rarely.

True motivators must satisfy a need!

  • Needs can be very different from individual to individual (personal preferences, as mentioned before – we are not allowed to draw conclusions from our own preferences!)
  • Needs can differ depending on the situation – the offer must be suitable at the given moment!
  • Sometimes s.th. enjoyable must be added to be motivating, but sometimes s.th. disagreeable must disappear (see positive and negative reinforcement).
  • Motivators also vary with the degree of a more or less happy relationship with the trainer!

For all these instances, Eva Wiemers gives marvellous examples in her book, which I cannot repeat here. (p. 76 ff)

It boils down to this:

  • mere relief (when a disagreeable stimulus disappears) can’t be a substitute for joy or enthusiasm! and…
  • an occasional victory is not enough!

Which motivators can we rely on:

1)  Primary reinforcers:

  • also called natural reinforcers, because those are stimuli understandable to the horse without having to be learned:

For a horse those stem from the following functions

  • feeding
  • social behaviour (play, hanging out)
  • comfort (grooming, rolling)
  • resting (pauses, end of work session)
  • exploration and curiosity

2)   secondary reinforcers:

  • those are learned reinforcers – they are used in place of the natural ones, because one can tade them in. For humans this is mainly money! for our horses this can be a word of praise, sound of the clicker or such – signifying that the reward will follow it.
  • We will talk about reinforcers again and again – they are the alpha and omega of our training.
  • Teaching with purely positive reinforcers was developed by trainers, who worked with animals like dolphins or birds – with such non-domesticated animals one can’t achieve anything with pressure, since that only scares them.
  • With horse trainers this took root considerably later, perhaps because such domesticated animals had accepted a certain sense of submission, so that controlling procedures were in many cases achieving results – and nobody was concerned with the resulting possible feelings of reluctance or aversion of the concerned animals.

E.W. “ The surprising results of training with signals and rewarding motivation are the same for all animals: for trainer and trainee sheer fun, enthusiastic and self-motivated pupils, and as consequence: super fast learning with long lasting effect.”

Read on !!

  • Im letzten Blog diskutierten wir die Rolle von Strafen bei der Ausbildung – und erfuhren, daß sie meist ganz und gar KEIN effektives Lernmittel sind, weil sie nicht erzielen, was der Bestrafende damit erreichen wollte.
  • Wir wollen die gängige Belohnung und Bestrafung in „Verwöhnerli und Vergrätzlerli“ verwandeln – und der Unterschied ist, daß diese wirklich im Empfänger genau die Gefühle erzeugen, die Sie in ihm als Konsequenz für sein Verhalten auslösen wollen.

Pro-aktive Strafe:

  • Bei der Strafe haben wir die Lösung schon gefunden. Wir müssen, wenn überhaupt, dann so strafen, daß dem Tier immer noch die Möglichkeit bleibt, sein Verhalten zum Besseren zu verändern – und sich so eine Belohnung zu verdienen. Das nennt man „pro-aktives Strafen“.

Gar nicht so einfach:

  • Für effektives pro-aktives Strafen muß man aber die Körpersprache seines Pferdes sehr gut kennen und sehr schnell reagieren. Es ist gar nicht so einfach – und so wollen wir lieber eine Trainingsmethode wählen, die wir angenehmer und leichter anwenden können – und die immer funktioniert. Wir lernen bei Eva Wiemers „Belohnen wie ein Profi“ !

Wir geben dem Tier die Chance sich eine Belohnung zu verdienen:

  • Dieses Mal suchen wir nach Merkmalen, die dem Tier helfen, aus dem Mißerfolgserlebnis, welches wir mit pro-aktivem Vorgehen abgestoppt haben, Rückschlüsse auf ein erwünschtes Alternativ- Verhalten zu ziehen.
  • Das kann aber nur erfolgreich passieren, wenn das Pferd so ein Alternativverhalten schon kennt und kann – entweder von Natur aus oder eben früher schon gelernt.
  • Wie hat es aber solch ein Alternativverhalten gelernt – und zwar so, daß es sich im richtigen Moment daran verläßlich erinnert? Dazu müssen wir eine erwünschte Reaktion des Pferdes zu einer guten Gewohnheit machen können – damit diese Reaktion aus einer möglichen Antwort des Pferdes eine fast sichere wird.E.W.: „Auswahl und Anwendung der Konsequenzen entscheiden über Erfolg oder Misserfolg des Lernvorgangs. … (wenn sie) richtig gewählt und angewendet werden, dann kennzeichnen sie punktgenau jeden Erfolg und verknüpfen ihn mit einem „Glücksgefühl“.

Hier kommen wir nun den echten Verstärkern auf die Spur!

  • Verstärken ist ein verhaltenswissenschaftlicher Begriff, den man genau verstehen muß.
  • In der Serie „Der IQ Ihres Pferdes“ haben wir im Teil 06 schon von Bestärkung (das selbe wie Verstärkung, diese Begriffe kann man austauschen) gesprochen und das „positiv“ versus „negativ“ erklärt.

Wann motiviert ein Verstärker wirklich?

  • „Verstärkung heißt, daß sich als Folge einer verstärkten Motivation zunächst die Häufigkeit erhöht, mit der ein Verhalten auftritt, danach sich auch die Intensität verstärkt, mit der es gezeigt wird. …  (nur dann) .. ist er ein Motivierer. Sonst war er eben nur ein „Verwöhnerli“.“
  • Je nachdem also, ob sich ein Verhalten für das Pferd „gelohnt“ hat (als fitnessverbessernd aufgefaßt wurde), wird es das Verhalten öfter oder seltener zeigen.

Daher müssen Motivierer ein Bedürfnis befriedigen!

  • Bedürfnisse können je nach Individuum sehr verschieden sein (individuelle Vorlieben, wie schon besprochen – wir dürfen da nicht von uns aus schließen!)
  • Bedürfnisse können je nach Situation verschieden sein – das Angebot muß im gegebenen Augenblick stimmen!
  • Manchmal muß etwas Angenehmes kommen, um motivierend zu sein, manchmal aber auch etwas Unangenehmes verschwinden! (siehe positive und negativer Verstärkung)
  • Motivierer variieren auch mit dem Grad der guten Beziehung mit dem Trainer!

Hier gibt uns Evas Buch ganz wunderbare Beispiele, die ich nicht wiederholen kann. (S. 76 ff)

Fazit:

  • bloße Erleichterung (über das Verschwinden eines unangenehmen Reizes) kann kein Ersatz für Freude oder gar Beigeisterung sein!

und…

  • ein gelegentlicher Sieg genügt nicht!

Auf was für Motivierer können wir uns verlassen:

1)   primäre Verstärker:

  • natürliche Motivierer sind instinktiv verständliche Reize, das Pferd muß sie nicht lernen: die Wissenschaftler nennen das primäre Verstärker.

Beim Pferd kommen diese aus folgenden Funktionskreisen:

  • Freßverhalten
  • Sozialverhalten (Spiel u. Zusammensein)
  • Komfortverhalten (Fellpflege, Wälzen)
  • Ruheverhalten (Pause, Ende der Arbeit)
  • Erkundungs- u. Neugierverhalten

2)   sekundäre Verstärker:

  • sind gelernte Verstärker – sie sind stellvertretend für natürliche Verstärker, weil man sie dagegen eintauschen kann. Bei Menschen ist das hauptsächlich Geld! Bei unseren Pferden kann das z.B. ein Lobeswort oder der Ton eines Klickers sein – weil das Pferd weiß, daß die Belohnung darauf folgt.
  • Über Verstärker werden wir immer wieder sprechen – sie sind das A und O unseres Trainings. Das Ausbilden mit rein positiver Verstärkung wurde von Trainers entwickelt, die mit Tieren wie Delphinen, Vögeln u.a. arbeiteten – bei solchen nicht-domestizierten Tieren kann man mit Druck gar nichts erreichen, da es ihnen nur Angst einflößt.
  • Bei Pferdetrainern hat es sich erst wesentlich später eingebürgert – vielleicht, weil man domestizierten Tieren eine gewisse Unterwerfungsbereitschaft bereits angezüchtet hatte, so daß man mit kontrollierenden Maßnahmen durchaus Ergebnisse erzielen konnte – und auf die dabei entstehenden Unlustgefühle der Tiere keine Rücksicht nahm.

E.W. „Die erstaunlichen Auswirkungen eines Trainings mit Signalen und belohnender Motivierung sind bei allen Tieren dieselben: für Trainer und Schüler purer Spaß, begeisterte und selbstmotivierte Schüler, und als Folge davon: besonders schnelles Lernen mit lang anhaltender Wirkung.“

Lesen Sie weiter !!

This entry was posted in Training & Learning. Bookmark the permalink.