Enter your keyword

10 principes van clickertraining

10 principes van clickertraining

1. De ontvanger bepaalt of iets voor hem een beloning is

Het is de ontvanger die de waarde van een beloning (of straf) bepaalt.
De ene vindt een ijsje lekker, en kan er dus mee beloond worden; de ander vindt ijsjes maar niks, en een ijsje krijgen kan hem dus niet motiveren.
Je kan wel zeggen dat jouw paard niet gemotiveerd kan worden door bijvoorbeeld een voerbeloning, maar dan moet je gewoon maar eens om je heen kijken hoeveel mensen niet eens beginnen met voer uit de hand te geven “omdat hun paard daar zo opdringerig van wordt”. Blijkbaar wil een paard toch een heleboel doen om aan een wortel te komen. Het is dus het paard dat bepaalt of hij iets wil doen voor een wortel – niet z’n mens.

De waarde van een beloning kan ook veranderen met de omstandigheden. Jij kan wel vinden dat je paard op een bepaald moment moet werken voor een wortel, maar als je hem een inspanning laat doen (zoals een jong paard doen draven onder het zadel) dan is de kans dat hij het stilstaan leuker vindt dan de wortel véél groter.
Je paard galoppeert graag en kan moeilijk rustig stappen? Dan is “rust” een foute beloning, en een wortelschijfje misschien niet voldoende beloning. Mogen galopperen is misschien wel de meest geschikte beloning voor rustig stappen.

Hoe weet je of iets een straf of een beloning was? Pas achteraf. Pas na een tijdje kan je zeggen of wat je deed, wel werkte. Werkt het niet en wordt je probleem niet opgelost of blijf je hangen in je oefening, dan is het tijd om niet alleen je trainingsplan, maar ook je beloning te evalueren en eventueel aan te passen.

2. De bridge markeert het moment dat het paard het juiste doet

Een bridge (de ‘click’ van een clicker, “yes” of “ex” zeggen of welk kort geluidje dan ook dat je gebruikt) vertelt je paard:

  • wat je nu doet, is goed
  • de oefening is gedaan
  • hier komt je beloning

Het woord ‘bridge’ komt van bridging stimulus. De bridge (de ‘click’) markeert een gebeurtenis, identificeert de gewenste respons, en overbrugt de tijd tussen respons (= wat het paard doet) en de aflevering van de beloning (in het begin is dat altijd een ‘primaire bekrachtiger’ zoals voer).

Je “markeert” het gewenste gedrag, alsof je klik! een foto maakt van het ‘moment suprème’ waarop het paard het goed doet. Het paard weet dat op de click de beloning volgt, en zal het gedrag waarvoor je clickt vaker gaan herhalen. Geleidelijk aan verfijn je het “ruwe” gedrag steeds meer tot je de complete oefening kent. Het belangrijkste aan clickertraining is dus het gebruik van dit overbruggingssignaal, waarmee je beter aan je paard kan uitleggen wat het precies is dat hij goed heeft gedaan.

De klik van een clicker, korte stemgeluiden zoals “ex”, “yes”, “goed”, een tongklik, een lichtflits, een fluitje,… zijn allemaal bridges.

3. Shaping is trainen in (zeer) kleine stappen

Shaping is een niet-wetenschapplijk woord het opbouwen van een bepaald gedrag, een oefening, door het in kleine opeenvolgende, logische stappen te splitsen en dan te belonen. In principe gebeurt elke goede training dus door shapen.

Als je uit de Dorrance-school komt, bijvoorbeeld (en daar hoort Parelli bij, die heeft de mosterd bij Tom Dorrance gehaald), dan heb je vast al gehoord “reward the slightest try”. Als dat zo is, dan ken je ook wel het gezegde “set it up and wait” – zet het op en wacht. Ook dat is kenmerkend voor shaping.

Shaping gebeurt in principe zonder fysieke controle of correcties, maar steunt op het zelf-lerende experimenteren, het zelf zoeken naar het juiste antwoord, van het paard.
Neem het doorhangen uit het touw zodat dat nét een beetje anders voelt, en wacht af wat er gebeurt. Reageert het paard ook maar een klein beetje in de richting van het juiste antwoord, dan wordt er prompt beloond.
Hou een target (bijvoorbeeld een kegeltje) nét onder de neus van het paard,en wacht af wat er gebeurt. Reageert het paard ook maar een klein beetje in de richting van het juiste antwoord, dan wordt er prompt (gebridget en) beloond.
En daarna wordt er een beetje meer gevraagd.

Het voordeel van die wachtfaze (die overigens soms maar een seconde duurt, afhankelijk van hoe groot je stap is en hoe snel je paard leert) is dat je kan zien hoe je paard leert. Welke keuzes hij maakt, hoe snel hij misschien afhaakt als hij niet zelf onmiddellijk het juiste antwoord vindt, waar hij ophoudt met proberen, of op welke oefeningen uit het verleden hij dan eventueel terugvalt.
De sterkte van shaping is dus vooral dat paarden het antwoord zélf vinden, dat ze zélf het probleem oplossen. En dat ze niet stressen als ze fouten maken. Vergissingen maken, jezelf bij elkaar rapen en opnieuw beginnen is een essentieel onderdeel van zelfleren en vergroot de emotionele weerstand bij stress. Shaping begeleidt niet alleen naar het juiste antwoord, maar laat ook ruimte om zelf de grenzen te ontdekken.

Dat laat een veel grotere indruk in het paardenbrein na dan als de dingen hem gewoon zouden overkomen, zoals dat zo vaak gebeurt. Er wordt hem immers toegelaten om ook fouten te maken, zonder dat dat extra consequenties heeft dan alleen maar de teleurstelling van het juiste antwoord niet gevonden te hebben.
De click in clickertraining markeert het juiste gedrag nog eens extra, zodat het paard nog sneller begrijpt dat hij op de goede weg naar het eind-gedrag zit. het leert hem volhouden in z’n zoektocht.

Shapen maakt dus een zelf-leerder van het paard (dat is waarschijnlijk geen goed Nederlands!). Het paard krijgt de verantwoordelijkheid om zélf te leren (weliswaar sterk begeleid), en verwerft dus een stukje autonomie in de training. Het is precies dat stukje autonomie dat zo waardevol is.
Als je mensen ziet clickertrainen die die autonomie niet toelaten, die zó strak hun stappenplan opzetten dat er voor het paard geen ruimte is voor experiment, dan is het dus geen correcte toepassing van het principe van shaping.

4. De meest simpele vorm van gedragsanalyse: het ABC van gedrag = oorzaak, gedrag, gevolg

Een ABC is de meest functionele manier om naar gedrag te kijken. Als clickertrainer leer je naar elke oefening kijken als een heel simpele rekensom. Uiteraard gaat er veel méér om dat zo’n ABC dat we onmiddellijk kunnen zien, maar daar maken we ons in het begin absoluut geen zorgen over. Dat komt later wel.
Als je het ABC van elk ‘probleem’ kan zien, kan je het meteen oplossen.

Antecedent 
= wat vooraf gaat aan een gedrag, de prikkel/oorzaak/stimulus. Het antecedent is wat er gebeurt net voor het gebeurt, dus dat wat het gedrag uitlokt; bijvoorbeeld: een plots, hard geluid.

Behavior
= het gedrag. Zowel een oefening als een probleem is eigenlijk een gedrag. Het gedrag wordt op een strikt functionele manier beschreven; bijvoorbeeld: het paard breekt uit de wei. Er worden dus geen veronderstellingen gemakt over wat het paard daarbij zou kunnen denken. Er wordt alleen gekeken naar wat er concreet gebeurt.

Consequence 
= gevolg. Waarom doet het paard dit? Waarom werkt dit gedrag voor hem? Wat haalt hij eruit?
Wordt het paard beter van dit gedrag te stellen, of niet? Het paard is vrij om te vluchten, weg van het geluid -> het paard is beloond voor dit gedrag en dus is de kans dat het paard dit de volgende keer nog doet, groter.

Kijk eens naar de allereerste clickertrainings-oefening, namelijk de handtarget.
A -> B -> C
Mens steekt hand uit -> Paard raakt hand aan + hoort een geluid -> krijgt een wortelschijfje.

“Paard raakt hand aan” wordt tegelijk gemarkeerd, geassocieerd met een geluid: een bridge. De bridge kondigt dus zelf ook de wortel aan, en is dus zelf ook een prikkel of stimulus. De bridge is dus NIET een consequence, een gevolg, maar iets dat tegelijk met het gedrag gebeurt (vanuit het standpunt van het paard gezien) en de wortel aankondigt. De bridge helpt dus de overbrugging (bridging stimulus) te maken van gedrag naar consequence.

5. Groen licht-cues: je paard weet al wat er van hem verwacht wordt en hij wacht op de cue om het te mógen doen

Je paard voelt zich eerst blij met het worteltje.
Daarna hoort hij steeds de bridge vóór het worteltje. Hij leert dat de bridge betekent dat er een worteltje aankomt, dus wordt hij al blij van het horen van de bridge.
Je vraagt steeds iets door middel van een cue (een hulp, een target, een woord, een gebaar…) en je paard weet dat hij makkelijk zal kunnen uitvoeren wat jij vraagt, en dat hij dus een bridge zal horen, en dat die bridge tot een worteltje zal leiden. Het paard wordt nu al blij bij het horen van de cue.
Je paard gaat dus gráág dingen willen doen; hij toont heel veel motivatie. De cue bepaalt wélke oefening hij mag doen (niet welke oefening hij moet doen or else) zodat hij die beloning kan krijgen. De cue werkt nu als een verkeerslicht dat op groen springt voor dit bepaalde gedrag.

6. Vergiftigde cues: belonen en straffen werken niet goed samen

Vergiftigde cues zijn het omgekeerde van groen licht-cues. Waar groen licht-cues iets fijns aankondigen, betekenen vergiftigde cues dat er waarschijnlijk iets sléchts aankomt. Het sleutelwoord is waarschijnlijk – want precies omdat het paard het niet zeker weet, gaat hij juist heel traag reageren. Als hij zéker wist dat er iets slechts aankomt, zou hij zich haasten om dat te voorkomen – dat is waarom gewelddadige training (“als je dit niet doet dan sla ik je”) wel goed werkt.
Een vergiftigde cue ontstaat dus als een paard niet kan voorspellen wat er gaat gebeuren: zal hij een worteltje krijgen, of een tik van de zweep? De wetenschappelijke term is approach-avoidance conflict.

7. Stimuluscontrole maakt trainingsmythes als ‘leiderschap’ en ‘respect’ volkomen naast de kwestie

Stimuluscontrole betekent net zoiets als ‘aan de hulpen staan’, gehoorzaamheid. Alleen is het iets dat je objectief kan zien en meten.

  • het paard doet de oefening elke keer en prompt als de cue wordt gegeven
  • het paard doet de oefening niet als de cue niet wordt gegeven
  • het paard doet de oefening niet als een andere cue wordt gegeven
  • het paard doet niet iets anders als de cue wordt gegeven

Stimuluscontrole gaat dus niet over dwang; het kan niet afgedwongen worden, het is een kwestie van begrip, van leren. Het betekent enkel dat het paard precies weet welke cue bij welk gedrag hoort, en dat ook elke keer doet.

Een nieuw clickergetraind paard gaat door een stadium waarbij hij veel verschillend gedrag aanbiedt, omdat hij probeert een beloning te krijgen. Dit betekent dat het paard wel het verband heeft gelegd tussen het doen van een oefening, de bridge en de beloning, maar hij weet nog niet wat cues zijn, en dat dit dus enkel werkt ná dat de trainer een cue geeft, en niet zonder dat er eerst een cue is. Deze motivatie zal uiteindelijk leiden tot groen licht-cues.

8. In lussen en kettingen trainen maakt training helderder en vloeiender

Een cue leidt tot een oefening, die leidt tot het horen van een bridge, die leidt tot het krijgen van de beloning.
Daarna volgt een nieuwe oefening. Het krijgen van de beloning vloeit dus ook over in de nieuwe oefening. Als elke nieuwe oefening vloeiend en zonder haperingen in een volgende (zelfde) oefening overvloeit, spreken we van een lus. Je zit dus als het ware in een flow van de ene oefening na de andere.
Het belonings-deel van een oefening is dus volwaardig onderdeel van de hele training, niet het afsluiten van één enkele oefening.

Als je meerdere oefeningen vloeiend kan uitvoeren, kan je ze ook vloeiend aan elkaar koppelen als in een ketting, waarbij de minst gekende of moeilijkste oefening wordt gevolgd door telkens steeds beter gekende of makkelijkere oefeningen. Het uitvoeren van iets moeilijks wordt dus steeds een beetje beloond door het mogen uitvoeren van een makkelijkere oefening, en zo helemaal tot bij de laatste oefening waar de click en de eigenlijke (voer-)beloning volgt.
Je leest hier meer over lussen en kettingen.

9. Clicken dient om een oefening aan te leren, niet om al gekend gedrag te onderhouden

Het grootste probleem van clickertrainers is niet dat ze moeten leren om te bridgen (clicken) en te belonen, maar om te weten wanneer ze dat NIET (meer) moeten doen. Het is namelijk erg belonend voor ménsen om te bridgen en belonen! Hoe voorkom je dat je paard zich gaat vervelen? Hoe hou je hem blij en nieuwsgierig? Inderdaad: door MINDER te bridgen en te belonen.
Daarom is het erg belangrijk dat je de criteria steeds verhoogt: als je mijn hand kan aanraken als ik die hand onder je neus hou, kan je het dan ook als ik mijn hand 410 cm verder hou? 20cm? Een meter? Aan de andere kant van de wei? Je vraagt steeds meer en hangt er steeds minder een worteltje achteraan. Andere criteria dan afstand of hoogte, diepte… zijn snelheid, onmiddellijkheid, duur, in combinatie met andere oefeningen, in andere omstandigheden enzovoort.
Ook belonen met andere dingen dan voer wordt belangrijk: een krabbel, een makkelijkere oefening (kettingen!), iets mogen doen wat het paard zelf graag doet enzovoort. Het heet immer clickertraining, niet voertraining!
Als je de criteria niet meer kan verhogen wordt het hoog tijd om te stoppen met clicken en de oefening om te zetten in een gewoonte. Over gewoontevorming leer je meer in ondermeer de cursus ‘Theory of Fun’.

10. Gedrag is emoties, emoties is gedrag

Last, but not least, want het overkoepelt AL je training, wat je methode ook is: Pavlov zit altijd op je schouderKlassiek conditioneren is immers niet helemaal wat je dacht dat het was – ja, het begon met Pavlov en z’n honden, maar de implicaties zijn veel breder dan dat. Elke cue die je geeft triggert niet alleen uiterlijk gedrag, maar ook innerlijk gedrag: emoties. Gedrag lokt emoties uit, emoties lokken gedrag uit. En ze worden samen onthouden. Je kan de uiting van emoties misschien wel onderdrukken, maar de emoties zelf zijn er om te blijven.
Er zijn dus nog een heleboel andere dingen die het welslagen van je oefening bepalen: heeft je paard wel echt fun als je zo met z’n tweeën bezig bent? Verveelt hij zich, of is hij voortdurend gefrustreerd? Voelt hij zich meester over z’n eigen lot? Kan hij de oefeningen wel aan? Voelt hij je oefeningen niet als zinloos aan? Ben je wel echt z’n maatje, of doet hij het omdat het moet?