Als je paard zichzelf beloont
Soms doet je paard iets dat je niet wil, maar waar je moeilijk kan tussenkomen. Zoals naar beneden duiken om gras te eten, en daardoor beloont hij zichzelf – hij zal het dus blijven doen. Hoe los je dat op?
Het grasprobleem staat concreet opgelost in het Grondwerkboek, maar hieronder, nog wat extra info.
Egon schreef:
Hoe muteer je ongewenst gedrag wanneer een jackpot die dat gedrag veroorzaakt onontkoombaar is?
Beest doet spontaan gedrag dat (ongetwijfeld naar verwachting van beest) een al dan niet lange chain naar een jackpot triggert. Open vraag: hoe doof je dit initiële gedrag uit?
Dit is net zoals aan de telefoon: “dokter mijn kind doet zo raar”, “da’s niks mevrouw, 2 aspirientjes zullen zeker helpen”.
Tja Egon – Ik héb geen algemeen antwoord. “It depends”.
Er zijn 2 manieren: aanmoedigen, of ontmoedigen. Dat is net zo’n algemeen antwoord als jouw vraagstelling.
Wat doet het paard, hoe zijn de omstandigheden? Wat gebeurt er voor het gebeurt? Hoort bij gedragsanalyse om dat toch ongeveer te weten. Ik geef niet voor niks ethologie/gedragsfysiologie/anatomie/biomechanica enz enz voor ik nog maar aan leertheorie toe ben in m’n theorieklassen.
Breek de chain, controleer de jackpot, zet het gedrag op cue, train iets incompatibels…. kies er eentje uit en ga het trainen.
Hoewel het een abstracte vraag is kan ik me wel zeer concrete dingen voorstellen. Bijvoorbeeld toen ik het plan had opgevat om Gazelle een appel te laten brengen. Niet in een emmer of zo (dat is relatief eenvoudig, zie Fran en Zenghi voor een live voorbeeld, eerste filmpje). Ook als de appel op m’n hand lag met haar neus ertegen, dan nog was “nee” genoeg om haar eraf te laten blijven. Maar ik wou dus wel dat ze ‘m vasthield tussen haar tanden. Maar dàt is jackpot dan, als het fout gaat. Ze is er niet meer, en ik ben nooit zover geraakt, omdat ik wou weten wat ik zou doen àls het zou gebeuren. De meest voor de hand liggende (en waarschijnlijk snelst werkende) oplossing is het moment van de zelfbelonende jackpot aversief maken, maar dat is niet echt wat je in gedachten had neem ik aan.
Ik wil er graag een ander (bekend) voorbeeld aan toevoegen:
Op veel locaties beginnen opgehokte paarden tegen deuren te schoppen (o.i.d.) omdat hun biologische klok op “etenstijd” staat. De jackpot hier is “etenstijd”. De jackpot bestaat dus al en afschaffen gaat ook niet want ze moeten toch vroeg of laat te eten krijgen…. Ik weet al wat het onregelmatig in tijd maken van de jackpot veroorzaakt: een evenzo diffuus gespreid schopgedrag. Ik weet ook dat dit een hels voorbeeld is en de oplossing “alle deuren open zetten EN er geen voertijd op na houden” voor de hand ligt maar laten we nu voor het werkmodel even aannemen dat dit geen opties zijn.
Maar dat vind ik nu juist niet zo’n moeilijke oplossing (het is een FAQ in mijn lessen trainingspsychologie). ’t Is te zeggen, de oplossing is simpel, het is dat het zoveel tijd kost om het op die manier te trainen, want het is reactief: je kan natuurlijk gewoon via extinctie werken, paard voor paard. Je krijgt wat je beloont, dus zo lang paarden ook effectief eten krijgen als ze dit kabaal maken, blijven ze het doen. Voor de paarden leidt het kabaal maken tot voer, elke keer weer. Hoe meer kabaal ze maken, hoe sneller het voer komt, dat zelfs ook vaak, want mensen worden er horendol van en willen er snel vanaf. Oplossing: wachten tot het stil wordt, en dan pas geven. Duurt waarschijnlijk even, maar het is zeer effectief.
Of een andere, proactieve oplossing is bvb dat ze paarden op de cue van de er-komt-eten-aan-geluiden leren staan met hun neus tegen een muurtarget, waar ze pas vandaan mogen komen als het eten in de bak valt (incompatibel gdrag trainen). Het spontane gedrag wordt omgebogen naar iets anders, dat wél beloond wordt. Het enige verschil is dat dit gedrag van buitenaf wordt aangeleerd, maar daarna “spontaan” aangeboden wordt vanwege beloond. Voor het paard blijft het hetzelfde – ik doe iets, en dat brengt mij iets op.
En nee, het is niet hetzelfde als de appel die Gazelle vasthoudt, want het voer op een manège heb je onder controle, die appel tussen die héle grote tanden niet.
Ik had die appel bijten aversief kunnen maken door op het moment dat ze beet heel veel lawaai te maken en haar straf achteruit te sturen. Voor sommigen zou dat misschien “niet genoeg” zijn maar voor Gazelle zou de hemel op haar hoofd gevallen zijn, want ik deed dat nooit, straffen. Dat zou in principe voldoende geweest zijn – maar het is niet hoe ik het zou willen trainen.
Eerlijk gezegd denk ik dat het met voldoende opbouw gewoon had gekund. Ik vertel in mijn lessen altijd over die keer dat ik Gazelle een leren bitje leerde pakken terwijl het gefilmd werd (ja ja ik weet het, maar het is al een tijd geleden). Op een gegeven moment doet ze haar mond open en laat ze er 20 wortelschijfjes uitvallen. Ik denk dat ze ze gewoon aannam omdat het erbij hoorde, niet omdat het voor haar belangrijk was.
Uiteraard (Murphy!) staat dat stuk film op een oude imac die niet meer opstart, zonder ooit gebackupt te zijn, want dat vond ik toen niet nodig. Gah.
Op een bepaald moment is het voer zélf dus minder belangrijk dan het spelletje. Dat is het moment waarop je weer kan gaan trainen, dus. Vanaf dat je Elvis bent, met een betere show dan wat het ook is dat je paard nu beter vindt dan jou. En dan gewoon trainen. En volhouden. En trainen. En volhouden. En… je begrijpt het al.