Chování pod kontrolou signálem

Chování pod kontrolou signálem

Všichni víme, že koně bývají například při hře s koňskými kamarády schopni používat složité chování, jako třeba letmé přeskoky a řadu dalších. Ale předvést to samé pod jezdcem v požadovaný okamžik, to už je něco docela jiného. Podobně se mnoho z nás setkalo s tím, že nám kůň nabízí chování, o které jsme právě nežádali. Nemusí se jednat jen o “špatné” chování. Naopak může to být chování, které v mnoha jiných situacích oceňujeme, a proto je velmi dobře natrénováno. Většina koní trénovaných pozitivním posílením má své oblíbené chování a rádo je nabízí. Ne vždy však ve správný okamžik. Tyto příklady mají jedno společné a tím je, že v nich popisujeme chování, která dosud nejsou pod kontrolou signálem.

V předchozích dílech jsme si vysvětlovali, že trénink – učení chování, je proces založený na tom, že každé chování má své důsledky. Některé přinášejí úspěch, jiné ne. Podle toho jak koník vnímá důsledek svého chování, se rozhoduje, zda v podobné situaci bude znovu zkoušet chování opakovat, anebo se mu raději vyhne a zkusí jiné chování.

Pro klikr trénink je typické, že používá signály místo povelů. Signál koně informuje o příležitosti získat odměnu, ale navíc dává koníkovi přesnou informaci, za jaké chování odměnu získá.

Manners = jak získat odměnu

Pokud chování vedlo opakovaně k úspěchu, stává se oblíbené a s tím je často spojena snaha rychle jej znovu zopakovat a dosáhnout tak dalšího úspěchu. Tuto snahu a zájem chování předvádět označujeme jako drive (tah na branku). Tato chuť k práci je na jedné straně něco, co vlastně chceme u koníka získat, protože to znamená, že ho trénink a aktivity s námi baví. Má důvod se učit a chování, která se takto naučí, budou silná v základech a trvalá. Na druhou stranu pokud takto nadšeného koníka nenaučíme určitým pravidlům hry, může se pro nás stát koníkův drive obtěžující. Pokud se vám stalo, že vás koník kvůli odměnám obtěžuje, není to vinou odměn – jen jste koníka nenaučili, jak se správně tahle hra hraje.  

V této souvislosti jsem v minulém díle zmiňoval učení tzv. manners. Což představuje přípravu koníka takovým způsobem, aby bylo od počátku práce s odměnami jasně stanoveno, jak se má koník chovat během tréninku. Nejedná se o zákazy. Naopak. Manners ujasňují, kdy a za jakých podmínek kůň získá odměnu. To zahrnuje dvě důležité věci. Způsob jakým si koník říká o “start”, tedy něco jako “Ahoj, jsem tady a chci úkol”.  A následně jakým způsobem si převezme odměnu za splnění úkolu. Učí se kontrolovat své chování v přítomnosti odměn a nás. Snaží se proto, že právě tuto snahu v obou případech odměňujeme.

Já učím koníky, aby si o “start” říkali tím, že dojdou ke mně a postaví se do pozice, kdy jsou přibližně rozhraním svého krku a plece vedle mého pravého ramene. Součástí této pozice je i hlava koníka přibližně přímo před sebe. Teprve potom dávám koníkovi úkol. Jedním z náročnějších požadavků (kriterii chování) je celková uvolněnost koníka v této pozici. Z  počátku to pro koně bývá příliš náročný požadavek, právě díky drive spojenému s odměnami, nejčastěji s jídlem. Proto požadavek na celkové uvolnění zařazujeme až jako jedno z pozdějších kritérií cviku, kdy koník dokáže mnohem lépe pracovat se svou sebekontrolou. Pokud je koníkova nervozita už na začátku příliš velká a trénink se nedaří, prostě zkuste méně zajímavé odměny.

U klikr tréninku je důležité nejen načasování markeru, tedy momentu, kdy koníkovi říkáme, za které chování získává odměnu. Stejně důležité je místo, kde se skutečně odměna objeví k dispozici pro sežrání. V základní pozici, kdy je koník vedle nás, potřebujeme získat právě to tzv. klidové chování u jídla (manners). Očekáváme, že se nebude na pamlsky dobývat. Z pohledu koníka je toto dost nejasný požadavek. Mnohem srozumitelnější je ukázat mu, ve které pozici pamlsek skutečně dostane. Pozice pro předání odměny, kterou používám já, je v podstatě identická jako pozice, kterou si koník říká o úkol.

Jak takovou základní pozici vysvětlit? Naklikat 🙂 Je to hra, při které koníkovi říkáme, že šanci na získání odměny má jen tehdy, bude-li se tvářit, „že ji vůbec nechce“. Mám tedy odměnu v ruce, a pokud se koník k odměně dobývá, ruka se ani nehne, zůstane zavřená. Jakmile na okamžik přeruší dobývání do dlaně, nebo přímo odkloní hlavu, kliknu a rychle dám ruku s odměnou před hlavu koně tak, že ji může získat, jen pokud má hlavu přímo před sebe. Z počátku v zavřené dlani, kterou otevřu až v místě, ve kterém chci, aby se koník naučil čekat na svou odměnu po tom, co uslyší marker. Většina koníků tuto hru pochopí během několika málo opakování a začne si hlavu držet mírně odkloněnou ode mě, hned když zjistí, že je příležitost získat odměnu.

Toto klidné chování v přítomnosti pamlsků, neobtěžování člověka, je chování, ke kterému nikdy nedáváme žádný povel. Neříkáme koníkovi “teď se chovej slušně”. Je to chování, které se stane součástí každého tréninku. Chování, které koník začne dělat automaticky, bez našich povelů a kontroly. Prostě proto, že se pro něj stane součást hry, zábavné, příjemné i bezpečné pro nás i pro koně, díky naučeným manners  – jasným a srozumitelným pravidlům.

Nulová varianta chování = jak se nedostat do problémů

Důležitou součásti klikr tréninku je také chování, kterým nám koník dává najevo, že neví, co má udělat, nerozumí nám, nebo není schopen nám vyhovět. Použije jej i v situacích, se kterými si sám neví rady a od nás nedostává žádný signál o tom, jak by měl reagovat. Toto chování je tedy jakousi jeho žádostí o pomoc: “Stop, tohle nedávám”. Tomuto chování říkáme nulová varianta chování (z anglického “default behavior”).

Může to být target, na který koník odejde a postaví se na něj, ale také třeba zastavení se skloněním krku a hlavy. Mělo by jít o chování, které nelze nijak “zesilovat”. Což znamená, že koník nemůže nijak zesílit projev tohoto chování, aby na sebe výrazněji upozornil. Já si  z praktických důvodů vybírám druhou možnost – stát se skloněným krkem a hlavou. Je to dostupné chování i v terénu, kde nemáme připravený target. A zároveň toto chování pomáhá koníkovi relaxovat, uvolňovat nahromaděný stres. Jedním z projevů stresu je zatnutí svalů krku a pak je pro koně velmi příjemné protáhnout si šíji. Navíc je pak snadné a příjemné pomoci si tím, že nechám koně chvíli se popást. Pasení uvolňuje endorfiny a ty pomáhají vyplavovat z těla ven stresové hormony.

Takové sklonění hlavy a šíje snadno naklikáme jako jakékoli jiné chování. Po malých kouscích odměňujeme jakýkoliv náznak toho, že se koňská hlava hýbe směrem dolů. Obvykle po pár lekcích máme koníka, který nabízí sklánění hlavy. V tento okamžik je dobré přidat tomuto chování signál (jak na to si povíme vzápětí). Signál u nulové varianty budeme používat jen chvíli. Jde o to, napovědět koníkovi, jak ze zapeklité situace ven. Aby se nulové chování stalo informací pro člověka o potřebě koně zastavit trénink, musíme nejprve koníkovi dát šanci pochopit, jak to celé funguje.

Kdykoliv tedy máme v tréninkové lekci pocit, že si s koníkem nerozumíme, a ten začíná být pomaličku frustrovaný, můžeme zavelet chování “skloň hlavu” a díky tomu máme hned co odměnit. Poté přerušíme lekci, dáme si s koníkem pauzu, vydýcháme to. Po chvilce relaxace můžeme znovu zkusit to, na čem jsme pracovali s využitím jednodušších kriterií.

Po nějaké době koník sám začne chápat, jak celá ta věc s nulovým chováním funguje – když se se svým člověkem ztratíme v porozumění, vždycky je tu možnost udělat “skloň hlavu” a tím zastavit lekci. Teprve tehdy, když si koník začne toto chování vybírat a nabízet sám, stává se tou “stopkou” a slůvkem ve vzájemné komunikaci, kterým na nás koník upozorňuje, že nám nerozumí a potřebuje zastavit lekci a pauzu.

Signál pro “hlavu dolů” můžeme následně používat třeba k nasazování ohlávky. A zároveň ho koník ho může kdykoliv předvést i sám, bez našeho signálu. Nulová varianta chování, která se vyskytne během tréninku bez signálu trenéra, je pak důležitou zpětnou vazbou o tom, že některý požadavek tréninku nastavil mimo možnosti koně. Kůň nám není schopen vyhovět, proto nám nabídne nulové chování, protože jsme jej naučili, že je to “vždy správné chování”. Rozhodně bychom tuto informaci neměli ignorovat ani koně nutit pokračovat v původním cviku.

Nulová varianta funguje dokonce i jako jakási “bezpečnostní pojistka” v případech, kdy se koník dostane do situace, ve které neví jak se zachovat, nebo propadá panice. Díky tomu že nulová varianta představuje pro koníka chování, které je “vždycky správné”, zvolí s velkou pravděpodobností toto chování, místo klasických únikových chování, kterými by mohl ohrozit sebe i nás.

Důvod proč manners a nulovou variantu zmiňuji právě zde je, že obě tyto chování se trochu vymykají potřebě kontrolovat chování koně našimi signály. U manners dokonce žádný signál nemáme, jak jsme si pověděli výše. U nulové varianty jej použijeme, ale slouží především k tomu, abychom koníkovi ukázali cestu, jak nám sdělit důležitou informaci. Obě tato chování jsou důležitou součásti klikr tréninku. Aby fungovaly, potřebujeme, aby je koník používal “sám od sebe”. V okamžicích, kdy nám potřebuje předat informaci o tom, že je připraven a má chuť pracovat. Případně že je v situaci, se kterou si neví rady a potřebuje po nás, abychom ji ukončili dřív, než ji přestane zvládat.

Rozdíl mezi podnětem a signálem

Podnětem k chování může být cokoli z prostředí. Oproti tomu signály přímo souvisejí s člověkem. Například chceme-li koníka naučit obcházet nějaký předmět, kužel, nebo strom, musíme mít ve výběhu současně strom, koníka, sebe a s sebou odměny. Člověk je zde nezbytný, zná pravidla hry, ví co je cílem hry. Díky tomu, že koně chápou, jak svým chováním ovlivňují důsledky, které jejich chování  má, velmi rychle pochopí i koncept “odměny za chování”. Člověk se tak pro koníka stává partnerem ve hře. Tím, s kým potřebuje spolupracovat, chce-li získat odměnu, o kterou stojí. Jsou-li tedy splněny výše uvedené podmínky, začínáme s námi koníkem hrát hru na “přihořívá, přihořívá, hoří” (viz shaping, z minulého dílu). Ve své podstatě koník začíná nabízet chování a sledovat, kterým svým chováním člověka přiměje kliknout a následně jej odměnit.

Tyto podmínky nazýváme podněty. V našem příkladu jsou podnětem k obcházení stromu přítomnost stromu a současně přítomnost člověka a odměn. Pokud není ve výběhu strom, nelze jej obcházet. Koník tak pravděpodobně nabídne jiné chování, aby odměny získal. A opačně, nebude-li k dispozici člověk nebo odměna, nebude pro koně mít žádný smysl obcházet strom.

Pomocí shapingu jsme tedy naučili a následně posilovali chování “obejdi strom”. Koník nám toto chování s radostí předvádí, protože pochopil, že tím z nás snadno dostane odměnu. Po pár dnech ovšem zjistíme, že sotva přijdeme do výběhu, začíná kůň obcházet strom a významně po nás pokukovat. Pokud se s ním pokusíme začít trénovat jakékoli jiné chování, je nesmírně těžké jej přesvědčit, aby zkusil nabídnout cokoli jiného. Je tedy třeba takové chování ”dostat pod  kontrolu signálem“. Což neznamená nic jiného, než že potřebujeme koníkovi vysvětlit, že odměnu za obcházení stromu je možné získat jen tehdy, když mu k tomu dáme signál.

Při klikr tréninku náš signál k chování přestavuje pro koně příležitost, ne povinnost chování vykonat. V případě že by se během tréninku kůň rozhodl na náš signál nereagovat, ztratil by tím příležitost získat odměnu. Opakem odměny není potrestání koně, ale to, že odměnu nezíská.

Signál předává informaci, kdy a za jakých okolností má smysl předvádět naučené chování. Signál je spojený vždy s naší přítomností a aktivitou – my vydáváme signály, nepřicházejí z prostředí samy. Signály jsou spojeny s cílem našeho tréninku, když vydáme signál a koník předvede to, co od něj chceme, nastává spokojenost na obou stranách.

Přidání signálu

Protože časem budeme mít s koníkem naučených celou řadu nejrůznějších chování, potřebujeme mu nejen dávat informaci, kdy má smysl chování předvádět, ale také informaci které konkrétní chování povede k získání odměny. Signál tak zároveň pro koně rozlišuje jednotlivé již naučené chování od sebe.

Přidání signálu má jako všechno ostatní v klikr tréninku určitá pravidla. Řekněme, že jsme koníka naučili obcházet ne strom, ale kužel. Když si tedy vezmeme koníka třeba na jízdárnu, postavíme doprostřed kužel a koník jej začne sám od sebe obcházet. Z toho je zřejmé, že jsme toto chování úspěšně tzv. naklikali, proběhl proces shapingu a koník se naučil nové chování. Teď je potřeba koníkovi sdělit, že má chování dělat tehdy, když ho o něj požádáme. Postup je možné si rozdělit do čtyř postupných kroků – sérií cvičení.

Prvním krokem je, že říkáme budoucí signál v okamžiku, kdy probíhá chování. Postavíme kužel, koník začne obcházet a my mu k tomu říkáme “okolo”. Odklikneme, podáme odměnu. A následně několikrát zopakujeme.

Druhým krokem je, předřazení signálu před chování. Postavíme kužel, koníka krátce přidržíme za ohlávku, řekneme “okolo” a koníka vypustíme, aby kužel obešel. Je důležité, aby se nám povedlo říci signál před tím, než se koník rozejde a začne obcházek kolem kuželu. Opět několikrát opakujeme.

V třetím kroku začneme odměňovat pouze ty pokusy, kdy koník chování předvede až po našem signálu. Postavíme kužel, koníka přidržíme za ohlávku, neřekneme nic a pustíme. Pokud kužel obejde, nezíská kliknutí ani pamlsek. V této části musíme dát pozor. Tato zkušenost může být pro koníka hodně frustrující (zde může koník reagovat nulovou variantou chování). Proto si pomůžeme úpravou podmínek tréninku.

Postavíme se s koníkem dál od kuželu. Až na hranici vzdálenosti, která ještě koníka láká ke snaze obejít kužel.  V této vzdálenosti koníkovi pustíme ohlávku a řekneme “okolo”. Za pohyb kolem kuželu získá odměnu.Střídáme pokusy se signálem “okolo” a bez signálu. Odměnu koník získává za obcházení kuželu, případně za postupně se zvětšující se náznaky pohybu ke kuželu a okolo něj. A také získává odměny za pokusy bez signálu, při kterých zůstal stát.

Poslední důležitá část třetího kroku je, že postupně začneme označovat a odměňovat pouze ty pokusy, kdy obchází kužel pouze na náš signál.

A v posledním čtvrtém kroku, postupně vynecháváme z tréninku klikr. Pokud se nám chování líbí, je ve své konečné podobě, má přiřazen signál a nechceme na něm nic dalšího měnit ani zlepšovat, postupně vynecháváme kliknutí a koníka za provedení chování prostě jen odměníme.

Tímto postupem koníka naučíme, aby pozornost kuželu věnoval jen tehdy, když k tomu dáme signál a jinak kužel ignoroval, věnoval se jiné práci s námi. Teprve tehdy můžeme říci, že chování koně kontrolujeme signálem.

Aby bylo možné s jistotou říct, že dokážeme chování kontrolovat signálem, mělo by splňovat tyto čtyři podmínky zároveň:

  1.  Koník předvádí požadované chování vždy, když k tomu dostane správný signál.
  2.  Koník toto chování nikdy nepřevádí, pokud tento signál nedostane.
  3.  Koník toto chování nepředvádí na žádný jiný signál.
  4.  Koník nepřevádí na tento signál žádné jiné chování.

Zachycené chování

Už víme, že existují chování jako manners a nulová varianta, u kterých signál nepoužíváme. Také že u chování  vytvořených tvarováním (shapingem), přidáváme signál většinou až nakonec k hotovému chování. Další skupinou jsou chování, která potřebujeme kontrolovat signálem co nejdříve. Jsou to chování naučené pomocí zachycení (viz předchozí díl). Zachytit lze chování, která koník již používá, nejčastěji jsou to přirozená chování. V podstatě jde o to, že vidím-li zajímavé chování koně, mohu je označit a začít posilovat jejich používání.

Řekněme, že se nám líbí hrabání přední nohou. Upřímně – zachycovat a odměňovat hrabání naprosto nedoporučuji. Je to chování, které se u koní objevuje ve spojení s pocitem nervozity, stresu. A jako takové v případě frustrace koníka může snadno zesílit až k tomu, že koník buď hrabe nohou téměř neustále (představte si nervózního člověka, který neustále bubnuje prsty o desku stolu), nebo dokonce může zesílit tak, že nás koník tímto chováním ohrožuje. Z tohoto důvodu hrabání přední nohou nezachycuji a neodměňuji prakticky nikdy. Španělský krok a podobné cviky učím jiným způsobem. Přes dotek nohou na target. Podrobněji se tréninku těchto cviků můžeme věnovat v některém následujícím díle.

Ale dejme tomu, že vám už se to povedlo a koník hrabání používá, nebo se vám toto chování z nějakého důvodu opravdu líbí. Pak je velmi snadné takové chování klikrem tzv. zachytit. U zachycených chování je vysoká pravděpodobnost, že koník bude chování předvádět pokaždé v naší přítomnosti. Je dokonce možné, že zachycené chování vytlačí i jakékoliv jiné, které se budeme snažit koníka naučit. Proto je důležité dostat zachycené chování co nejdříve pod kontrolu signálem.

Postup je stejný jako jsme si rozebrali v příkladu natvarovaného chování. Zjednodušeně si je můžeme zopakovat. Nejprve používáme signál zároveň s probíhajícím chováním, v dalším kroku začneme signál předřazovat chování a nakonec odměňujeme už jen ty pokusy, kdy zvíře předvede chování až po našem signálu. Pokud jste si hrabání zachytili, a tak trochu vám přerůstá přes hlavu, představuje chování pod povelem jeden ze efektivních způsobu, jak se lze takového nechtěného chování zbavit v podstatě docela. Dostaňte chování pod kontrolu signálem… a pak už onen signál nikdy nepoužijte.

V příštím čísle se podíváme na to, proč klikr trénink někdy nefunguje, aneb několik nejčastějších chyb v klikr tréninku, jak se jim vyhnout, nebo jak je napravit, pokud jsme si je pořídili. Máte-li konkrétní dotazy na téma klikr tréninku, nebojte se napsat do redakce a v některém z dalších čísel vaše otázky rád zodpovím.