Jak využít pozitivní posilování v tréninku

Jak využít pozitivní posilování v tréninku

V minulém dílu jsme si začali povídat o tréninku za pomoci metody založené na pozitivním posilování. Podstata této metodiky se dá shrnout jako učení úspěchem. Je to proces založený na tom, že každé chování má jistý důsledek. Ten rozhoduje o tom, zda se kůň bude pokoušet chování opakovat nebo ne. Chceme-li, aby za námi kůň v ohradě přicházel, dáme mu pokaždé když přijde jablko, které miluje. Podnětem pro koně je má přítomnost v ohradě, chování je jeho příchod ke mě, a důsledek jeho chování je získání jablka. Čím častěji kůň získá tuto zkušenost, tím ochotněji k nám bude přicházet. Pojďme si ukázat jak tento princip využívat v praxi efektivně, ať již trénujeme cokoli.

Chceme-li posílit určité chování, potřebujeme, aby odměnu kůň získal v okamžiku, kdy chování probíhá nebo velmi brzy po něm. Jen tehdy si kůň dokáže spojit získanou odměnu s chováním, které právě provedl. Ve většině situací je ale téměř nemožné dát odměnu okamžitě. Proto trenéři pozitivního posilování používají tzv. marker.

Pomocí markeru označujeme chování, které chceme naučit a odměnit. Marker zároveň vytváří bridge (= přemostění) mezi chováním a odměnou. Má za úkol označit okamžik kdy probíhá chování, a tím spojit chování s okamžikem, kdy se nám podaří „doručit“ odměnu. Většina z nás k tomu používá pomůcku, které se říká klikr. Je to malá plastová krabička, která při stisknutí vydává zvuk – kliknutí. Díky ní se tato metodika začala označovat jako klikr trénink i přesto, že ne vždy se využívá jako marker chování právě klikr.

Jak začít používat marker (nejen klikr)

Nejprve budeme potřebovat funkční odměnu. Takovou, o kterou má koník zájem. To si obvykle ověřuji tak, že při povídání s majitelem o koníkovi, jen tak mezi řečí, bez jakéhokoli požadavku, nabídnu koníkovi několikrát za sebou pamlsek. Pokud projevil zájem, vzal si jej a očividně se zajímá o to, jestli bude další, potom máme vyhráno, máme správnou odměnu.

Pokud pamlsek koně příliš nezaujal, může být příliš malý, zkusím nabídnout větší kousek. Nebo prostě vyzkoušíme, který pamlsek bude pro koně atraktivnější. Berte to jako hru, která je dalším krokem k poznávání vašeho koně. Znalost toho, co má váš parťák rád či nerad, k tomu patří. Mně se osvědčuje mrkev nakrájená na širší kolečka, nakrájené jablko, usušený chleba nakrájený na kostičky. Mnoha koním chutná “koňské müsli”, nebo směs vojtěškových granulí s přimíchanými pár zrnky ovsa. Setkal jsem se s koněm, který miloval papriku. S jiným, který měl v oblibě čerstvé banány. A určitě sami přijdete na mnoho dalšího. Ideální velikost pamlsku je taková aby stačilo jednou dvakrát přežvýknout a sníst. Čím rychleji má koník zájem o další kousek, tím dřív bude chtít pokračovat.

Výborně, máme-li funkční odměnu, další na řadě je tzv. nabití klikru, naklikání. Vytvoření podmíněného reflexu koně na zvuk klikru. Ten vytvoříme jednoduše opakováním klik – odměna, klik – odměna, klik – odměna atd. To opakujeme v několika krátkých lekcích během dne. Lekce je možné rozdělit i do několika dnů, ale není to potřeba. Důležité je dodržovat krátké a rychlé lekce. Kliknutí a odměna následují po sobě bezprostředně, bez zbytečných prodlev, aby si kůň mohl snadno spojit marker s odměnou.

Další možnost, kterou využívám častěji, je naklikat koně rovnou během učení prvního chování – já k tomu využívám jednoduché targetování. Zdá se, že většině koní to nečiní žádné potíže. Pokud se ale rozhodnete nejprve si klikr „nabít“, určitě nic nezkazíte.

Správné stolování a etiketa především

Ať už se rozhodnete pro kteroukoli variantu, hned od začátku se soustřeďte na způsob jakým si koník odměnu od vás bere. Nejzřetelnější důkaz o tom, že již vytváříme podmíněný reflex na klikr je obrácení pozornosti koně na člověka s očekáváním odměny ihned po kliknutí. Nečekáme proto na to, až k nám netrpělivě otočí hlavu a nebo dokonce začne zkoumat, kde je ta dobrota, o které mu kliknutím říkáme, že je na cestě k němu. Už od prvního pamlsku podávám odměnu tak, aby ji kůň začal očekávat v konkrétním pozici. Mně se osvědčilo natáhnout ruku pod hlavou koně na opačnou stranu, takže si koník bere odměnu z mé natažené dlaně s hlavou mírně otočenou ode mne. Po několika opakováních začínají koně po zaslechnutí klikru rovnou zaujímat pozici s odchýlenou hlavou a čekají, až tam ruku natáhnu a dlaň otevřu.

Zpočátku se snažím po kliknutí ruku s odměnou dostat do této pozice velmi rychle a odměnu co nejrychleji doručit koníkovi do tlamičky, právě proto, abych předešel netrpělivosti, která by vedla ke snaze odměnu rychle najít u mě. Stejně tak se tím vyhneme netrpělivému chňapání po ruce. Jednoduše budeme z počátku rychlejší, než koně napadne, že by mohl celý proces vlastní iniciativou urychlit. Předejdeme problému tím, že jej nenecháme vzniknout. Stále myslíme na to, že doba mezi kliknutím a odměnou má být co nejkratší, nejlépe kratší než 3 sekundy.

Neplánované tresty

Po lekci s koníkem mi musel v pamlskovníku zůstat jeden kousek jeho oblíbeného pamlsku, kterého jsem si nevšiml při doplňování odměn, než jsem šel za dalším koníkem, který má rád jiné pamlsky. Během pěkně rozjeté lekce s druhým koníkem najednou přišla na řadu právě ta zatoulaná granule. Koník dobře nalazený z předchozích odměn si ji bez přemýšlení vzal. Po rozkousnutí a krátkém zaváhání nejen, že se usilovně snažil ji všechnu vyplivnout, ale zároveň se cítil natolik podveden tím nepříjemným a nechutným, že ode mne odešel a několik minut neměl zájem se mnou jakkoli komunikovat. Pamlsek pro něj musel být opravdu odporný, protože po těch pár minutách, kdy se konečně rozhodl, že má zájem to se mnou znovu zkusit, si odměny nejprve několikrát po sobě nedůvěřivě očichal a jen opatrně vzal do huby, než uvěřil že tu lumpárnu už nebudu opakovat.

V podstatě se jednalo o nechtěný a nezamýšlený pozitivní trest (psali jsme o nich minule), kdy nevinný kousek pamlsku způsobil odmítavou reakci a obrovskou nedůvěru. Pozitivní tresty jsou záludné potvůrky, které se mohou skrývat na těch nejméně očekávaných místech a najednou vystrčit růžky, aniž bychom je chtěli použít. Mnohdy si ani nemusíme uvědomit, že jsme při lekci s koněm nějaký pozitivní trest použili. Nejzřetelnějším signálem o tom, že se to stalo, jsou právě ony odmítavé reakce koně, projevy nedůvěry, nejistoty, neochota se přiblížit či snaha odejít. Myslete na to, pokud se s podobnou reakcí u svého koně setkáte.

Rozhodně není dobré za tyto reakce koně trestat, nejedná se o neposlušnost. Naopak, je třeba si uvědomit, že je to velmi důležitý signál o tom, že my lidé jsme udělali chybu v tréninku, a že je tedy třeba se zaměřit na to, v čem jsme chybovali, co z našeho chování způsobilo tyto projevy u koníka a ty pak tuto chybu změnit.

Než poprvé klikneme

V minulém díle jsme zmiňovali, že vytváření podmíněného reflexu se projeví v chování koně a že dojde k třem věcem:

  • kůň dostává informaci: tohle chování je správně
  • zároveň kůň ukončí své chování
  • protože ví, že odměna je na cestě a očekává ji

Tedy to, že kůň přeruší chování v okamžiku, kdy uslyší marker, není chyba, ale logická součást klikr tréninku, se kterou počítáme a pracujeme s ní. Zároveň je ukončení chování při zaslechnutí klikru obvykle první známka toho, že kůň začíná rozumět co kliknutí znamená.

Jednoduchý target

Targetování, česky “cílení”, je naučené chování koníka, při kterém se dotýká předmětu, targetu, některou částí svého těla. Nejčastěji jako úplně první chování koně učím tzv. nosetouch (dotek předmětu nosem koně). Je to velmi jednoduché chování, často nejprve zachycené (capturing), a následně vypracované pomocí tvarování, shapingu. Úkolem koně je dotknout se nosem targetu, který mu nabídnu. Jako target využívám např. hůlku s připevněným tenisákem, velkou vařechu, kuželku, plácačku na mouchy a podobně. Určitě vás napadne, že se jako target přímo nabízí dlaň vaší ruky, máme ji přeci všude sebou. Pokud se začínáte s pozitivním posilováním právě seznamovat, použijte raději jako target nějaký předmět. Cvik se velmi rychle stane oblíbeným a měli by jste nos koně ve své ruce pokaždé, kdy byste ruku ke koníkovi natáhli. Proto z počátku, než se naučíme, jak dostat chování pod kontrolu signálem, použijeme target, který lze kdykoli schovat mimo dosah koně.

Tak, a teď poprvé a nanečisto, zatím bez koníka, vyzkoušejte několikrát níže uvedený postup. Zkuste si ho přehrát v hlavě, nebo jej vyzkoušejte na kamarádovi, který dostane úkol přijít na to, co po něm chcete, pomocí hry „Přihořívá, přihořívá, hoří“, ve které každé „přihořívá“ bude označeno zvukem klikru – kliknutím. Zatím mu neřekneme, že pokaždé, když uslyší klikr, dostane zároveň kousek čokolády, nebo něčeho jiného co má rád. To si nechejte jako překvapení během vaší hry. Pokud správně odhadnete, co kamaráda potěší, budete překvapení, co všechno bude ochotný pro odměnu udělat. A teď už postup, který si skutečně třeba před zrcadlem několikrát vyzkoušejte krok za krokem:

  • vytáhněte a ukažte target
  • počkejte na chování kamaráda “koně”, nebo si to představte
  • chování okamžitě kliknutím označte
  • hned potom schovejte target
  • a teprve potom sáhněte pro odměnu a podejte ji

Vyzkoušeno? Aby trénink fungoval, je třeba dodržet uvedené pořadí. Určitě si jej ještě zopakujte, abyste později u koníka nemuseli přemýšlet, co máte právě teď udělat. Všech pět bodů proběhne velmi rychle za sebou, takže na rozvažování nebudete mít čas.

Rychlá “předletová” kontrola, máme target, máme klikr, máme odměny, máme klidné a bezpečné místo kde budeme trénovat, máme plán jak postupovat… Vlastně nemáme. Takže si to nejdřív trošku promyslíme. Jak by mohly vypadat postupné kroky k získání požadovaného chování?

Potřebujeme koníkovi vysvětlit, aby se čumákem dotkl věci, kterou nejspíš nikdy dřív neviděl, a nevíme, jak na ni bude reagovat. Možná vyhraje zvědavost a kůň se k targetu natáhne, aby se přesvědčil co to je. Výborně, to je přesně to co pro začátek potřebujeme, proto klikáme, schováváme target, a podáváme odměnu. V každém dalším kole nepatrně zvýšíme požadavek a označíme okamžik, kdy je nos koně o kousek blíž targetu než v předchozím pokusu, až do momentu, kdy se kůň nosem targetu skutečně dotkne.

Možná ale na začátku vyhraje obava a koník bude jen nejistě s odstupem na target koukat. Nevadí, i tak je to to, co potřebujeme, a co později povede ke kýženému dotknutí targetu. Koník o targetu ví a jeho pozornost a pohled směřuje k targetu, jako první krok nám to bez problému stačí, proto klikáme, schováme target, a odměníme. Nejistotu po několika opakováních vystřídá pochopení toho, že pohled na tu divnou věc, znamená že získá odměnu, takže ona ta věc je vlastně docela zajímavá a obavy velmi rychle zmizí. Následně začneme označovat a odměňovat jakýkoli náznak pohybu, třeba i náhodný, směrem k targetu. Je možné že budeme muset tomuto koníkovi dát na jeho pokusy o něco více času než prvnímu nebojácnému koníkovi. Ale i tak myslím budete překvapeni, jak rychle se váš koník nosetouch naučí, a jak hodně si toto chování oblíbí.

Na co nezapomenout

Učíme koně pomocí úspěchů, které zažívá. Proto i náznak správného chování je důležité odměnit. Dáváme tím koníkovi jasně najevo, že je na správné cestě, že má smysl zkoušet to dál.

Po kliknutí nezapomeneme schovat target z dosahu koně. Předejdete tak zmatenému nabízení chování v případě, že je target stále dostupný i po kliknutí a my teprve saháme pro odměnu.

Target uklidíme z dosahu koně i po skončení lekce. Aby se koník nedomníval, že má pokračovat v nabízení chování. Pokud si na to nedáme pozor, koník se může snažit nabízet targetování i v okamžiku, kdy již nepracujeme, nebo se nám to nehodí.

V minulém díle jsem psal o několika “pravidlech” shapingu, která pomohou provést koníka úspěšně tréninkem, získat si a udržet jeho pozornost i motivaci, a proto si připomeneme alespoň ty nejdůležitější:

  • Zvyšujeme kritéria po malých krocích, zvolených tak, aby kůň měl vždy šanci na úspěch.
  • Pracujeme vždy pouze na jednom kritériu chování, teprve po jeho úplném zvládnutí přidáme další.
  • Pokud v tréninku nenastává pokrok, vraťte se o několik kroků zpět, k chování které zvíře dobře chápe a umí.
  • Lekci zbytečně nepřerušujeme, když trénujete, věnujte se zvířeti.
  • V plánování tréninku jsme vždy o krok před zvířetem, víme, co bude dalším postupným krokem, raději i několik následujících.

Praktické využití targetování

Na začátku dnešního článku jsem zmínil, že targeting má mnoho šikovných využití. Targetování čumákem, které jsme se naučili dnes, využívám jako výzvu k pohybu. Na ukázání targetu koník reaguje pohybem. Což je první krok k naučení vykročení na povel. Nosetouch využívám i v okamžicích, kdy koník během lekce neuspěje, abych udržel motivaci koníka. Nabídnu mu nosetouch nebo jiný lehký a dobře známý cvik, který mohu odměnit. A následně se vrátím k původnímu cviku, tentokrát s nižšími kritérii. Nosetouch využívám, když učím koníka, aby mě následoval. Podobně jako u rozcházení ukážu target v jeho dosahu a ve stejný okamžik se začnu pohybovat. Koník vykročí a právě vykročení zároveň se mnou začnu označovat a odměňovat, a postupně přestanu target používat, zůstane pouze můj pohyb. Nosetouch používám pro učení nasazování ohlávky. A rovnou tak že si koník strčí hlavu do nastavené ohlávky sám. Target se jednoduše nastaví za nastavenou ohlávku tak, že z počátku koníkovi stačí pouze se k ohlávce přiblížit. Postupně se target od ohlávky oddaluje a koník za ním strká hlavu do ohlávky stále hlouběji. Stejný princip mi už několikrát fungoval u koníků, kteří ohlávky a uzdění opravdu neměli v oblibě.

V tento okamžik jsem už zmínil dva různé typy využití targetu. Statický target například pro nosetouch – target nabídneme do určité pozice a cílem je, aby se koník dostal až k němu a dotknul se jej. Určitě to oceníte při tréninku nakládání do přepravníku. Dále průběžný target, například pro vykročení nebo následování – kdy target ukážeme během pohybu koníka, kdy pohyb označíme a target schováme z dosahu dříve, než se k němu koník dostane. Což se hodí při tréninku věcí spojených s pohybem a jeho kvalitou, klasicky třeba naklusání, nacválání atd.

Další možností, o které jsem se už zmínil, je to, že lze targetovat různými částmi těla. Lze tak učit přistupování plecí i zádí koně. Ale také třeba to, že se koník na target postaví. Lze tak naučit oblíbené stoupnutí na různé předměty. Nebo odeslání koně “na místo” či obdobu pejskařského “odložení”. Ale také praktické provozní věci jako podávání nohy, aniž bychom se museli ohnout a nohu zvedat. Přiblížíme target ke kopytu a odměníme každý náznak uvolnění nohy, postupně se koník kopytem dotýká targetu a tvarujeme pohyb až do pozice nabídnuté nohy. Následně můžeme rozšířit o výdrž se zvednutou nohou, aniž bychom ji museli přidržovat. K tomu pak lze přidat i rušivé věci jako jsou kopytářské nebo kovářské práce a různá manipulace s nohou.

Další varianta je ustupování od targetu. To se hodí pro učení ustupování plecí, zádí ale třeba i pro učení couvání. Další možnosti je udržování vzdálenosti od targetu – pohybovat se zároveň s targetem. A mnoho a mnoho dalších možností.

K praktickému využití všeho zmíněného stačí doplnit postup zmíněný u nosetouch o tzv. kontrolu signálem. Dostat chování “pod signál” znamená, že koně naučíme, že cvik se odměňuje pouze tehdy, jestliže je předvádí jen tehdy, kdy pro něj dostane povel.

Při klikr tréninku se často přiřazuje signál k chování až na úplný závěr učení. K chování které je již dotažené do požadované podoby. V mnoha situacích je to užitečně. Proč to tak je a jak dostat chování pod povel, se budeme věnovat v dalším díle povídání o tréninku pozitivním posilováním.