torsdag den 5. april 2012

De 4 kvadranter - down & dirty

I det følgende vil jeg prøve at forklare lidt om de principper, der bruges i moderne hundetræning, og også noget om hvorfor nogle former for træning er bedre end andre

Denne artikel har tidligere været udgivet på hunde-forum.dk

Vi starter med at forklare ordene positiv og negativ. De betyder ikke "godt" og "ondt", som mange ellers tror. I trænings-fagsprog betyder "positiv" at man giver noget, og "negativ" at man fjerner noget.
Dvs. at hvis jeg giver dig en 10'er, så er det positivt, men hvis jeg tager den fra dig, er det negativt.
På den anden side kan jeg også give dig en lussing. Det er også positivt, fordi jeg tilfører noget, der ikke var der før - i dette tilfælde smerte. På samme måde kan det være en god ting at gøre noget "negativt". Hvis du f.eks har en splint i fingeren, og jeg tager den ud, har jeg fjernet din smerte.

I hundetræning bruger vi begreberne positiv og negativ sammen med to andre ord: Forstærkning og straf.
At forstærke en adfærd betyder at øge sandsynligheden for at adfærden sker. Hvis jeg f.eks. giver dig 1000 kr. hver gang du besøger mig, er der ret stor sandsynlighed for, at du vil besøge mig oftere end hvis jeg ikke gav dig noget. Samme princip anvender vi når vi træner indkald med hunden. Hvis din hund får en godbid hver gang du siger dens navn, vil der være større sandsynlighed for at den kommer hen til dig, end hvis den ingenting får. Det kaldes positiv forstærkning (R+) - vi har øget sandsynligheden for at hunden kommer når der kaldes, ved at give den en belønning.
Straf er noget der nedsætter sandsynligheden for at en adfærd sker. Hvis jeg f.eks tvinger dig til at gøre rent hver gang du besøger mig, vil du nok ikke komme så ofte, som hvis du ikke skulle gøre rent - og slet ikke så ofte, som hvis jeg gav dig 1000 kr.

Et klassisk eksempel på positiv straf (P+) i hundetræning er ryk i linen for at lære hunden at gå pænt i snor. Hvis hunden trækker, svarer ejeren igen med et kraftigt ryk i linen, der sandsynligvis gør ondt eller i hvert fald er meget ubehageligt for hunden. Trænere, der bruger denne metode, kombinerer den ofte med f.eks. pighalsbånd eller tynde kædehalsbånd, så smertepåvirkningen bliver større. Altså træneren tilføjer hunden smerte for at nedsætte sandsynligheden af en uønsket adfærd.
Det virker dog ikke altid efter hensigten - det kan nemlig være meget svært at få en hund til at forstå nøjagtig hvad det er, den bliver straffet for, og det nedsætter effektiviteten af metoden.
Lad os sige at vi har en hund, der gøer og trækker i snoren hver gang den ser en anden hund. Ejeren straffer med skæld-ud og ryk i linen, men fordi situationen er så kompleks - der er en fremmed hund, et fremmed menneske med den fremmede hund, andre ting, der sker på gaden osv. - er sandsynligheden for at hunden forstår at det er dens egen reaktion, der straffes for, ret lille. I mange tilfælde vil hunden forstå straffen således, at det simpelthen er ubehageligt og farligt at møde fremmede hunde og personer, og det vil få den til at reagere kraftigere næste gang. På denne måde bliver aggression og straf en ond spiral.

For at bruge positiv straf på en effektiv måde, skal hundeejerens timing være absolut perfekt, og undersøgelser viser at vi mennesker desværre langt fra er perfekte på dette område. Derfor er positiv straf en risikabel og usikker træningsmetode, der kan skabe flere problemer end den løser. Den amerikanske TV-træner Cesar Millan bruger ofte positiv straf. Læg mærke til at hans program altid begynder med en advarsel mod selv at prøve metoderne derhjemme.

Nu har vi haft eksempler på positiv forstærkning (at belønne ønsket adfærd) og positiv straf (at straffe uønsket adfærd), så nu er det tid til de negative træningsmetoder, der er lidt mere komplicerede at forstå.

Først negativ straf (P-). Som sagt betyder "negativ" at fjerne noget, og "straf" betyder at nedsætte sandsynligheden for at en adfærd sker.
Ved at fjerne noget fra hunden, kan vi altså få den til at holde op med uønsket adfærd. Det, vi fjerner, skal være noget, hunden gerne vil have. Det bliver altså en straf for den at miste noget. Dette "noget" kan f.eks. være kontakten med en person eller en anden hund. Den engelske TV-træner Victoria Stillwell bruger "time-out" som negativ straf - altså at hunden lukkes ude af fællesskabet, hvis den ikke opfører sig ordentligt.
Andre eksempler på negativ straf er: At standse eller gå i modsat retning hvis hunden trækker i linen. At ignorere hunden hvis den springer op ad én. At stoppe legen med en hvalp der bider.

Den sidste af de fire træningsmetoder er negativ forstærkning (R-). For de fleste vil den virke komplet ulogisk, men ikke desto mindre bliver metoden brugt aktivt af en del trænere.
Vi husker at "negativ" betyder at fjerne noget, og "forstærkning" betyder at øge sandsynligheden for at en adfærd sker. Så ved at fjerne noget fra hunden, kan vi altså få den til at udføre ønsket adfærd. Det vi fjerner, skal derfor være noget hunden ikke vil have - smerte eller ubehag.
Heldigvis går langt de fleste hunde ikke rundt og har smerter til daglig, men det betyder til gengæld at for at bruge negativ forstærkning, må man først tilføje hunden smerte, og derefter fjerne den, når hunden udfører den ønskede adfærd. Et godt eksempel på en sådan træningsmetode er "tvangsapport", der især bruges i jagthundetræning. Her tilfører man hunden smerte for at få den til at åbne munden. Det kan f.eks. være med det ulovlige el-halsbånd, eller simpelthen ved at vride hundens øre rundt. Når hunden åbner munden for at skrige, stopper træneren apporten ind i den åbne mund, og i samme øjeblik standses smertepåvirkningen. Hunden lærer altså, at for at undgå smerte, skal den tage apporten.

Et andet eksempel er indlæring af "sit" på den gammeldags måde hvorejeren fysisk presser hundens bagdel mod jorden, og først standser det  ubehagelige pres når hunden er i den ønskede stilling.
Træning med smerte og ubehag er stressende for hunden, og stress forringer indlæringsevnen. Desuden er ny adfærd meget nemmere og mere ukompliceret at indlære med positiv forstærkning. I tilgift vil man få en gladere hund, der udfører den ønskede adfærd af lyst og ikke af frygt.
De fire ovennævnte træningsmetoder kaldes tilsammen "De fire kvadranter" og benævnes i "fagsprog" R+ (positive reinforcement), R- (negative reinforcement), P+ (positive punishment) og P- (negative punishment).

Nogle trænere mener at man bør bruge alle fire metoder. Dette kalder de for "balanceret træning". Langt de fleste hunde vil dog kunne lære alt det nødvendige ved hjælp af R+ og en lille smule P-. Tilmed er disse metoder nemmere at lære for ejeren, og kan gøre mindre skade, hvis man alligevel kommer til at gøre det forkert, så det kan kun anbefales at man søger den type træning, før man anvender de hårde metoder.

Ingen kommentarer:

Send en kommentar