01. Indlæring med udgangspunkt i klassisk eller operant betingning.

Passer, W. M & Smith, E. R. (2007). Psychology. The Science of Mind and Behavior (3. udg.) Kap 6. Boston: McGraw-Hill.  

Indlæring:

Er en proces i gennem vores oplevelser producerer en relativ vedvarende ændring i en organismes adfærd eller evner. Vi lærer at tænke, handle og føle på forskellige måder der bidrager til vores individuelle identitet. Der er en opdeling i forskellige typer af læring; knowing how og doing. Indenfor videnskaben er det hovedsagligt det sidste – ændringer i adfærd og handlinger, på baggrund af indlæring – der undersøges. 

Klassisk betingning:

En organisme lærer at associere to stimuli (fx en sang og en rar begivenhed), således at den ene stimuli (sangen) kommer til at udløse en respons (at blive glad) der originalt fremkom forårsaget af den anden stimuli (den rare begivenhed). Pavlov læste Darwins evolutionsteori og blev inspireret til at studere denne videnskab. Han fandt ved et tilfælde at hans hunde efter mange gentagelser, begyndte at savle inden deres mad kom, formentlig fordi de kunne høre (og forbinde) deres dyrepassers fodtrin. Dette blev gjort til et faktisk eksperiment, hvor hunde blev udsat for en klokke/tone umiddelbart inden de blev fodret, førte efter gentagende gange til at hundene savlede (BR) når de hørte klokken alene (BS). Klassisk betingning er altså en læringsproces der udviser en tilpasningsfunktion. Det alarmere kroppen til stimuli der signalere at der snart følger en vigtig event.

US/UR: ubetinget stimuli, er en stimuli der fremkalder en refleksiv eller medfødt respons, uden forudgående træning, nemlig den ubetingede respons. Hos Pavlov mad(US) fremkalder savl (UR).

BS/BR: den betingede stimuli er en stimuli der, igennem association med den ubetingede stimuli fremkalder en betinget respons lignende til den oprindelige ubetingende respons. Nu fremkalder tonen (BS) fremkalder savl (BR).  

Antallet af forsøg betingningen kræver afhænger af intensiteten af den betingede stimuli. Fx er der ved traumatiserende og chok stimuli, kun nødvendigt med en enkelt forsøg. Tidsintervallet er også af betydning for hvor hurtigt betingningen indlæres (forward shortdelay pairing/forward tracepairing). 

Extinction: en aflæringsproces hvor BS præsenteres gentagende gange uden den US, således af BR svækkes og forsvinder. Hver gang BS optræder uden US, kaldes det derfor extinction trial. Spontaneons recovery; sker når en betingning er aflært, men så pludselig dukker op igen, uden at den er genindlært. Stimulus generalization: når stimuli der ligner BS fremkalder en BR. Organismer må kunne foretage diskrimination mellem relevant stimuli og ikke-relevant stimuli. Højere ordens betingning, sker når der dannes forbindelse mellem BS og en nye stimuli gentagende gange, så vil den nye stimuli også fremkalde BR.  

Behavoirisme og angstbetingning:

Watson byggede videre på Pavlovs klassiske betingning, og studerede phobi patienter. Især havde han held med at indlærer phobier (hmmm) som fx lille Albert og rotten. Men behavorismen har også haft held med at aflærer mange phobier med gradvis eksponering af den angstfremkaldende genstand (BS) fx eksposure therapi og flooding. Aversion therapi er en anden behandlingform der ligeledes bygger på Pavlovs opdagelse. Her udsættes mennesker der udviser en uønsket adfærd for en betinget stimulus der sættes i forbindelse med den ubetingede stimulus, så en ændring i adfærd opnås. Fx er pædofile blev udsat for chok samtidig med de blev vist billeder af børn, og alkoholikere får antabus, så indtag af alkohol forbindes med kvalme. Den klassiske betingning er også blevet brugt i forbindelse med helbredelse af fysiske sygdomme. Fx ved at give et medikament der øger immunforsvaret mens der indtages en bestemt fødevarer(skal vist nok være noget man ikke før har indtaget), gentages dette vil immunforsvaret øges bare man indtager fødevaren alene. Lignede forsøg er lavet med rotte der blev udsat for cancer behandling og lavendelduft. (Betingning er en ubevidst proces, der er uafhængig af viljen kontrol.) 

Men denne form for læring forklarer ikke hvordan alt hvad vi lærer er blevet indlært. 

Operant betingning:

Opstår når organismer lærer at associere deres respons med specifikke konsekvenser.  

Thorndikes law of effect:

Undersøgte hvordan dyr løste problemer, ud fra sin puzzle box der kunne åbnes indefra ved at trække i nogle snore eller trykke på en pedal. En sulten kat blev lukket inde i boxen og mad blev stillet udenfor, katten gjorde alt for at komme ud og kom ved et tilfælde til at trykke på pedalen så lågen gik op. Dette blev gentaget og resultaterne viste at katten blev hurtigere og hurtigere til at komme ud, dog var den stadig forholdsvis lang tid om det i et langt stykke tid. Thorndike kaldte disse forsøg trial and error. Fordi de ikke blev markant bedre hurtigt og langt henne i forsøget stadig kunne være lang tid om at komme ud, konkluderede han at katten ikke opnåede indsigt, men derimod afskrev mulige metoder, hen ad vejen. Denne proces kaldte han instrumental learning. Envidere forslog han the law of effects, der siger at i en given situation, vil en respons/adfærd der følges af en tilfredsstillende konsekvens, være mere sandsynlig i at opstå, og modsat vil en respons der følges af en irriterende konsekvens være mindre sandsynlig i at udføres. 

Skinners operante betingning:

Skinner byggede videre på Thorndikes fund, og kaldte denne type læring for operant betingning, hvilket henviser til at en organisme opererer på dens omgivelser på en måde. Adfærd afhænger af hvilke konsekvenser den afstedkommer. Til hans studier brugte han skinner boxen. Der var en pedal og madskål på en af væggene. Når der blev trykket på pedalen kom der en madpille ud i skålen. En sulten rotte puttes ind i boxen og når man bevæger sig rundt kommer den ved tilfældighed til at trykke på pedalen, og ud kommer en lille pille. Med tiden trykker rotten regelmæssigt på pedalen. Skinner fokuserede på reinforcering og straf. Reinforcering betyder at en given adfærd styrkes af det (nytte) udfald den afstedkommer. I modsætning til dette opstår når et respons svækkes af det udkom der efterfølger det.  positiv reinforcering: den stimuli der følger og styrker adfærden. Ikke at forveksle med beløning – positiv reinforcering er kun reinforsering, hvis det bevirker organismen til at udøve adfærden igen. Sekundær reinforcering er sådan noget som penge som vi kan bytte til primær reinforcering som stiller vores fysiologiske behov. Negativ reinforcering: er når en adfærd forstærkes fordi en efterfølgende irriterende stimuli fjernes. At tage en panodil, er hovedpinen den negativ reinforcer. Operant extinction er svækkelsen eller fuldstændig ophør, fordi responsen ikke længere reinforceres.  

Positiv straf: når en stimuli virker som aktiv straf, der hæmmer en uønsket adfærd, eller fremmer en ønsket (– smæk), negativ straf: når en stimuli fjernes så en særlig adfærd hæmmes eller fremmes (– du får ingen lommepenge). 

Shaping: en måtrettet længerevarende proces, hvor en lille del af handlingen gradvist bliver reinforceret, og til sidst udføres den endelige handling. Chaining: er en anden procedure der benyttes til at udvikle en sekvens af responser ved at reinforcerer hvert respons med muligheden for at udfører den næste respons. Ligesom i klassisk betingning kan man også tale og generalisering og diskriminering.  

Skemalagte reinforceringer: når reinforceringer kommer i særlige mønstre og intervaller, har det en stærk og forudseelig påvirkning på læring og adfærd. Men kan skelne mellem vedvarende eller delvis reinforcering. Når et hvert enkelt respons reinforceres, kaldes det vedvarende, når kun nogle af tilfældene af responser reinforceres kaldes det delvis reinforcering. De delvise reinforceringer kan yderligere inddeles efter om reinforceringen gives efter ratio eller interval skemaer. Ved ratio skemaer gives reinforceringen en vis procentdel af gangene. Nøglen er i dette tilfælde at jo flere gange responsen udvises, desto mere bliver den reinforceret. Ved interval skemaer, gives reinforceringen fx en gang i minuttet, og så kan rotten trykke ligeså tosset den vil på pedalen, den får kun en per minut. Nøglen er altså at reinforceringen afhænger af tidsintervallet. Endvidere kan der skelnes i mellem fastlagte og variable skemaer. Fastlagte skemaer kommer reinforceringen altid efter et bestemt antal gange eller efter en bestemt tid fx ved hver femte tryk eller hvert minut. I de varierende skemaer er intervallerne varierende/radomised. Skinner lavede nogle interessante forsøg over kombinationer af hhv. Ratio, interval, fastlagt og varierende skemaer (figur 6.18). Disse viser at ved FR og VR ydes der meget mere i forhold til FI og VI. Man yder altså mest når man bliver ’belønnet’ efter hvor meget man laver (provisionsløn) i forhold til at man modtager reinforcering i intervaller, uanset om de er fastlagte eller varierende (månedsløn). Vedvarende reinforccering virker bedre end delvis, men til gengæld, bliver responsen også hurtigere extincted, og responsen er ’afhængig’ af reinforceringen, mens delvis reinforcering, ikke virker helt så godt, men til gengæld heller ikke så hurtigt bliver aflært, hvis der ikke kommer reinforcering. Det mest optimale indlæringforløb er derfor at give vedvarende reinforcering, til adfæreden er indlært og herefter skifte til delvis. 

Perspektivering:

Flugt og undgåelsesadfærd 

Kritik af behaviorisme – Bandura: vi er mennesker, der benytter kognitive overvejelser, i vores motivation for at udfører en handling, vi kan ikke reduceres til stimuli-respons. 

Indlæring og hukommelse

Skriv et svar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out /  Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out /  Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out /  Skift )

Connecting to %s