20. Perception med udgangspunkt i objektgenkendelse.

Vi bombarderes med visuelle indtryk i løbet af dagen. Massevis af objekter overlapper hinanden, så vi skal beslutte, hvornår et objekt slutter og et nyt begynder.

Visual segregation: Evnen til at finde ud af hvilke visuelle informationer, der hører sammen. Dette giver os mulighed for at perciperer objekter separat.

Nogle af de første, der studerede disse evner var gestaltforskerne. En af disse love var prægnans loven, som er lover der siger, at ud af forskellige, geometrisk mulige organisationer, vil den opstå, der har den simpleste og mest stabile form. Prægnans loven er nøglen til at forstå gestalt, men de lavede også andre love.

The law of proximity: Elementer har en tendens til at blive grupperet sammen, hvis de ligger tæt på hinanden.

The law of similarity: Elementer vil blive grupperet sammen hvis de perciperes som ens.

The law of closure: En lov om hvordan ikke helt afsluttede elementer perciperes som afsluttede (fx en cirkel der ikke er helt sluttet perciperes som en cirkel og ikke et bøjet linje).

Figur/ground segregation: Dette lagde gestaltikerne også vægt på. Et objekt udpeges som figur og resten som baggrund. Dette giver mulighed for at manipulere med perceptionen, som i rubins vase. Man kan ikke både se ansigter og vase på én gang (ligesom man ikke kan fokuserer på objekt og baggrund på én gang). 

Evaluering af gestalt:

Ingen af lovene om gruppering er blevet modbevidst. Men til gengæld er kritikken at alle forsøgene er udført ud fra todimensionelle tegninger (ikke real-life settings). Desuden beskyldes gesstaltteoretikerne for at beskrive nogle interessante fænomener, men de forklarer ikke hvorfor det sker. De har heller ikke overvejet hvad der sker hvis forskellige af grupperingslovene er i konflikt med hinanden. 

Marrs teori:

Marr har lavet en computational teori med 3 repræsentationer, der indeholder enormt detaljeret information om det visuelle miljø:

Primal Sketch: Indeholder todimensionel beskrivelse af lysintensitet og forandringer i det visuelle input, samt information omkring kanter, konjukturer og blobs (pletter). Denne repræsentation deles op i raw primal sketch, som indeholder information om lysintensitet og forandringer i den visuelle scene, mens full primal sketch bruger denne information til at identificerer formerne på de visuelle objekter. Man placerer tokens (giver en samling af objekter navne fx et hjørne hvor to kanter støder sammen) på raw primal sketch og disse tokens placeres efter gestaltlovene. Raw rimal Sketch er dog senere blevet afvist, af den viden vi har fået omkring visual cortex, men Full primal sketch har haft rimelig succes, selvom beslutningen om hvilke dele der hører til et objekt hviler på gestaltlove frem for viden om objektet og forventninger.

2 ½-D sketch: Inkorporerer en beskrivelse af dybde og retning af visuelle flader og gør brug af informationerne fra skygger, materiale, bevægelse og binocular forskellighed. Både primal sketch og 2 ½ -D sketch er viewpoint dependent.

3-D sketch: Tredimensionel beskrivelse af former af objekter og deres relative position uafhængigt af observatørens synsvinkel. Marr og Nishihara foreslog den enkle form – cylinderen, som det alle objekter er hierarkisk opbygget af (figur s. 77). Dette skulle gøre en i stand til at genkende objekter uanset hvilken vinkel de ses fra. 

Biedermans recognition by components:

En udvidelse af Marrs teori. Hans ide går ud på at objekter består af geons (geometriske ioner) – blokke, cylindere, kurver, trapez osv. Der er 36 geons, man kan forme alle objekter ud fra (fx en kop og en håndtaske kan formes ud fra de to samme objekter – en halvcirkel og en kurve).

Der er 3 trin i måden man bestemmer et objekts geons:

1. Extraction: man identificerer kanterne, hvor der tages højde for belysning, materiale, farve og derved får en linjetegning af objektet.

2. Næste skridt er at segmentere objektet, så man kan identificere objektets forskellige dele – her spiller concavities en stor rolle.

3. Vurdering af hvilke dele der besidder synsvinkel uafhængig information (parallelle linjer, kurver) 

’Biederman lægger stor vægt på concavities (de linjer der buer ind mod objektet selv – som ved en ske), som er noget af den vigtigste information for objektgenkendelse. Objektgenkendelse beror på information om kanter frem for information om overfladen (så som farve).

Man har opdaget at nogen celler i aber responderer mere hvis der sker en ændring i geons end ændringer i størrelse, hvilket kan tale for teorien om geons.

Biederman går ind for at objektgenkendelse er uafhængigt af synsvinkel, men forsøg har vist, at jo mere en figur drejes væk fra den mest kendte vinkel, jo længere tid tager det at genkende figuren Forsøg med greebles viste at man bliver hurtigere til at genkende ved ikke sædvanelige vinkler, jo mere man øver sig på de såkaldte greebles, men processen vil altid være langsommere.  Objektgenkendelse er altså afhængigt af synsvinkel. Man har også lavet forsøg med farvefotos og fotos kun med optegnede linjer (kanter). Argumentet var at kanter ofte er mangelfuld information for at genkende et objekt. Forsøget viste at folk var markant bedre til at genkende farvefotos, især hvis objektet blev vist i rette kontekst.

En anden kritik af Biederman og Marrs teorier er at måske kan geons eller cylidere hjælpe os med at identificere et objekt fx en kop, men det hjælper os ikke til at genkende ”den kop jeg altid bruger”. Teorierne undervurderer også kontekstens betydning for genkendelse af objektet.

Teorierne er altså for simplificerede. 

Connectionist network

I objektgenkendelse har vi et binding problem: hvordan forbinder man forskellige informationer til en objektgenkendelse? Biederman har foreslået et connectionist network, hvor de enheder der kan opstå sammen er forbundet. De enheder som ofte opstår sammen har hurtige links, der gør at når man ser en feature ved objektet, spredes aktiveringen til de enheder, der er forbundet med denne feature. 

Dorsal og ventral pathway

Milner og gooddale teori går ud på at den dorsale pathway (der har med visuel kontrol af handlig at gøre) gør brug af viewpoint dependent (synsvinkel afhængig) information, mens ventral pathway gør brug af viewpoint invariant (synsvinkel uafhængig) information. Dette er blevet understøttet af fMRI scanninger, mens man skulle vurderer objekter fra forskellige vinkler. Der er mere aktivitet i de occipito-temporale områder (den ventral pathway) når man skal lave viewpoint invariante opgaver som at vurdere kategorier (fx det er en bil). Der er mere aktivitet i de parietale områder (den dorsale pathway), når man bruger skal skelne mellem objekter indenfor en kategori (hvilken type bil). Det er altså ikke et spørgsmål om objektgenkendelse er viewpoint dependent eller invariant, men hvornår det er det. 

Visuel agnosi

Er hjerneskadede, der har problemer med objektgenkendelse, der ikke skyldes manglende viden om objektet. Man skelner mellem apperceptive agnosi: problemer med perceptuel processering og associaltive agnosi: Problemer med at hente relevant information om objektet fra hukommelsen. Man kan teste det på at få en patient til at kopiere et ukendt objekt, kan man ikke det, har man apperceptive agnosi. 

Riddoch og Humphreys hierarkiske model baseret på forsøg med  agnosipatienter

Bygger på Marrs hierarkiske tanke. Den består af 5 trin:

Edge grouping by collinarity (når punkter ligger i den samme rette linje): Her fremkalder man kanterne på et objekt. Fx patient DF, kunne ikke genkende et eneste objekt ved linjetegning.

Feature binding into shapes: Objekt features kombineres til en form. Riddoch og Humphrey kalder det integrative agnosia, når man ligesom patient HJA, ikke kan samle forskellige integrerede features til et objekt. HJA kunne godt genkende en pølse når han så den alene, men når han skulle pille et stykke pølse ud af en salat, kunne han ikke gruppere hvilke features, der hørte til hvilket objekt. Via forskellige test fandt man resultatet af grouping by collinarity er forholdsvis simpelt, hvorimod grouping by closure og shape formation er af en højere orden og afgørende for objektgenkendelse.

View normalisation: Via processering opstår en synsvinkel uafhængig repræsentation af objektet. Især folk med skader i den højre hemisfære har problemer med dette. De kan ikke genkende objekter, hvis fx vigtige features for dette objekt er skjult, eller det ses fra en usædvanlig vinkel. Man kan godt objektgenkende i sin hverdag, selvom dette trin volder én problemer, de kan fx sagtens kategoriserer semantisk.

Structural description: Man opnår adgang til lagret viden angående strukturelle beskrivelser af  objektet. Patient JB, kunne godt skelne mellem objekter og ikke-objekter, men kunne ikke fortælle hvilke af søm, hammer og svensknøgle, der blev anvendt sammen ved at se objekterne, men han kunne godt hvis han fik navnet at høre på objekterne. Altså var den semantiske viden lagret, men han kunne ikke opnå adgang dertil via visuel information.

Semantic system: At få adgang til lagret viden af semantisk information omkring objektet. Nogle patienter har problemer med kategorier. Fx har patient PS ingen problemer med at genkende ikke -levende ting, men store problmer med levende ting modsat patient EW, der ikke kunne genkende levende meget bedre end ikke-levende. Det får Shelton og Caramazza til at foreslå at vores viden om levede ting lagres et sted i hjernen (inferior del af temporallappen) og ikke-levende ting lagres et andet sted (posterior del af temporallappen). Dog har Farah argumenteret for at levende ting lagres efter deres visuelle kendetegn, mens ikke-levende ting lagres efter funktion. En mere kompleks teori om lagring end blot levende/ikke-levende kategorier.  

Hvad man kan forvente ud fra den her model, er at folk ved visuel agnosi, kan have problemer i hvilket som helst af disse stadier – derved virker det mangelfuldt kun at skelne mellem apperceptive og associative agnosi. 

Kritik af denne model: Modellen går ud fra at objekt genkendelse foregår kun gennem bottom up i en seriel model. I virkeligheden mener man at top-down også har en indflydelse.  

Perspektivering:

Tidlig vs. sen selektion

 

One thought on “20. Perception med udgangspunkt i objektgenkendelse.

  1. They is likely to point up that repeat nighttime newborn has a
    new same appearance of putting out lighter nap in a huge baby.
    Also, one student can automatically update world wide web marketplace
    directory website found all the way through Pay Equipment.
    Buyers will own to sales a tools from some sort of market.

Skriv et svar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out / Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out / Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out / Skift )

Google+ photo

Du kommenterer med din Google+ konto. Log Out / Skift )

Connecting to %s