Geier János: Kiegészítések a Percepció tananyaghoz.

Geier János

Mozgás- és térészlelés

1997.09.19, 1999.03.27

Jelenségek szemlélése:

Mi a konkrét jelenség?
Mi a jelenség értelmezése?
Mi a jelenség magyarázata?

Például:

A jelenség: Sztereoszkóppal, rövid időre (<16ms) bemutatunk egy random ábrapárt,. Egy lebegő négyzet látható, mely előtte, sztereoszkóp nélkül szemlélve a két ábrát, nem volt látható.

Értelmezés: a látórendszerünk képes csupán a retinakép-párból, a horizontális diszparitások alapján előállítani a 3D alakzatot.

Magyarázat(ok). Rengeteg van, egy se végleges. Különféle komputációs modellek. Bal-jobb párosítás, stb. A végleges magyarázat függőben van!

Megjegyzés: Az előadónak legyen saját véleménye: legyen egy elméleti hozzáállás, egy koncepció, melynek ő a védőügyvédje Ha ugyanarról a jelenségről két ellentétes magyarázat létezik, akkor nem lehet mindkettő igaz. Természetesen vannak jelenségek, melyek magyarázatára több különböző, egymásnak ellentmondó elmélet verseng egymással. Ha azonban így van, akkor az ilyen esetekben nincs eldöntve a kérdés, a válasz még függőben van. Mindig világossá kell tenni a diákok számára, ha ez a helyzet áll fenn. Az nagyon rossz szokás, hogy felsorolunk egymásnak ellentmondó elméleteket, és aztán megvonjuk a vállunkat, és semmit sem fűzünk hozzá. Ez azt az érzést erősíti ez a diákokban, hogy a pszichológiában abszolút semmi biztosat nem lehet mondani. Ez pedig nincs így! Lehet ugyanis nagyon világos kérdéseket feltenni, ezekre világos kísérleteket végezni. Ezek biztos pontok. Azután a jelenségekre lehet világos modelleket illeszteni, és meg lehet mondani, a modellek milyen mértékben pontosak, mennyire jól magyarázzák az adott jelenségkört.

Szóval: nem szabad devalválni azt a kérdést, hogy "akkor most mi az igazság"?

A percepció alapkérdése: hogyan lehetséges az, hogy noha érzékszerveinket közvetlenül csak a fizikai világ ingerei érik (fotonok, hanghullámok) - mi mégis alakzatokat (tárgyakat, formákat, szavakat, sőt: “mosolyokat”, “kedvességet”, stb.) észlelünk?

(egy) Klasszikus megközelítés:

Gestalt pszichológia. Az ingereken belüli szerveződést keresték, és feltételezték, hogy idegrendszerünk ezeket a “belső szerveződéseket” valami módon felismeri. A jelenségekkel foglalkoztak, de azt nem kérdezték meg, hogy mi lehet a mechanizmusa a szerveződési elvek felismerésének. Magával a mechanizmus kérdésével csak napjainkban kezdenek foglalkozni , pl. a komputációs elméletek kutatói (D. Marr, stb.)

Gestalt elvek: figura-háttér

csoportosítás

proximitás (közelség)

zártság

jó folytatás

hasonlóság elve

Ellenpélda: Gregory pontsorozata: (Gregory: Az értelmes szem, 1972)

Megjegyzés:

Szokták mondani, és ez a Gestalt pszichológia különösen kedvenc mondása: az egész több, mint részeinek egyszerű összege. Rendben, ezt sejtjük. De milyen értelemben több? Ha azt mondjuk több, akkor az általában azt jelenti, ugyanolyan fajta dologból van most több. Pl. az elvetett búzamagok megszaporodnak, és aratáskor több lesz a búzaszem, minden vetéskor volt. Itt nyilván nem ebben az értelemben mondjuk azt, hogy több.

Mi a több, és miből adódik ez a többlet?

Válaszom: a minősége az, ami magasabb szintű (több); e többlet a szervezettségből adódik.

Ha pl. egy regény szavait (vagy akár mondatait) szövegszerkesztővel véletlenszerűen összekeverjük, akkor az új regény pontosan ugyanazokat a szavakat, mindegyikből ugyanannyit fog tartalmazni, mint az eredeti, de mégsem lesz azonos azzal, hiszen értelmetlené válik, az eredeti történetet nem lehet már kiolvasni belőle. Semmi más nem változott meg, csak a szervezettsége. Ettől több, vagy kevesebb.

A vizuális észlelésről általában. Gregory nyomán.

Gregory (1974. 29-30 old.) “Az észlelés annyit jelent, hogy mintegy “fogadunk” az érzékszervi adatoknak a tárgyi világ viszonylatában legvalószínűbb értelmezésére... Az észlelés egyfajta problémamegoldás.” E kijelentésében Helmholtzra hivatkozik

Ez a típusú problémamegoldás nem tudatos.

A Gregory féle tárgyhipotézis fogalma….

Képek:

Tehén.

Jelenség: általában nem ismerik fel az emberek. Ha megmutatjuk a segítő ábrát, akkor viszont felismerik.

Értelmezés: A jelenség nagyon hasonlít a nehéz probléma-helyzetekre. A megfigyelő nem tudja megoldani a feladatot, de némi segítség után megoldja, és utána már nem is tudja nem megoldani. Ez is azt támasztja alá hogy a percepció egyfajta problémamegoldás

Magyarázat: Nincs kimerítő magyarázat. Kérdés van: milyen folyamatok játszódnak le bennünk, hogy ezt a teljesítményt véghez tudjuk vinni. Válasz: részleteit nem ismerjük, de e kísérlet eredménye alapján (is) fel kell tételeznünk, hogy agyunk "felépíti " magában a külvilág modelljét.

Kutya.

Jelenség: ezt is felismerjük, pedig kevés a közvetlen információ. Nemcsak magát a kutyát ismerjük fel, hanem a talajt is, és azt is, hogy a fény felülről jön.

Értelmezés: ld. az előzőt, de itt könnyebb a feladat, ezért nem kell segítés.

Magyarázat: A klasszikus Gestalt elvekkel nehezen magyarázható a jelenség. Miért éppen azok a foltok állnának össze, és nem mások? Ha a közeli foltok állnának inkább össze, abból nem jönne ki a kutya…

Gregory magyarázata Helmholtz nyomán: Azért ismerjük fel a kutyát, mert már láttunk kutyát (és talajt, és napfényt, és foltos mintázatot stb.), és ezek alapjábn fel tudjuk építeni a megfelelő tárgyhipotézist. A kérdés itt is az, hogy mi tesz minket képessé erre?

Kérdések: Hogyan ismerjük fel a tárgyakat eddig sose látott új helyzetekben, más tárgyakkal kombinálva, stb. ?

A tárgyhipotéziseinkről fel kell tételeznünk, hogy azok:

Nincsenek előre rögzítve, azaz nem statikusk, hiszen nem valószínű, hogy pontosan olyan kutyát láttunk már, és pontosan ugyanabban helyzetben. A tárgyhipotéziseink tehát módosíthatók, dinamikusak.

Az sem feltétlenül biztos, hogy láttunk már foltos kutyát, lehet, hogy csak sima kutyát láttunk, viszont talán láttunk már foltos asztalterítőt. A tárgyhipotéziseink tehát: kombinálhatók egymással.

Helmholtz, a nagy előd kérdése: (Helmholtz retina-paradoxona, a retina-paradoxon elnevezés tőlem származik).

Egyrészt: Szemünkbe csak és kizárólag a tárgyakról visszavert fényeloszlás jut be, retinánk csak és kizárólag ezzel a fényeloszlással kerül fizikai kölcsönhatásba. Maga a fizikai inger (a látott tárgyak optikai értelemben valódi képe) tehát a retinánkon keletkezik; a látott tárgyakkal ezen felül semmilyen más, közvetlen fizikai kapcsolatunk nincs.

Ezzel szemben: mi mégsem azt észleljük, hogy a tárgyak (vagy azok képe) a retinánkon lennének - hanem azokat a térben, mintegy “kihelyezve” látjuk.

E két egymással szembe állított tény alkotja a Helmholtz -féle retina-paradoxont. Gregory(1972, 10 oldal) szerint Helmholtz sokat foglalkozott e kérdéssel.

Gondoljuk ez tovább, mi következik ebből?

A választ a következő metaforába sűrítem: Amit úgy látunk, (hallunk), hogy "odakint van", az szükségképp "idebent" is fel kell, hogy legyen építve.

Azaz a látás, hallás, stb. egy “rekonstrukciós” folyamat. A percepció (azaz észlelés) folyamata során mintegy felépítjük magunkban a külvilágot! Amit látunk (hallunk, …észlelünk), az bizonyos értelemben a fejünkben “fel van építve”. Gondoljunk csak bele: ha körülnézünk mondjuk egy szobában, akkor rendkívüli részletgazdagsággal tudunk beszámolni a látottakról. Nemcsak a tárgyak formáját, hanem azok felszínét is látjuk, és nemcsak a felszíni mintázatot, hanem még azt is "látjuk", hogy az a tárgy kemény vagy puha, hajlékony, vagy merev, esetleg folyékony, stb. Ha az a szoba éppen egy fürdőszoba, akkor nagy lendülettel bele ülünk a vízbe (hiszen "látjuk", hogy folyékony), de vigyázunk, nehogy beüssük a térdünket a kádba (hiszen látjuk, hogy kemény). Mindezt egyidejűleg észleljük: a szoba fel van építve a fejünkben, és e felépítmény legalább annyira részletes, amilyen részletességgel észleljük az ott lévő tárgyakat. A teljes felépítmény minden bizonnyal még annál is részletesebb, mint ahogyan arról tudatos beszámolót tudunk készíteni. (Gondoljunk a küszöb alatti ingerekre.)

Ez a felfogás a hallucinációkról és az álomról is állít egy lényegeset: normális (egészséges) percepció esetén a felépítmény folytonosan igazodik a valósághoz; hallucináció, vagy álom estén a külvilághoz való illeszkedés, ráhangolódás valami oknál fogva (ez más a hallucináció, és más az álom esetén) elmarad, de a belső felépítmény továbbra is megvan, sőt dinamikusan változik. Bizonyos értelemben tehát igaz az állítás, hogy a világ "csak" illúzió: ha valami külső ingerre, tárgyra reagálunk (pl. felülünk a kerékpárra), akkor valójában az agyunkban felépített modellre reagálunk (az "illúzió kerékpárra ülünk fel"), de egészséges esetben ez az illúzió jól illeszkedik a valósághoz, jól modellezi az aktuális helyzetet, annak változását pontosan nyomon követi, tehát helyes lesz a reakciónk. A látott (hallott) külvilág tehát ebben a "felépítéses" értelemben valóban illúzió, de egészséges, éber esetben a valósághoz jól illeszkedő illúzió, és figyelembe véve a Helmholtz paradoxont, be kell látnunk: ez egyszerűen nem lehet másként! Gondoljuk csak végig ismét-és ismét…

Ha az eddigiek nem lennének eléggé meggyőzőek, gondoljuk el kissé másképp: ha azt látom, hogy egy tárgy rajtam kívül, ott van valahol előttem, de ezzel a tárggyal semmi más fizikai kapcsolatom nincs, mint a tárgyról visszaverődő fény becsapódása a retinára, akkor a tárgyat semmi más módon nem tudom odakint lévőnek észlelni, csak ha azt előtte "belül" is felépítem magamban .. hiszen a "kintihez" nem férek hozzá közvetlenül. Ez a felépítés két alapon nyugszik: az aktuális retinaképen (pontosabban annak folyamatos változásán, bele értve ebbe az aktív, kereső szem, fej és testmozgást is), és előző tapasztalatainkon.

Az, hogy miképp épül fel bennünk a külvilág modellje - nos ennek részletei a tudomány jelenlegi állása szerint csak elenyésző mértékig ismertek. A percepció kutatás és a kognitív tudomány lényegében erről szól. Úgy tűnik, hogy a magasabb rendű állatok agyának ez természetes, vele született képessége (Meddig mehetünk vissza az evolúciós lépcsőn? A kutyának van ilyen képessége, a madaraknak van? … egy ráknak van? És a medúzának, vagy egy csigának?). Miben áll ez a képesség, milyen idegrendszeri struktúrák és szervezési elvek képezik az alapját, mi belőle a tanult (és persze e tanulási képességnek mik az idegrendszeri alapjai), és a konkrét helyzetben mik azok a konkrét folyamatok, melyek a helyes felépítést, a külvilágra való ráhangolódást elvégzik…?

A mozgásészlelés

Alapproblémája: ha egy összefüggő mintázatot mozgatunk a retinán, akkor retina pontjaiban lévő érzékelő sejtek mindegyike csak azt észleli, hogy a ráeső fény növekedett, vagy csökkent (és természetesen ennek mértékét is). Kérdés: hogyan lehet ennek alapján észlelni,

(i) a mozgás irányát,

(ii) sebességét,

(ii) azt, hogy mely tárgypontok tartoznak egybe, azaz melyek mozognak együtt (korrespondencia probléma)?

További probléma: ha pl. egy földgömb forog a képernyőn, akkor ráadásul a képpontok nem azonos sebességgel mozognak, és mi mégis úgy észleljük, hogy a gömb pontjai együtt mozognak. Tehát ekkor nem is a retina szintjén dől el, mely pontok tartoznak egybe. Modellezése komoly probléma, kielégítően nincs még megoldva, a látástudomány egyik központi problémája, sokan kutatják.

Egyszerű modell: a "számítógép-egér” mozgásának irányát hogyan lehet észlelni? Ott egy fotóérzékelő elé egy kilyuggatott korong van téve, amit az egér golyója forgat, ha mozgatjuk az egeret. Ez az érzékelő csak azt érzékeli, hogy nö-csökken a fényerő, aszerint, hogy éppen átlát a lyukon, vagy nem. Hogyan lehet ebből megállapítani a mozgás irányát. (nem az x vagy y irányról beszélek, hanem arról, hogy mondjuk csak x tengely mentén vajon jobbra, avagy balra mozgunk e?). A kérdés megértése egy kis lépéssel közelebb visz minket a szem mozgásérzékelő mechanizmusának megértéséhez; legalábbis megértjük, mi az a feladat, amit a szemnek ill. a látórendszernek el kell végeznie a mozgás észlelésekor.

A mélységészlelés

A világot háromdimenziósnak látjuk, sőt idegrendszerünknek ez a törekvése oly erős, hogy a síkképeket is gyakran látjuk térbelinek. Gondoljunk csak a perspektivikus festményekre, vagy pl. a Necker kockára.

A térélmény több, önállóan is hatásos jelzés (cue) alapján jön létre. Ezek:

binokuláris parallaxis, ami a két szem eltérő helyzetének következménye;

mozgás-parallaxis, ami a tárgy és/vagy a néző mozgásának következménye;

árnyékok és reflexiók, amikor a “fentről jövő fény hipotézise” alapján értelmezzük a látott képet;

perspektivikus torzulás, ami főként mesterséges környezetben (szobában, utcán) érvényesül az ott fellelhető párhuzamos és derékszögű formák miatt;

takarás, azaz a részlegesen takart tárgyat távolibbnak észleljük, mint azt ami takar;

távoli tárgyak életlensége, részletszegénysége, ‘ködössége’.

A felsoroltak közül most csupán az első jelzéssel, a binokuláris parallaxissal foglalkozunk.

A sztereólátás geometriája

A részletesebb elemzés érdekében tisztáznunk kell néhány, a sztereólátással kapcsolatos alapfogalmat.

adott tárgypont mélysége alatt annak nézőtől való távolságát értjük;

a szem optikai centruma alatt azt a pontot értjük, mely a csarnokvíz és a szemlencse együttese által kialakított lencserendszer optikai értelemben vett középpontja (az un. belső fősík főpontja, [1]). Ha a szemet elvben egy “lyukkamerával” (camera obscura) helyettesítjük, akkor a képalkotó fénysugarak ebben a pontban keresztezik egymást. Ez a pont jó közelítéssel a pupilla középpontjával esik egybe;

a két szem optikai centrumát összekötő szakaszt bázisvonalnak, e szakasz hosszát bázishossznak (-távolságnak) nevezzük;

a fovea és a szemlencse optikai centruma által meghatározott egyenest nézővonalnak avagy látótengelynek, nevezzük (ez némileg eltér a szem optikai tengelyétől: utóbbi a fovea közelében, kissé a vakfolt irányában döfi a retinát.[1]);

fixációs pontnak azt a térbeli pontot nevezzük, ahol a két nézővonal metszi egymást. (A fixációs pontnak nem kell feltétlenül valamely tárgy felületi pontjára illeszkedni; lehetséges, hogy a két nézővonal metszéspontja a “levegőben” van.);

a két (egymást metsző) nézővonal által meghatározott síkot nézési síknak nevezzük (ez azonos a két szem optikai centruma és a fixációs pont által meghatározott síkkal);

konvergencia-szög alatt a két (egymást metsző) nézővonal által bezárt szöget értjük;

konvergens szemmozgásnak nevezzük azt a szemmozgást, amelynél a konvergencia-szög növekszik;

divergens szemmozgásnak nevezzük azt a szemmozgást, amelynél a konvergencia-szög csökken;

vergens szemmozgás: a konvergens és divergens szemmozgás közös neve;

korrespondáló pontok: a bal ill. jobb szem retináján az azonos koordinátájú pontok. (Vagyis, ha a szemgolyóra oly módon illesztünk egy, a földgömbön használatos gömbi koordinátarendszert, hogy a fovea jelképezze az északi pólust, akkor azok lesznek a bal és jobb retina korrespondáló pontjai, melyeknek a "hosszúsági" és a "szélességi" koordinátája azonos. Ezek szögkoordináták, tehát fokban vagy radiánban mérhetők.);

adott térbeli pont binokuláris parallaxisa alatt azt a szöget értjük, amit a pontból a két szem forgási középpontjához húzott egyenesek közrezárnak (2. ábra). (Ezt másképp úgy is fogalmazhatjuk, hogy ez az a konvergencia-szög, amit a két szem nézővonala egymással bezárna, ha erre a pontra fixálnánk mindkét szemmel.);

a nézővonalak adott iránya esetén egy térbeli pont retinális diszparitása alatt e pontnak a bal ill. jobb szem retinájára eső vetületeinek szögkoordinátái közti különbséget nevezzük (2. ábra.). (Megállapodás szerint mindig a bal szögkoordinátából vonjuk ki a jobboldalit.)

Fontos felhívni a figyelmet arra, hogy a binokuláris parallaxis fogalma arra vonatkozik, amit látunk (azaz magára az objektumra) és így független a nézővonalak aktuális irányától, a diszparitás fogalma viszont a retinaképekre vonatkozik (azaz, ahogyan az objektum a retinákra vetül), és így mértéke függ a nézővonalak irányától. A legfontosabb speciális esetben tekintve, ha mindkét szemünkkel ugyanarra a térbeli pontra fixálunk, akkor e pont binokuláris parallaxisa azonos a konvergencia-szöggel, ugyanakkor e pont retinális diszparitása nulla. E két fogalom megkülönböztetésére nem lenne szükség, ha a két szemünk mindig párhuzamosan állna, azaz, ha a konvergencia-szög mindig nulla lenne.

Egyszerű geometriai meggondolással a 2. ábráról leolvasható, hogy a retinális diszpatirás fenti definíciójával ekvivalens a következő: egy tetszőleges adott térbeli pont (mely nem feltétlenül azonos a fixációs ponttal) retinális diszparitása egyenlő az aktuális konvergencia-szög és a pont binokuláris parallaxisának különbségével. Formulával: ha a konvergenciaszög f₁, és egy adott tárgypont binokuláris parallaxisa f₂, akkor a horizontális retinális diszparitás azonos a d= f₂- f₁ szöggel. A retinális diszparitás előjeles mennyiség

Ugyancsak egyszerű geometriai oka van annak, hogy nullánál nagyobb konvergencia-szög esetén nemcsak horizontális, hanem vertikális retinális diszparitás is fellép. Így, ha például egy téglalapot nézünk közelről, akkor a két szemünk befelé fordulásának következtében mindkét retinán trapéztorzítás keletkezik, amint az a 5. ábrán látható. Ez a torzulás a két képen ellenkező értelmű, azaz a jobb retinaképen a jobboldali, a bal retinaképen a baloldali függőleges méretek a nagyobbak.

Adott fixációs pont esetén felrajzolhatók azok a pontok, melyeknek nulla a horizontális retinális diszparitása. Ha az ábrázolhatóság kedvéért a nézési síkra szorítkozunk, akkor ezen pontok mértani helye az elemi geometriából jól ismert tétel szerint egy kör, mely átmegy a két szem optikai centrumán és a fixációs ponton (A. 4.ábra felülnézetben mutatja ezt.). A látástudományban ezt a kört nevezik Vieth-Müller körnek.

A Vieth-Müller kör tehát adott fixációs pont esetén az összes nulla retinális diszparitású pontok halmazát jelenti a nézési síkban (ld. Kardos, 1970). Ha egy, a nézési síkon lévő pont a Vieth-Müller körön belül van, akkor az ahhoz tartozó diszparitásérték pozitív, ha ezen kívül, akkor negatív. A Vieth-Müller kör tapasztalati megfelelője és térbeli általánosítása a kísérletileg megállapítható horopter, mely a szubjektív megítélés alapján ugyanabba a mélységbe eső térbeli pontok halmazát jelenti. A horopter tehát egy görbült felület, mely illeszkedik az aktuális fixációs pontra. Alakját az adott fixációs pont és a bázisvonal helyzete egyértelműen meghatározza. Ha tekintjük a horopternek a nézési síkkal való metszetét, akkor jó közelítéssel a Vieth-Müller kört kapjuk, de az egyezés nem pontos. Az eltérés oka ez ideig nem ismert [2, pp. 317]

A 4. ábrából adódik az a lényeges megállapítás, hogy egy tárgy látható felületének relatív mélységét mindig a fixációs ponthoz tartozó horopterhez kell viszonyítani. A horizontális retinális diszparitás a horoptertől való mélységbeli eltérés függvénye.

A sztereólátással kapcsolatos alapvető kísérletek

1. kísérlet. A konvergencia szög változásának észlelése.

Ha egy kb. 2-4 méter távolságban lévő tárgyat (pl. a falon lévő kisebb képet) nézünk, és eközben függőlegesen magunk elé tartunk egy ceruzát, akkor abból kettőt fogunk látni. Ha most a ceruzára nézünk, akkor a távoli tárgy duplázódik meg. Elvéve a ceruzát (közben nem szabad pislogni), láthatjuk, amint viszonylag lassan, (kb 0.1 s idő alatt) a két kép egyesül. A jelenség oka a szemek konvergencia szögének változása (ld. Churchland and Sejnowski, 1992, fig. 4.27, pp.160).

Ezzel kapcsolatban Kardos (1970, 60. old.) a következőket írja: "A két szem mindig oly módon helyezkedik el, hogy a két recehártya foveájában ugyanaz a külső pont (tárgypont) ábrázolódik le... (szemünket) nem is tudjuk úgy beállítani, hogy a két foveába különböző tárgyi pontok képe essék. A szemek egymás felé fordulásának, a konvergenciának a foka nyilván annál nagyobb, minél közelebbi tárgyat fixálunk."

A fenti fogalmak segítségével ez így is megfogalmazható: az idegrendszerben létezik egy szabályozó mechanizmus, mely mindig úgy állítja be a szemek konvergencia-szögét, hogy a fovában, (vagy legalábbis annak kis környezetében) nulla legyen a horizontális és a vertikális retinális diszparitás. Ez az állítás azonban kiegészítésre szorul, ugyanis tudatos odafigyeléssel ettől eltérő konvergencia-szöget is elő tudunk állítani, sőt a konvergencia-szög bizonyos esetekben akkor is stabil tud maradni, ha a bal ill. a jobb foveába és közvetlen környékére eltérő képrészletek kerülnek. (Ez az alapja a manapság divatos “mágikus”, háromdimenziós ábrák nézésének. Ezek az un. Julesz-féle Random Sztereogramok., melyekrôl késôbb fogok szólni. Julesz, 1960, 1972.)

Az 1. kísérlet következményeként megállapítható, hogy konvergencia-szög változása folytonos és viszonylag lassú, ellentétben a szakkádikus szemmozgásal, amely a két szem együttes mozgatását jelenti fixáció váltáskor. Mint ismeretes, utóbbi egy gyors irányváltást jelent, mely idő alatt nem látható a retinakép elmozdulása. (Ennek elemzésével itt most nem foglalkozunk.)

Ez a kísérlet laboratóriumi körülmények között is megismételhető, ha a szem konvergens mozgását szemmozgás-regisztrálóval mérjük. A 6.ábra egy ilyen mérési eredményt mutat be, ahol a kísérleti személynek felváltva kellett egy 40 cm , és egy 3m távolságban, lévô térbeli pontra nézni (a közelebbi tárgypont egy függőlegesen álló vékony fémrúd hegye, a távolabbi egy falra akasztott kép volt.*). A görbéről leolvasható, hogy a konvergencia-szög 8 fokos változása 0.1 s -nál rövidebb idô alatt következett be.

2. kísérlet. (Wheatstone kísérlete, 1838) Tegyünk egy sztereó ábrapárt (rajzot, vagy esetleg két párhuzamos állású fényképezőgéppel készített fényképfelvételt) egy tükrös sztereoszkópba. Egy ilyen sztereó képpárt mutat a 3.ábra, melyet sztereoszkópba helyezve egy csonka gúla látványa áll elő.

Eredmény. A kísérlet eredményeként tapasztalhatjuk a térélmény létrejöttét, azaz a látott képpár egybeolvadását (fúzió) és eközben észlelhetjük a virtuális tárgy vagy tárgyak plasztikusságát, észleljük az egyes képrészletek között fennálló relatív mélységet.

Értelmezés. E kísérlet értelmezéseként megállapítható, hogy a képpáron fellelhető binokuláris parallaxis a fent leírt többi mélységjeltől függetlenül, egymagában elégséges a térélmény létrehozására. (Ez azonban nem azt jelenti, hogy a többi mélységjel szintén ne lenne külön-külön elégséges.)

3. kísérlet (Julesz Béla kísérlete, 1960) Helyezzünk a tükrös sztereoszkópba egy Julesz- féle Random Dot Sztereogramot (RDS) mely a 7.ábrán látható két képből áll.

Eredmény. A kísérlet eredményeként tapasztalni fogjuk, hogy a nagyobb random mintázatú négyzet előtt (vagy felett, ha a képpárt vízszintesen helyeztük el) egy kisebb, szintén random mintázatú négyzet lebeg. Ha a két képet felcseréljük, akkor a nagyobb négyzeten egy négyzet alakú lyukat fogunk látni, és a kisebb négyzet e lyukon belül távolabbra kerül.

Értelmezés. E kísérlet értelmezéseként megállapítható, hogy a képpáron fellelhető binokuláris parallaxis akkor is elégséges a térélmény létrehozására, ha se a bal, se a jobb képen nincs monokulárisan észlelhető alakzat. Természetesen ezt úgy kell érteni, hogy a random ponthalmaz részletei monokulárisan is látszanak ugyan, de a kisebb lebegő négyzet alakja nem. A kisebb lebegő négyzet tehát “elrejtőzik” és csak binokuláris látással lehet elkülöníteni a környezetétől (monokuláris kamuflázs). A meglepő az, hogy ekkor viszont valóban lehetséges a mélységben való elkülönítés

A jelenség magyarázatához fontos ismerni az RDS készítési technikáját. (8.ábra). (****.. részletezni)

4. kísérlet. A tükrös sztereoszkóp helyett használjunk egy új eszközt, a számítógéphez kapcsolt Crystal Eyes nevű sztereó szemüveget, amellyel a sztereó képpárok rövid idejű bemutatása lehetséges. A 3. kísérletben felhasznált Julesz-féle RDS-t használjuk fel újra, amit most 24 alkalommal, alkalmanként 16 ms ideig exponálunk, és a kísérleti személynek gombnyomással kell válaszolni arra a kérdésre, hogy a kisebb lebegő négyzet a nagyobb elôtt volt, vagy mögötte volt, vagy bizonytalan volt a mélység. A három lehetőség véletlenszerűen, 1/3 -os valószínűséggel követi egymást. (A bizonytalan mélységű négyzetet úgy lehet előállítani, hogy a kisebb négyzet területén belül a bal és a jobb kép pontjait egymástól függetlenül , azaz korrelálatlanul választjuk meg. E harmadik lehetőség alkalmazása azért szükséges, nehogy a kísérleti személy kizárásos alapon válaszolhasson, pl. úgy, hogy amit nem látott elöl, az bizonyára hátul volt.)

Eredmény. Az egészséges szemű kísérleti személyek rövid előgyakorlás után mind a 24 alkalommal helyesen válaszolnak.

(A tanszéken elvégzett kísérletek során a kísérleti személyek 60-70 %-a volt sikeres ebben a kísérletben. A viszonylag nagy számú sikertelenség elemzése egyelôre nem történt meg. Annyi sejthető, hogy a szemüveget viselők képezik a tévesztők zömét.)

Értelmezés. Mivel e rövid exponálási idô alatt nincs érdemi szemmozgás, a kísérlet értelmezéseként megállapítható, hogy az idegrendszer a szemmozgástól függetlenül, csupán a két retinaképen fennálló retinális diszparitások alapján képes a térélmény előállítására, vagy a komputációs modellek nyelvezetével kifejezve: képes a relatív mélység kiszámítására.

Fontos megemlíteni, hogy ez a kísérlet csak akkor sikeres, ha a retinális diszparitás nem lép át egy bizonyos határt. Ha ugyanis a retinális diszparitás nagyobb ennél a Panum-féle fúziós limitnek nevezett határnál, akkor nem jön létre a két kép fúziója, ami abban a kísérleti eredményben nyilvánul meg, hogy a kísérleti személy a korrelálatlan esetek javára téved. Azaz, az elöl és/vagy a hátul lévő négyzetet össze fogja téveszteni a bizonytalan esettel. A Panum limittel kapcsolatos problémakör egy első megközelítése a következő kísérlettel történhet.

5. kísérlet A Panum limit becslése egyszerű RDS felhasználásával.

3 rétegú. …..

Irodalom:

[1] Természettudományi kislexikon, Akadémiaia kiadó, Budapest, 1970

[2] Regan D., Frisby, J. P., Poggio, G. F. Schor, C. M. and Tyler, C. W. (1990) The perception of stereodepth and stereomotion. In: Spillmann, L. and Werner, J. S.(Eds.) Visual Perception: The Neurophysiological Foundations, Academic Press, New York.

Ábrák:

1. ábra. Wheatstone tükrös sztereoszkópja 1838-ból (Gregory , 1972 nyomán)

2. ábra. A konvergenciaszög és a retinális diszparitás kapcsolata

3. ábra. Egyszerű sztereó képpár, melynél nem fordul elő se árnyékhatás, se perspektíva, se takarás, se egyéb mélységjel; csak binokuláris parallaxis fordul elő.

4. ábra. A Vieth-Müller kör és a Panum fúziós area.

5. ábra. Vertikális diszparitás, azaz trapéztorzítás létrejötte befelé fordított (konvergáló) kamerák esetén.

6. ábra. Konvergens szemmozgás regisztrátuma szemmozgásregisztrálóval.

7. ábra. Julesz -féle Random Dot Sztereogram.

8. ábra. Az RDS készítésének alapgondolata.

************* folyt köv.* 1995.10.04****************

************* 1999.03.27

3

Irodalomjegyzék:

Churchland, P. S. and Sejnowski, T. J. (1992) The Computational Brain. Cambridge, MA.: MIT Press.

Van még….

Gyakorlat.

1. demo: Weber törvény a pörgettyűvel:

Jelenség: sugár mentén logaritmikus fényerősség változás. Kifelé világos. Weber törvény szerint egyentesen világosodik.

TM-PERC1. Exp. 4.

2. demo:

Jelenség: korong. A korongon egy profil van, és egy hegyes kiugrő és egy lapos kiugró van. StarDisk.

3. demo:

2. Óra. Színlátás

Helmhotz elmélete: 3 távoli színből.....

Hering elmélete: vörös-zöld, kék-sárga.