Visione biologica e visione artificiale Marcello Demi CNR, Institute of Clinical Physiology, Pisa, Italy
Visione di immagini diagnostiche immagini strumento fondamentale per comprendere l’ambiente in cui viviamo trattamento delle immagini mediche non significa ottimizzarne la fruizione da parte dell’occhio e’ uno strumento che assiste il medico richiamando la sua attenzione sulle informazioni significative esempio: estrazione di contorni esempio: visione 3D di tomogrammi esempio: integrazione di informazioni di piu’ sorgenti di imaging
Visione La realizzazione di sistemi artificiali di visione non e’ necessariamente orientata alla replica o alla simulazione dei sistemi di visione biologica la visione biologica fornisce tuttavia un inevitabile termine di paragone e una fonte di ispirazione e’ fondamentale quindi avvicinarsi ai sistemi di visione artificiale dopo una breve panoramica sulla visione biologica
Anatomia dell’occhio bulbo oculare comandato da coppie di muscoli cornea e cristallino sono le lenti cristallino controllato dai muscoli ciliari l’iride e’ il diaframma controllato da una coppia di muscoli antagonisti il bulbo pieno di umore vitreo retina riveste la parte posteriore del bulbo
La retina e’ il sensore del sistema visivo cinque tipi di cellule in strati recettori, cellule orizzontali, bipolari, amacrine e gangliari
Recettori 6X10 6 coni, lavorano con elevato numero di fotoni e sono sensibili al colore, visione fotopica 120X10 6 bastoncelli, sensibili a pochi fotoni, visione scotopica nei bastoncelli c’e’ un solo tipo di pigmento (rodopsina) esistono tre tipi di coni ciascuno con differente pigmento centro della retina (fovea) contiene solo coni (10 5 /mm 2 ) alla periferia prevalgono i bastoncelli, maggiore sensibilita’/minor dettaglio
Cellule retiniche i recettori sono collegati alle cellule retiniche (orizzontali, bipolari, amacrine e gangliari) gli assoni delle gangliari (10 6 ) formano il nervo ottico minima convergenza nella fovea, massima convergenza alla periferia risoluzione da 0.5’ nella fovea (2.5 m sulla retina) a 1° alla periferia quindi: elevata sensibilita’ nella visione scotopica e elevata risoluzione spaziale nella visione fotopica
Campi recettivi l’insieme dei recettori a cui e’ connessa una singola cellula gangliare forma il campo recettivo della gangliare ogni gangliare risponde solo a stimoli luminosi provenienti dal suo campo recettivo i campi recettivi sono organizzati in un centro e una periferia due tipi: centro-on e centro-off il segnale sull’assone delle cellule gangliari e’ un treno di impulsi con frequenza proporzionale allo stimolo
frequenza f al variare del diametro 2r dello stimolo luminoso centrato su di un campo recettivo on-center
Centro-On e Centro-Off L’occhio vede solo i bordi di una figura perche’ le cellule gangliari non rispondono a campi illuminati uniformemente Storicamente il filtro DoG e’ il primo modello matematico dell’elaborazione retinica: una risposta positiva aumenta la frequenza degli impulsi, una risposta negativa sopprime l’attivita’ spontanea
Centro-On e Centro-Off Perche’ cellule a centro on e a periferia off? Si tratta di un filtro lineare? Perche’ due differenti tipi di cellule centro on e centro off invece di un unico tipo di cellula?
Le vie visive i due nervi ottici formati dagli assoni delle gangliari si uniscono nel chiasma ottico e formano due tratti ottici ciascun tratto conduce a due destinazioni, collicolo superiore (20% degli assoni) e corpo genicolato laterale (80% degli assoni) nel corpo genicolato si ha la prima elaborazione di segnali provenienti dalle due retine gli assoni del corpo genicolato conducono alla corteccia visiva primaria
Collicolo superiore e i movimenti oculari il collicolo superiore riveste un ruolo importante nella guida dei movimenti oculari (non cosa, ma dove) movimenti saccadici: movimenti bruschi che consentono di esplorare una immagine movimenti nistagmici: movimenti continui che consentono di seguire un oggetto in movimento movimenti microsaccadici: piccoli movimenti apparentemente casuali indispensabili per la visione di immagini statiche
Il corpo genicolato laterale ben organizzato in 6 strati di cellule una rappresentazione topografica della retina su ogni strato la stessa regione retinica e’ mappata allineata su strati differenti ritroviamo i campi recettivi circolari ON-Center e OFF-Center riceve un feedback dalla corteccia visiva connesso con i centri emozionali
Il neurone componente fondamentale del sistema nervoso e quindi del sistema visivo neuroni nel cervello umano interconnessioni, un neurone e’ connesso con altri 1000 soma o corpo cellulare, assone e dendridi i segnali raccolti dai dendridi concorrono ad eccitare il soma che si attiva oltre una soglia sinapsi di tipo eccitatorio e inibitorio
La corteccia visiva primaria 2 mm di materia grigia nella regione occipitale per 200X10 6 cellule organizzazione topologica in 6 strati di campi recettivi (4 strato di input) dominante la fovea rispetto alla periferia le cellule corticali sono divise in semplici, complesse e ipercomplesse semplici: campi recettivi di tipo ON- OFF di forma allungata complesse: rispondono a stimoli orientati in movimento ipercomplesse: rispondono a stimoli di particolare forma (es. spigoli)
Sezione di 1 mm per 2 mm di corteccia visiva primaria
Risposta delle cellule corticali semplici ad uno stimolo orientato
Risposta delle cellule corticali complesse ad uno stimolo orientato in movimento
Architettura della corteccia Spostandoci in direzione ortogonale alla corteccia troviamo: neuroni con campi recettivi sovrapposti che rispondono in modo diverso solo alle diverse caratteristiche di uno stimolo, neuroni che rispondono a stimoli con lo stesso orientamento (eccetto lo strato 4). Spostamenti in una direzione tangenziale alla corteccia: equivalgono a spostamenti sulla retina, l’orientamento varia di 180° ogni mm. L’unita’ elementare corticale e’ quindi un blocco di 1 mm 2 di spessore 2 mm.
Organizzazione in colonne delle cellule corticali
Visione artificiale si propone di studiare e realizzare sistemi in grado di descrivere una scena osservata il paradigma di riferimento e’ la visione biologica le ricadute della ricerca teorica sullo sviluppo delle applicazioni sono ovvie meno ovvie ma altrettanto importanti le ricadute delle applicazioni sulla ricerca teorica tre i problemi principali: rappresentazione dell’informazione, processi di elaborazione e architettura hardware
Computer Vision nasce intorno agli anni 60 come ramificazione della AI primi studi sui processi low level o di early vision, edge detection e region growing negli anni 70 ci si rende conto che i processi low level da soli non sono in grado di segmentare una scena si passa a studiare l’impiego di high level knowledge codificata in forma simbolica (regole tipo IF-THEN) le prestazioni dei primi sistemi non sono entusiasmanti
Il lavoro di David Marr inquadramento teorico e metodologico allo studio e alla realizzazione di sistemi di visione per Marr visione significa produrre una rappresentazione 3D della scena motore di decisioni e azioni non e’ importante tanto la sua teoria quanto l’impulso che ha prodotto un altro paradigma: active vision con processi di focalizzazione dell’attenzione altra idea: costruire robot, avremo ricadute teoriche
Visione artificiale e immagini mediche i problemi considerati sono mal posti e sono necessarie assunzioni fisiche sull’ambiente osservato e sul processo di imaging codifica della conoscenza
Modularita’ e scala di osservazione segmentazione, descrizione e classificazione con moduli separati aventi ognuno una opportuna rappresentazione di ingresso e di uscita per ogni oggetto esiste un insieme di scale di osservazione significative da una scala inferiore ad una scala superiore