La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Il‘concetto’ dalla percezione visiva

Presentazioni simili


Presentazione sul tema: "Il‘concetto’ dalla percezione visiva"— Transcript della presentazione:

1 Il‘concetto’ dalla percezione visiva
Ignazio Infantino ICAR-CNR 7 dicembre 2011

2 Argomenti trattati Percezione visiva e mente
Paradigmi della percezione Computer Vision - Visione Artificiale Fuoco dell’attenzione Memoria visuale Anomalie delle percezioni visuali Classificazione e riconoscimento Estrarre e classificare il contenuto visuale Concetti e percezione visiva Esempi costruire immagini/percezioni sintetiche

3 Conoscenza dall’intelletto
mente Giudizio: operazione mentale che unisce soggetti a predicati gnoseologicamente significativi Giudizi analitici a priori predicati ovvi Giudizi sintetici a posteriori non hanno valore universale derivano dall’esperienza personale Giudizi sintetici a priori basati su calcoli oggettivi p.e. giudizi matematici Ragionamento Concetto Giudizio sintetico Categoria Dati sensoriali Wikipedia Giudizi analitici a priori [modifica] I giudizi analitici a priori sono ovvi e non derivano dall'esperienza (sono appunto a priori), ad esempio: « I corpi sono estesi. »Il predicato qui attribuito al soggetto corpi non dice nulla in più di ciò che già si sa, l'estensione è già implicita nella definizione di corpo, e non occorre esperienza per formulare questa proposizione. Questo tipo di giudizio perciò non permette di progredire. Giudizi sintetici a posteriori [ I giudizi sintetici a posteriori invece, dicono qualcosa in più rispetto a quel che già sappiamo, ma derivano solamente dall'esperienza personale, non sono perciò utilizzabili in ambito scientifico, ad esempio: « Una rosa è rossa. »La determinazione "rossa" non è implicita nel soggetto "rosa", ma è una determinazione che non può avere alcun valore universale, perché dipende da una costatazione di fatto. Giudizi sintetici a priori [modifica] I giudizi sintetici a priori sono invece quelli in grado di garantire il progresso alla scienza. Essi predicano qualcosa che non è implicito nella definizione del soggetto, ma attribuiscono questo predicato basandosi su di un calcolo oggettivo, che non deriva dall'esperienza personale, ed è per questo perfettamente attendibile. I giudizi matematici sono, secondo Kant, un esempio di questo caso particolare: 7 + 4 = 11.Questo giudizio è sintetico, perché non si rileva il numero 11 nel 7 o nel 4, perciò arrivare al risultato, significa progredire. Questa operazione vale universalmente, non è empiricamente riferita a un caso particolare, perciò è detta "a priori". Una futura metafisica, secondo Kant dovrà perciò essere basata su giudizi sintetici a priori, gli unici che permettono l'avanzamento scientifico. mondo

4 Conoscenza dalla visione e ragione
La ragione umana consiste di diverse facoltà tra le quali abbiamo: La facoltà rappresentativa o immaginazione ci fornisce i dati sui quali si basa tra l’altro la nostra esperienza L’intelletto produce conoscenza per mezzo della formulazione e giustificazione di giudizi Come interagisce con queste facoltà la percezione visiva? Quale è lo stato dell’arte della “visione artificiale”? Come si origina della conoscenza a partire da quello che vediamo?

5 Paradigmi della percezione
Approccio classico strutturalismo, atomismo, elementarismo, sensazione Comportamentismo la risposta è una conseguenza automatica dello stimolo mediata da una catena di riflessi Approccio fenomenologico psicologia della Gestalt, percezione diretta e passiva delle configurazioni, gli oggetti non sono riducibili alle parti che li compongono Approccio ecologico di J. Gibson realismo, percezione diretta e passiva Approccio inferenziale o costruttivista percezione indiretta e attiva, la percezione si bassa su ipotesi (processi decisionali probabilistici analoghi ai processi di pensiero) Teorie computazionali cognitivismo, David Marr ( ) I diversi approcci alla percezione visiva riguardano principalmente l’organizzazione della scena visiva, ovvero la percezione degli oggetti: come facciamo a raggruppare degli elementi della scena visiva e decidere che appartengono allo stesso oggetto. L’approccio computazionale è una delle caratteristiche determinanti della psicologia cognitiva. Il cognitivismo ha cominciato ad emergere negli anni ’50 del secolo scorso fino a diventare l’approccio dominante nella psicologia. Il cognitivismo è caratterizzato da tre aspetti fondamentali: 1. ispirazione dalla teoria dell’informazione di Claude Shannon e dallo sviluppo delle tecnologie informatiche (i cognitivisti amano usare una terminologia derivata dall’informatica, a volte in modo non appropriato); principali riferimenti: Alan Turing, Claude Shannon, Norbert Wiener. 2. analogia mente/computer e cervello/computer (reti neurali) 3. collaborazione e fusione di diverse aree disciplinari, oggi spesso si parla di scienze cognitive Esagono delle scienze cognitive (Sloan Foundation 1978).

6 Paradigma classico (Strutturalismo)
La percezione di un oggetto è il risultato della combinazione di sensazioni elementari attraverso leggi di tipo associativo distinzione fra sensazione e percezione (psicologia di fine ottocento) La “sensazione” si riferiva ad un esperienza sensoriale elementare come ad esempio un colore, un suono, il caldo o il freddo, una leggera puntura Il termine “percezione” si riferiva alla complessità della nostra esperienza costituita da oggetti e da eventi L’associazionismo è l’indirizzo filosofico e psicologico che assume come principio esplicativo del funzionamento della nostra mente l’associazione delle idee. Le idee sono definite come eventi mentali (percezione, immagine, ricordo, pensiero, emozione). Empirismo Ingenuo Paradigma Classico (Strutturalismo) La percezione di un oggetto è il risultato della combinazione di sensazioni elementari attraverso leggi di tipo associativo. Per capire lo strutturalismo è necessario introdurre la la distinzione fra sensazione e percezione che era fondamentale nella psicologia di fine ottocento (oggi sappiamo che non ha molto senso, anche se continuiamo a usare i termini “sensazione” e “percezione”). Con il termine “sensazione” (Empfindung) ci si riferiva ad un esperienza sensoriale elementare come ad esempio un colore, un suono, il caldo o il freddo, una leggera puntura. Invece con il termine “percezione” (Wahrnehmung) ci si riferiva alla complessità della nostra esperienza costituita da oggetti e da eventi. L’associazionismo è l’indirizzo filosofico e psicologico che assume come principio esplicativo del funzionamento della nostra mente l’associazione delle idee. Le idee sono definite come eventi mentali (percezione, immagine, ricordo, pensiero, emozione). L’associazionismo caratterizza la tradizione empirista inglese (John Locke , David Hume ) e la psicologia dell’ottocento (James Mill , John Stuart Mill , padre e figlio). Hume ridusse l’associazione delle idee a tre principi: 1. somiglianza 2. vicinanza nel tempo e nello spazio 3. causa ed effetto

7 Comportamentismo Empirismo Ingenuo
Il comportamentismo non studia la mente, ma il comportamento osservabile (e quindi suscettibile di indagine e misura oggettiva come in tutte le altre scienze naturali) 1913 Il comportamentismo considera al posto delle sensazioni i riflessi che vengono concatenati secondo le leggi associazionistiche Pavlov ( ): riflessi condizionati, condizionamento classico, riflessologia Empirismo Ingenuo

8 Paradigma Fenomenologico
la scuola della Gestalt (Wertheimer , Koffka ( )e Köhler ( ) “il tutto è più della somma delle sue parti” come la nostra esperienza si organizza un’analogia tra le Gestalten e i campi elettrici alla percezione di un oggetto corrisponde una distribuzione di attività elettrica nella corteccia che ha le stesse proprietà dell’oggetto percepito (ad un quadrato percepito corrisponde un’attivazione “quadrata” nel cervello). Isomorfismo tra mente e cervello la scuola della Gestalt, che ha come rappresentanti principali Max Wertheimer ( ), Kurt Koffka ( ) e Wolfgang Köhler (1887- 1967)

9 Approccio ecologico Gibson (1979) invarianti visivi Affordance (???)
Linee, punti, contorni, proprità della tessitura, flusso ottico, coerenza temporale e spaziale della struttura del percepito tra istanti successivi, … Affordance (???) il significato che gli oggetti hanno per l’osservatore (p.e. una sedia implica il sedersi,…) È soggettiva e dipende dall’apprendimento Alcune qualità dello spazio sono percepite direttamente senza intervento di processi mentali (esistenza di correlati neurali dedicati a particolari funzioni visive) The Ecological Approach to Visual Perception Affordances Gibson's discussion of affordances focuses on how information in light specifies what the environment affords. Thus, he asks, 'if there is information in light for the perception of surfaces, is there information for the perception of what they afford?' And he answers this question by stating that 'The "values" and "meanings" of things in the environment can be directly perceived’. Thus, according to him, perception of an object involves not only perception of the visual characteristics of that object, but also involves perception of what the object affords. And this perception of the object's affordance, like the perception of the object's visual characteristics, occurs directly-it is specified in the light. …. Learning must occur before the information in the light can indicate what something affords

10 Approccio computazionale
Un sistema di elaborazione dell’informazione deve possedere tre livelli funzionali (Marr): Implementazione La realizzazione fisica del sistema (nervi, muscoli, articolazioni, strutture anatomiche, ottica, muscoli oculari, nervi) Rappresentazione e Algoritmi Il termine rappresentazione è abusato nelle scienze cognitive. Sono descrizioni di eventi percettivi, di ricordi, di azioni intenzionali. L’idea di partenza è quella di corrispondenza o mapping tra insiemi (corrispondenza biunivoca, funzione) Gli algoritmi sono le procedure (i cognitivisti preferiscono il termine processi) che permettono di generare e trasformare le rappresentazioni (operare sulle descrizioni). Livello computazionale determina quali problemi possono essere risoltida un sistema intelligente e quale deve essere la logica della soluzione (volare è ben diverso dal librarsi in aria). Computer vision

11 Computer Vision - Visione artificiale
Algoritmi veloci e robusti per Ricostruzione 3D della scena Rilevamento di particolari oggetti o persone Tracking mediante stimatori probabilistici che permettono di seguire più oggetti o persone in movimento e gestire le occlusioni Aree di ricerca strettamente affini Visione delle macchine Elaborazione delle immagini

12

13 Fuoco dell’attenzione
Punti salienti, punti caratteristici Harris corner detector SIFT/PCA-SIFT/SURF Similarità Colore, forma, tessitura Attenzione visuale Fissazione Movimenti saccadici Memoria visuale SIFT = scale-invariant feature transform

14 Memoria Visuale Relazione tra l’elaborazione delle percezioni e
la loro codifica l’immagazzinamento il recupero Determina l’esperienza visuale Informazioni visuali sotto forma di immagini mentali di oggetti posti esseri viventi Visual memory describes the relationship between perceptual processing and the encoding, storage and retrieval of the resulting neural representations. Visual memory occurs over a broad time range spanning from eye movements to years in order to visually navigate to a previously visited location[1]. Visual memory is a form of memory which preserves some characteristics of our senses pertaining to visual experience. We are able to place in memory visual information which resembles objects, places, animals or people in a mental image. The experience of visual memory is also referred to as the mind's eyethrough which we can retrieve from our memory a mental image of original objects, places, animals or people[1].

15 Anomalie della percezioni visuale
Illusioni ottiche Blindness Non esiste un modello per i sistemi arificiali

16 Classificazione e riconoscimento
Apparenza globale o locale Individuazione di oggetti Rilevamento del contesto Comprensione delle azioni Es. CBIR (Content Based Image Retrieval) possibili query: Livello 1:ritrovare caratteristiche primitive (colore, tessitura, forma, posizione spaziale di alcuni elementi) Livello 2: ritrovare oggetti Livello 3: ritrovare immagini simili per attributi astratti (eventi, situazioni emozionali,…) Tra 1 e 2 il cosiddetto “semantic gap” CBIR Level 1: Retrieval by primitive features such as color, texture, shape or the spatial location of image elements. Typical query is query by example, ‘find pictures like this’. Level 2: Retrieval of objects of given type identified by derived features, with some degree of logical inference. For example, ‘find a picture of a flower’. Level 3: Retrieval by abstract attributes, involving a significant amount of high-level reasoning about the purpose of the objects or scenes depicted. This includes retrieval of named events, of pictures with emotional or religious significance, etc. Query example, ‘find pictures of a joyful crowd’. Levels 2 and 3 together are referred to as semantic image retrieval, and the gap between Levels 1 and 2 as the semantic gap [1].

17 Il‘concetto’ dalla percezione visiva (parte II)
21 dicembre 2011

18 Contenuto informativo dalla visione
Enorme mole di dati visuali da elaborare Complessità computazionale Gap Semantico …… Classificazione, Riconoscimento

19 Un immagine vale più di mille parole….

20 Estrarre e classificare il contenuto visuale
Approcci simili alla classificazione testuale Visual-word/visual-term, bag-of-words I termini visuali possono essere associati a dei pesi normalizzati Filtrati delle visual-stop-word selezionati in base a caratteristiche e rispetto ad un dato modello di rappresentazione della scena Tecniche di apprendimento del machine learning SVM, k-Nearest Neighbor, Naive Bayes, Linear Least Square Fit, etc. This visual-word image representation is analogous to the bag-of-words representation of text documents in terms of both form and semantics, which makes techniques for text categorization readily applicable to the problem of scene classi¯cation. In this paper, we use text categorization tech- niques, including term weighting and normalization, stop word removal, and feature selection, to generate image repre- sentations with di®erent dimension, selection, and weighting of visual words and study their e®ectiveness in scene classi- ¯cation tasks

21 Parallelo tra Concetti e Percezione Visiva
Concetti primitivi: visual term Overruling: predominanza di determinate caratteristiche visuali a seconda di cosa si ricerca nell’immagine Composizionalità dei concetti: visual sentences Immaginazione ed aspettativa Costruzioni di immagini/percezioni sintetiche per simulare meccanismi di aspettativa

22 Esempi Sistema intelligente per la percezione delle intenzioni ( ) Vision and emotional flow in a cognitive architecture for human-machine interaction (BICA 2011)

23 Scenario Ambiente esterno Sistema Intelligente Ambiente Percepito
Videocamere Kinect Sensori wireless Personal Computer Rete Wifi/LAN Mappa dell’ambiente osservato Area di lavoro monitorata dove un umano esegue azioni che coinvolgono oggetti happy Robot umanoide NAO Sistema Intelligente distribuito Scenario Osservazione ed analisi del volto e delle posture Sistema intelligente per la percezione delle intenzioni ( )

24 Struttura Semantica di Dati Percettuali Visuali
Ontologia OWL-DL per il framework SeARCH In – Sensing, Acting, Reasoning: Computer understands Human Intentions) Motore inferenziale di ragionamento Fact++ Interrogazioni mediante API All data described in table 1 correspond to values of individuals specified in the ontology and are included in the following classes: Human_Identity, Face_Expression, Human_Mood, Body_State, Posture, Clothing, Working_Area, Environment_Map, Task, Object, Habit. Moreover the following subclasses are defined: ProfileFace, and FrontalFace; LeftHand, and RightHand; TableObject, and DeskObject (they have more subclasses such as fork, spoon, knife, pen, eraser, and so on). Sistema intelligente per la percezione delle intenzioni ( )

25 Vision and emotional flow in a cognitive architecture for HMI (2011)
In this way, the robot learns to associate an emotional index to agiven pair of faces and objects. The learning phase may be related to the detection of facial expressions of the humanobserving and manipulating that object. Vision and emotional flow in a cognitive architecture for HMI (2011)


Scaricare ppt "Il‘concetto’ dalla percezione visiva"

Presentazioni simili


Annunci Google