La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 RAPPRESENTAZIONE E DESCRIZIONE DELLE FORME. 2 Il processo di segmentazione conduce alla partizione di una immagine in regioni omogenee Tali regioni.

Presentazioni simili


Presentazione sul tema: "1 RAPPRESENTAZIONE E DESCRIZIONE DELLE FORME. 2 Il processo di segmentazione conduce alla partizione di una immagine in regioni omogenee Tali regioni."— Transcript della presentazione:

1 1 RAPPRESENTAZIONE E DESCRIZIONE DELLE FORME

2 2 Il processo di segmentazione conduce alla partizione di una immagine in regioni omogenee Tali regioni sono date in input al processo di riconoscimento per lidentificazione e la localizzazione degli oggetti della scena Per tale scopo è necessario definire le modalità di rappresentazione e descrizione della forma delle regioni omogenee ottenute dal processo di segmentazione.

3 3 Una regione omogenea può essere rappresentata considerando linsieme dei pixel che costituiscono il contorno della regione (rappresentazione mediante il contorno) oppure considerando i pixel, come aggregati, che costituiscono linsieme omogeneo dei pixel della regione stessa (rappresentazione mediante aggregazione di pixel) Per semplicità, una regione rappresentata dal contorno è chiamata anche esterna, mentre una regione rappresentata come aggregazione di pixel è detta interna.

4 4 caratterizzare in modo oggettivoUna volta scelto lo schema di rappresentazione interna o esterna di una regione, necessita definire le modalità di descrizione della regione stessa, per caratterizzare in modo oggettivo la sua forma informazioni topologiche più significativePer esempio, se è scelto un modello di rappresentazione esterna, è importante definire le caratteristiche del contorno estraendo le informazioni topologiche più significative quali Perimetro, Centro di massa, Area, Numero di concavità, ecc.. processo di riconoscimento degli oggettiIl ruolo della descrizione di una regione risulta strategico, per il passo successivo, nel processo di riconoscimento degli oggetti, che, partendo dalle misure di forma delle regioni dovrà produrre un risultato non soggettivo.

5 5 Ricordiamo che le forme da analizzare sono proiezioni bidimensionali di oggetti 3D che possono apparire diversi in relazione alle diverse condizioni di osservazione (cambiamento della posizione ed orientamento tra oggetto e osservatore) Questo genera forme diverse 2D nel piano immagine per uno stesso oggetto invarianti scalaposizioneorientazioneDa ciò emerge lesigenza di sviluppare metodi di rappresentazione e descrizione delle forme che idealmente dovrebbero essere invarianti rispetto al cambiamento di scala, la posizione ed orientazione degli oggetti osservati.

6 6 Purtroppo non esistono metodi di descrizione delle forme che operano perfettamente proprietà geometriche e topologicheTuttavia sono disponibili diversi metodi di rappresentazione e descrizione che offrono buoni risultati per descrivere oggetti 3D, partendo da una o più delle loro proiezioni 2D, sulla base di alcune proprietà geometriche e topologiche derivate dalle forme osservate.

7 7 RAPPRESENTAZIONE ESTERNA DELLE REGIONI CHAIN CODE La rappresentazione del contorno può essere realizzata con il metodo di Freeman, chiamato anche chain coding, che consiste di una sequenza di codici numerici rappresentanti una sequenza di segmenti lineari di lunghezza unitaria ed una determinata direzione In figura è evidenziato come sono codificati i pixel del contorno in un reticolo quadrato sulla base della 4-vicinanza ed 8-vicinanza. Dal Gonzalez Digital Image Processing cap.11 Ma anche Nixon, Aguado:Feature Extraction And Image Processing

8 8 La descrizione del contorno comprende le coordinate della posizione (x,y) del pixel iniziale del contorno e da un 4-percorso oppure 8-percorso che costituisce rispettivamente la sequenza ordinata dei codici di direzione da 0 a 3 oppure da 0 a 7 La sequenza dei codici di un contorno cambia con il variare del pixel di partenza del contorno Questo costituirebbe un grosso problema per lanalisi delle forme quando basato sul confronto della sequenza dei codici S2S2 S1S

9 9 Tale inconveniente può essere risolto normalizzando la sequenza dei codici del contorno come segue: Si considera la sequenza dei codici come una sequenza circolare (costituita dai numeri che indicano i codici di direzione), che può essere riconfigurata mediante operazioni elementari di rotazione circolare (spostamento e inserimento) dei numeri di direzione, (il codice che esce da un estremo della sequenza rientra dallestremo opposto) fino a quando la sequenza dei numeri forma un intero con valore minimo S S S=1×90°=

10 10 Rispetto alla rotazione, il codice della sequenza è normalizzato con la derivata prima della codifica La derivata prima è calcolata dal conteggio del numero di direzioni (in senso antiorario) che separano due codici adiacenti della sequenza Per esempio, se consideriamo il contorno la sua derivata prima rispetto ad un 4-percorso risulterebbe Se il codice è considerato come una sequenza circolare, il primo elemento del codice normalizzato si ottiene considerando la distanza direzionale tra lultimo (nellesempio 0) ed il primo codice (nellesempio 3) della sequenza di input. Dallesempio considerato il codice normalizzato diventa

11 11 Un vantaggio del chain code rispetto alla rappresentazione matriciale, specialmente per oggetti binari, è dato dalla compattezza di tale codifica Per esempio, per un oggetto circolare con diametro di D pixel, nella rappresentazione matriciale occorrerebbero circa D 2 locazioni di memoria per memorizzare tutti i pixel delloggetto, mentre con il chain code con 8-direzioni, loggetto sarebbe codificato in circa D bit (in pratica 3 bit per ogni pixel del contorno) Per D molto grande, il vantaggio della compattezza risulta più evidente Un altro vantaggio di questa codifica si riscontra quando necessita calcolare il perimetro e larea della forma.

12 12 Impronta (signature) Limpronta è definita come una funzione monodimensionale per rappresentare un contorno Considera come funzione impronta la distanza r di ciascun pixel del contorno dal centro di massa del contorno stesso definita in relazione allangolo compreso tra lasse delle x ed il vettore distanza r. In pratica, si passa da una rappresentazione bidimensionale del contorno ad una rappresentazione monodimensionale r( ) che risulta semplificata. Limpronta dipende dalle dimensioni della forma e dal pixel di partenza del contorno Si normalizza rapportando la funzione r( ) rispetto ad un valore massimo predefinito.

13 13 Impronta (signature) Varianti della funzione impronta Angolo formato tra la tangente del contorno con una linea orizzontale di riferimento Funzione densità delle pendenze ° -45° +15° AB C D E E DC B A

14 14 Rappresentazione mediante scheletrizzazione In molte applicazioni si hanno immagini che rappresentano particolari oggetti con una dominanza di strutture lineari a spessore variabile e con forme complesse di ramificazioni Pensiamo per esempio, alle immagini per la ispezione di circuiti stampati, oppure alle immagini provenienti dalla digitalizzazione di mappe di curve di livello (pendenza) del territorio, oppure a quelle ottenute dalla digitalizzazione dei disegni tecnici In questi casi, per la rappresentazione della forma degli oggetti (curve di livello, piste dei circuiti stampati, tratti del disegno) è conveniente usare il cosiddetto scheletro (skeleton)

15 15 Rappresentazione mediante scheletrizzazione (MAT - Medial Axis Transformation) Una spiegazione intuitiva della MAT è data immaginando di voler bruciare due prati uno a forma cilindrica ed uno rettangolare Nel caso del prato rettangolare si riscontrano dei punti, dove si intersecano le linee di fuoco orizzontale e verticale, che si trovano alla minima equidistanza da almeno due punti del contorno Linsieme dei punti di fuoco con questa caratteristica costituiscono lasse mediano dello scheletro Asse mediano dello scheletro Confine di fuoco ContornoContorno rettangolare Linee di fuoco Asse mediano dello scheletro

16 16 Rappresentazione mediante scheletrizzazione (MAT - Medial Axis Transformation) Più in generale possiamo definire la MAT di una regione R con contorno C come segue: Ogni pixel di R appartiene allasse mediano se esso è contemporaneamente equidistante da almeno due punti del contorno C. Nel caso delle immagini digitali, il valore f(P) dei pixel appartenenti allasse mediano, corrisponde alla distanza di P dal contorno C

17 17 Rappresentazione mediante scheletrizzazione (MAT - Medial Axis Transformation) Una semplice scheletrizzazione è ottenuta applicando la trasformata asse mediano misurando la distanza d(P,C) di ogni pixel P delloggetto R dal contorno C. Le distanze d sono massimi locali se d(P,C) d(Q,C) per ogni pixel Q nelle vicinanze di P. Il valore della distanza è calcolato operando con una finestra 3×3. Posizionando la finestra in ogni pixel dellimmagine binaria di input f(P), la distanza g(P) del pixel centrale è calcolato aggiungendo al valore del pixel corrente f(P) il valore minimo dei pixel 4-vicinanza (sono i pixel Nord, Sud, Est, Ovest) g 0 (i,j) = f(i,j) g k (i,j) = g 0 (i,j)+min[g k-1 (u,v)]k=1,

18 18 Rappresentazione mediante scheletrizzazione (MAT - Medial Axis Transformation) g 0 (i,j) = f(i,j) g k (i,j) = g 0 (i,j)+min[g k-1 (u,v)]k=1,

19 19 Immagine RGB di un pattern vascolare Banda GreenEqualizzazione semplice dellistogramma Equalizzazione adattiva CLAHE Sistema automatico di localizzazione dei vasi sanguigni Esempio di scheletrizzazione in campo medico - preprocessing

20 20 Sistema automatico di localizzazione dei vasi sanguigni SEGMENTAZIONE

21 21 Esempio di scheletrizzazione in campo medico Sistema automatico di localizzazione dei vasi sanguigni

22 22 Descrizione delle forme Il passo successivo alla segmentazione riguarda il processo di riconoscimento degli oggetti ossia la loro identificazione partendo dalle regioni omogenee ottenute con la segmentazione Il processo di riconoscimento utilizza gli schemi di rappresentazione delle regioni discussi in precedenza misure quantitative Vediamo ora come è possibile estrarre misure quantitative che caratterizzano le forme delle regioni per semplificare il processo di riconoscimento degli oggetti Le misure delle forme possono essere estratte analizzando i pixel del contorno oppure tutti i pixel delle regioni stesse

23 23 Descrizione delle forme misure di forme invarianti Ricordiamo inoltre che necessita definire misure di forme invarianti rispetto alla posizione delloggetto proiettato nel piano immagine ed alle diverse possibili proiezioni dello stesso oggetto Questo porta alla scelta di descrittori di forme invarianti rispetto alla rotazione, traslazione e distanza tra oggetto e osservatore

24 24 PERIMETRO Misura geometrica che può essere calcolata partendo dalla rappresentazione del contorno di un oggetto Esprime la somma delle distanze tra centro e centro della sequenza dei pixel che costituiscono il contorno delloggetto Con una codifica del contorno a 8-direzioni la distanza è espressa dal contributo dei pixel in direzione verticale oppure orizzontale codificati con numeri pari, e dal contributo dei pixel in direzione diagonale (a 45 o rispetto agli assi principali) codificati con numeri dispari Assumendo il pixel con dimensioni quadrate (rapporto tra larghezza ed altezza 1:1), il perimetro delloggetto con codifica 8-vicinanza è data da Dispari Pari dove n P ed n D rappresentano rispettivamente il numero dei pixel con codice pari e dispari del contorno.

25 25 PERIMETRO Molto sensibile al rumore presente nellimmagine ed è influenzato dagli algoritmi di segmentazione utilizzati per lestrazione di regioni omogenee Molta attenzione si deve prestare quando si vuole usare il perimetro come descrittore di forma valutato da differenti immagini Il perimetro non è sempre invariante rispetto alla rotazione delloggetto. Se il contorno è codificato con 4-direzioni, la misura del perimetro deriva direttamente dal numero dei pixel del contorno (non esiste più il fattore )

26 26 AREA LArea di un oggetto costituisce una misura geometrica di forma poco significativa. La misura dellArea è ottenuta direttamente contando il numero di pixel della regione nel caso di una sua rappresentazione matriciale Se invece loggetto è rappresentato dalla codifica del contorno chain code, la misura dellArea risulta più semplice rispetto al conteggio dei pixel nella rappresentazione matriciale Questo deriva dalla compattezza della codifica del contorno La procedura che calcola lArea partendo dalla codifica del contorno opera in modo simile allintegrazione numerica.

27 27 AREA Start y x La procedura inizia ad elaborare ogni codice della sequenza del contorno e per il corrispondente pixel deve essere nota lordinata y. La misura dellArea è calcolata sommando il contributo positivo o negativo dellArea dei rettangoli, generati in corrispondenza di ogni codice della sequenza, che hanno la larghezza di base uguale ad un pixel e laltezza uguale allordinata y corrispondente

28 28 AREA Indicando con A larea, con S 1, S 2... S n il codice della sequenza del contorno, larea è calcolata come segue: 1) A=0 2) Per ciascun elemento del codice S i esegue: Switch (S i ) { case 0: case 1: case 7: A=A+Y(S i ); Break; case 3: case 4: case 5: A=A-Y(S i ); Break; case 2: case 6: Break; }; 3) A rappresenta la misura dellArea stimata della sequenza S S n. Y(S i ) rappresenta lordinata del pixel associato al codice S i del contorno.

29 29 COMPATTEZZA Le misure geometriche perimetro ed Area sono entrambe poco significative quando un oggetto è osservato da distanze diverse In questo caso è necessario definire misure di forme invarianti al cambiamento di scala delloggetto nel piano immagine La compattezza C è una semplice misura (non dimensionale) di forma definita come: dove P ed A sono rispettivamente il perimetro e lArea della regione. Il cerchio è la figura geometrica più compatta nello spazio Euclideo con valore minino della compattezza uguale a Per il quadrato la compattezza è 16 e per un triangolo equilatero è Forma compatta Forma non compatta

30 30 RETTANGOLARITÀ Questa misura geometrica è data dal rapporto tra lArea A 0 delloggetto e lArea A R del rettangolo minimo che include loggetto: Se loggetto ha forma rettangolare R assume valore 1, per un oggetto circolare la rettangolarità è /4 e diventa con valori minori per oggetti con forma complessa.

31 31 ASSE MAGGIORE Si definisce asse maggiore di un oggetto la corda di massima lunghezza tracciata tra due punti estremi del contorno delloggetto stesso Se indichiamo con P i e P j due pixel del contorno C e con d(P i,P j ) la distanza tra P i e P j, la lunghezza dellasse maggiore D 1 è dato da: D1D1 PiPi PjPj Asse maggiore La lunghezza dellasse maggiore D 1 e langolo di orientazione dellasse maggiore rispetto allasse x costituiscono due parametri utili di descrizione del contorno

32 32 ASSE MINORE Lasse minore di un oggetto è definito come la corda di massima lunghezza che può essere tracciata in direzione perpendicolare allasse maggiore. La lunghezza dellasse minore è calcolata analogamente a quella dellasse maggiore considerando in questo caso i pixel P l e P k del contorno corrispondenti allestremità dellasse minore RETTANGOLO DI BASE Il parallelogramma con lati paralleli a D 1 e D 2 che include completamente loggetto è chiamato rettangolo di base. Il rettangolo di base corrisponde al più piccolo rettangolo che include completamente loggetto e presenta una orientazione coincidente con quella delloggetto stesso. Il rettangolo di base può essere calcolato se è noto langolo di orientazione delloggetto. Asse minore PlPl PkPk Rettangolo di base D2D2

33 33 ECCENTRICITÀ La più semplice misura di eccentricità di un oggetto è ottenuta dal rapporto D 2 /D 1 tra le lunghezze dellasse maggiore e quella dellasse minore. ALLUNGAMENTO Una misura dellallungamento di un oggetto è ottenuta dal rapporto tra laltezza e la base del rettangolo di base associato allo stesso oggetto. Numero di Eulero (visto in precedenza)

34 34 MOMENTI SPAZIALI I momenti spaziali possono essere considerati come un approccio statistico per la caratterizzazione della forma di un oggetto Il livello di grigio associato ad un pixel non è caratterizzato da un valore univoco bensì da una funzione di densità di probabilità p(z) che indica quanto frequentemente osserviamo il livello di grigio z dellimmagine In precedenza, considerando limmagine come processo stocastico, abbiamo ricavato alcune caratteristiche derivate dalla statistica del primo ordine Ricordiamo che

35 35 MOMENTI SPAZIALI Dallistogramma H sono derivabili alcune caratteristiche statistiche come i momenti di ordine n, con n intero positivo: Per definizione il momento di ordine 1 è zero mentre quello di ordine 2 risulta: dove è il valore di grigio medio definito come:

36 36 MOMENTI SPAZIALI Possiamo ora estendere i risultati dellapproccio statistico ad immagini bidimensionali allo scopo di definire i momenti spaziali di un oggetto rappresentato con i livelli di grigio f(x,y) In questo caso f(x,y) rappresenta la funzione densità di probabilità congiunta ed il momento M di ordine (m+n) è dato da: Al variare degli interi positivi m ed n si genera un insieme indefinito di momenti {M m,n } in corrispondenza dellimmagine f(x,y) e viceversa.

37 37 MOMENTI SPAZIALI Per caratterizzare la forma di un oggetto in modo univoco è importante definire un insieme ristretto di momenti e possibilmente invarianti rispetto alla posizione, orientazione e scala delloggetto I momenti di ordine zero e del primo ordine sono definiti dalle equazioni: Per le immagini binarie il momento di ordine zero M 0,0 coincide con larea delloggetto.

38 38 MOMENTI SPAZIALI - INVARIANZA ALLA TRASLAZIONE momento centrale Per ottenere linvarianza dei momenti rispetto alla traslazione,si può calcolare il momento centrale di ordine (m+n) che è dato da: Area delloggetto Momenti spaziali del primo ordine

39 39 MOMENTI SPAZIALI - INVARIANZA ALLA TRASLAZIONE Nel caso di immagini binarie: f(x,y)=1 per pixel appartenente alloggetto f(x,y)=0 altrimenti pertanto riflette solo la forma delloggetto e conseguentemente un insieme di momenti sono unicamente determinati Per le immagini binarie il calcolo del momento centrale spaziale si riduce a

40 40 MOMENTI SPAZIALI - INVARIANZA AL CAMBIAMENTO DI SCALA In diverse applicazioni si presenta la necessità di osservare gli oggetti da distanze diverse. Questo condiziona le misure di forma che devono essere invarianti rispetto al cambiamento di scala delloggetto osservato In queste condizioni possiamo considerare che le coordinate delloggetto sono trasformate in x = x ed y = y e conseguentemente loggetto è trasformato da un fattore di scala con i momenti centrali spaziali modificati da:

41 41 MOMENTI SPAZIALI - INVARIANZA AL CAMBIAMENTO DI SCALA I momenti centrali spaziali possono essere normalizzati rispetto al momento di ordine zero μ 00 come segue: dove η mn sono i momenti centrali spaziali (normalizzati) invarianti rispetto al cambiamento di scala. Nel caso di immagini binarie, poiché il momento centrale di ordine zero coincide con larea delloggetto, i momenti centrali sono tutti normalizzati rispetto allarea delloggetto.

42 42 MOMENTI SPAZIALI - INVARIANZA ALLORIENTAZIONE DELLOGGETTO I momenti centrali del primo ordine 01 ed 10 sono per definizione zero, infatti

43 43 MOMENTI SPAZIALI - INVARIANZA ALLORIENTAZIONE DELLOGGETTO Analizziamo ora il significato dei tre momenti centrali del secondo ordine: il valore del livello di grigio dei pixel f(x,y) (che in analogia alla meccanica classica rappresenta la densità delloggetto) è moltiplicato per il quadrato della distanza dal centro di massa (x c,y c ).

44 44 MOMENTI SPAZIALI - INVARIANZA ALLORIENTAZIONE DELLOGGETTO I momenti 2,0 e 0,2 rappresentano i momenti di inerzia delloggetto rispetto allasse x ed y. Se loggetto ha una forma allungata con un asse principale ben definito è possibile calcolare langolo di orientazione delloggetto come linclinazione dellasse minimo di inerzia rispetto allasse delle x. I momenti 2,0 e 0,2 rappresentano i momenti di inerzia delloggetto rispetto allasse x ed y. langolo di orientazione delloggetto Se loggetto ha una forma allungata con un asse principale ben definito è possibile calcolare langolo di orientazione delloggetto come linclinazione dellasse minimo di inerzia rispetto allasse delle x.

45 45 MOMENTI SPAZIALI - INVARIANZA ALLORIENTAZIONE DELLOGGETTO I momenti centrali del secondo ordine sono invarianti rispetto alla rotazione sia che sono calcolati dopo che loggetto è ruotato di un angolo sia che sono calcolati rispetto agli assi principali Una seconda misura di eccentricità può essere espressa in termini dei momenti centrali del secondo ordine come: dove assume valori da 0 ad 1. Per oggetti a forma circolare tende a zero mentre per oggetti con forma poligonale tende a 1.

46 46 MOMENTI SPAZIALI -

47 47

48 48 Riconoscimento Loghi

49 49 Esperiemento – Estrazione Momenti di Hu

50 50 Esperiemento – Estrazione Momenti di Hu

51 51 Esperiemento – Estrazione Momenti di Hu

52 52 Esperiemento – Estrazione Momenti di Hu

53 53 Esperiemento – Estrazione Momenti di Hu


Scaricare ppt "1 RAPPRESENTAZIONE E DESCRIZIONE DELLE FORME. 2 Il processo di segmentazione conduce alla partizione di una immagine in regioni omogenee Tali regioni."

Presentazioni simili


Annunci Google