L1 Formato immagini, video e sistemi di acquisizione Corso di Visione Artificiale A.A. 2011/2012 Ing. Luca Mazzei

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
1 Tutto su liceoclassicojesi.it 1° Incontro sulla gestione di liceoclassicojesi.it.
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
Lezioni di Astronomia 3- Le stelle Bologna 8 aprile 2010
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
I Formati Grafici I Formati grafici sono i formati tramite le quali le immagini sono salvate su disco fisso. I Formati grafici si suddividono in Formati.
Elaborazione del Book Informatico. 2 Marco M. Vernillo – a.a. 2002/2003 – Elaborazione del Book Informatico Elaborazione del Book Informatico 1. Tecnologie.
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
1 Tavolo del Patto per la crescita intelligente, sostenibile e inclusiva Il ricorso agli ammortizzatori sociali nei territori colpiti dagli eventi sismici.
Implementazione dell algortimo di Viterbi attraverso la soluzione del problema di cammino mi- nimo tramite software specifico. Università degli studi di.
EPA 01/02 III/1 I consumi di prodotti agro-alimentari: differenziazioni nello spazio e nel tempo Cosa spiega le differenze nei consumi tra individui diversi…
Programmazione 1 9CFU – TANTE ore
Capitolo 5 adding images to your web pages. 2 JPEG.
Canale A. Prof.Ciapetti AA2003/04
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Dicembre 2006 Informatica applicata prof. Giovanni Raho 1 Informatica applicata La comunicazione ed IL FORMATO DEI FILE.
Master universitario di II livello in Ingegneria delle Infrastrutture e dei Sistemi Ferroviari Anno Accademico 2012/2013 Cultura dimpresa, valutazione.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Scritte scritte scritte scritte scritte scritte scritte Scritte scritte Titolo.
MP/RU 1 Dicembre 2011 ALLEGATO TECNICO Evoluzioni organizzative: organico a tendere - ricollocazioni - Orari TSC.
Laboratorio di Informatica
CALCIO SKY 2007 – 2008 PROFILO DI ASCOLTO. 2 INDICE DEGLI ARGOMENTI Profilo di ascolto CALCIO SERIE A 2007 – 2008 Totale campionato (tutte le partite)……………………………………………….
Lezione 6 Encoder ottici
STILI DI APPRENDIMENTO ED EVOLUZIONE INTERFACCE
Trattamento Immagini (parte 2)
DATA LINK PHYSICAL IP TRASPORTO APPLICATIVOclient PHYSICAL IP TRASPORTO APPLICATIVOserver Un Client è interconnesso ad un Server attraverso una porzione.
19 Lezione 21/5/04 Composizione dell'immagine 1 COMPOSIZIONE DELLIMMAGINE.
Contatore: esempio di circuito sequenziale
Trattamento di Foto e Immagini Digitali
2 3 4 RISERVATEZZA INTEGRITA DISPONIBILITA 5 6.
Palermo, may 2010 F.Doumaz, S.Vinci (INGV-CNT- Gruppo di telerilevamento)
Melfi, 1 aprile 2011 – MediaShow 1 Social Network: possibilità di uso consapevole nella didattica Uso, consapevolezza, opportunità, proposte Caterina Policaro.
Nuove frontiere della medicina trasfusionale: il contributo Avis
COMPUTER GRAPHIC. La computer graphic si occupa della creazione o manipolazione di immagini digitali. Le immagini digitali possono essere di due tipi:
CORSO TECNICO R.C.A. ELABORATO PERITALE
La risoluzione determina il dettaglio dell'immagine, quindi le massime dimensioni di stampa che potete raggiungere mantenendo una buona qualità. La fotocamera.
Architettura delle GPU e
Fare clic per modificare lo stile del titolo Fare clic per modificare stili del testo dello schema – Secondo livello Terzo livello – Quarto livello » Quinto.
Le porte di comunicazione
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ISOIVA (LOCALE) TO ISOIVA (WEB) RIPARTIZIONE INFORMATICA UFFICIO APPLICATIVI AMMINISTRATIVI 13/04/2011 UNIVERSITÀ DEGLI STUDI DI FERRARA 1.
SINS - Seminario Istruzione Nuovi Soci - 22 Settembre Cesare Andrisano Presidente Sottocommissione Web Social Network Distretto 2070.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
TECNOLOGIE DELLINFORMAZIONE E DELLA COMUNICAZIONE PER LE AZIENDE Materiale di supporto alla didattica.
1 Guida per linsegnamento nei corsi per il conseguimento del CERTIFICATO DI IDONEITÀ ALLA GUIDA DEL CICLOMOTORE.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
L2 Elaborazione di immagini in C/C++
Esercitazioni di Meteorologia da satellite
24 aprile 2002 Avvisi: Risultati 1 o Esonero: (entro) lunedi 27 disponibili nella pag. WEB, ma anche esposti nella bacheca fuori dal corridoio 2 o dente,
1 Questionario di soddisfazione del servizio scolastico Anno scolastico 2011/2012 Istogramma- risposte famiglie.
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
L4 Tecniche di Background Subtraction
Publishing & Editing Immagini
Single knowledge project
Bando di Residenza Cap Scheda ENTE 3ROL - Richieste On Line.
-17 Aspettative economiche – Europa Settembre 2013 Indicatore > +20 Indicatore 0 a +20 Indicatore 0 a -20 Indicatore < -20 Unione Europea Totale: +6 Indicatore.
Corso di Informatica Corso di Laurea in Conservazione e Restauro dei Beni Culturali Gianluca Torta Dipartimento di Informatica Tel: Mail:
Corso di Informatica Corso di Laurea in Conservazione e Restauro dei Beni Culturali Gianluca Torta Dipartimento di Informatica Tel: Mail:
Sistemi di elaborazione dell’informazione Modulo 3 -Protocolli applicativi Unità didattica 4 - Protocolli del Web Ernesto Damiani Lezione 3 – Esempi HTTP.
Codifica di Immagini Fabio Cantaro.
1 Acceleratori e Reattori Nucleari Saverio Altieri Dipartimento di Fisica Università degli Studi - Pavia
Trattamento Immagini (parte 2)
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Prof. Dario Scalini. Luce e Colore FOTORECETTORI  coni (colori) e bastoncelli (luminosità)
STRUTTURE DEI DATI (COMPLESSI). TESTO (codifica informazioni testuali) TESTO: (es. libro) sequenza di capitoli, paragrafi,pagine,righe, parole.
Video Grafica Immagini. Modalità Video Risoluzione –Numero di pixel visualizzati sul monitor; per esempio 800 x 600, 1024 x 768, 1280 x 1024 Profondità.
Transcript della presentazione:

L1 Formato immagini, video e sistemi di acquisizione Corso di Visione Artificiale A.A. 2011/2012 Ing. Luca Mazzei

AA 2009/2010 Visione Artificiale 2 Argomenti n Formati di file per immagini – Formati raster: PNM, TIFF, BMP, GIF, PNG, JPEG – Formati vettoriali: SVG – Formati misti: PostScript, PDF, AI n Formati di file per video

Formati raster AA 2009/2010 Visione Artificiale 3

Formati raster n Header – Formato – Dimensioni (WxHxD) – Colore (spazio e riferimenti colorimetrici) – Compressione o meno – Altre informazioni (Autore, TimeStamp, …) n Bitmap – Valori numerici delle intensità luminose dei punti. – Codifica fortemente dipendente dal formato – Può essere compressa in vari modi (JPEG, ZIP, LZW, …) AA 2009/2010 Visione Artificiale 4

PNM (PBM/PGM/PPM) n Portable Bit/Grey/Pix Map Format n Formato NON compresso Adatto per applicazioni di visione artificiale Facilmente editabile Facilmente editabile n Diffuso in ambiente UNIX (Linux) Si converte facilmente n Header in formato ASCII Per incorporare nellimmagine informazioni aggiuntive Facilmente modificabile con editor di testo n Esiste anche la versione video (PVM) AA 2009/2010 Visione Artificiale 5

PNM Header e Bitmap AA 2009/2010 Visione Artificiale 6 P P4 = PBM P5 = PGM P6 = PPM Dimensioni Immagine Informazioni aggiuntive Es. TimeStamp, velocita (0,0)(0,1) … (319,239)(1,0) … Valore massimo del colore PBM, PGM: 1 byte per pixel PPM: 3 byte per pixel

PGM Portable Grey Map n Rappresentazione in memoria bitmap AA 2009/2010 Visione Artificiale

Formati raster compressi n Tipologia di compressione n Lossless – Senza perdita di dati – TIFF, BMP, PNG, GIF, JPEG n Lossy – Con perdita di dati – JPEG AA 2009/2010 Visione Artificiale 8

TIFF Tag(ged) Image File Format n Adobe Developers Association, TIFF (TM) Revision Final, June 3, 1992 n Compresso, senza perdita n Compressione: Nessuna, ZIP, LZW … n Profondità di colore variabile n Pagine multiple (Fax) AA 2009/2010 Visione Artificiale 9

Windows BMP Format n Device Independent Bitmap (DIB) n Struttura del file – BITMAPFILEHEADERbmfh; tipo, dimensione e layout (pixel lunghezza) – BITMAPINFOHEADER bmih; dimensione, tipo di compressione e formato del colore – RGBQUAD aColors[]; n Contiene tanti elementi quanti sono i colori nella bitmap n Non presente per bitmap a 24 bit di colore (24-bit red-green-blue (RGB) per rappresentare ciascun pixel) n I colori nella tabella sono in ordine di importanza (dithering) – BYTE aBitmapBits[]; indici/intensita di colore codificate run-length encoded (RLE) AA 2009/2010 Visione Artificiale 10

GIF – Graphic Interchange Format n Molto usato su web n 8-bit (256 colori), trasparenza, animazioni n Usa una color map (256 colori su 16M) n Algoritmo di compressione brevettato n Viene abbandonato in favore di PNG Portable Network Graphic – Colore a 24 bit + canale Alpha – Algoritmo di compressione non brevettato AA 2009/2010 Visione Artificiale 11

PNG n Header con una firma di 8-byte – E 47 0D 0A 1A 0A n Dopo lheader è presente una serie di chunk ognuno dei quali contiene le informazioni sullimmagine n Gestione della trasparenza AA 2009/2010 Visione Artificiale 12 LengthChunk typeChunk dataCRC 4 bytes Length bytes4 bytes

JPEG File Interchange Format (JFIF) n JPEG: Joint Photographic Experts Group n Nato alla fine degli anni 80 n Diverso dallalgoritmo di compressione JPEG n Platform independent (PC, Mac …) n Spazi di Colore: RGB, CMYK, YUV AA 2009/2010 Visione Artificiale 13

Compressione JPEG n La compressione basata su luminanza/crominanza n I valori RGB o CMYK dei pixel vengono convertiti in uno spazio basato su luminanza/crominanza n Compressione separate dei due fattori n Per il sistema visivo umano la luminanza è più importante della crominanza n Linformazione sulla luminanza viene preservata più rispetto a quella di crominanza AA 2009/2010 Visione Artificiale 14

JPEG PRO e CONTRO n Compressione Elevata: – 20 1internet – 5 1 stampa n Bene immagini a tono continuo n Male immagini con pochi colori n Poco adatto per visione (perdita, artefatti) AA 2009/2010 Visione Artificiale 15

Scalable Vector Graphics n Grafica vettoriale n linguaggio derivato dall'XML W3 n permette di avere 3 tipi di oggetti grafici: – forme geometriche, cioè linee costituite da segmenti di retta e curve e aree delimitate da linee chiuse; – immagini della grafica raster e immagini digitali; – testi esplicativi, eventualmente cliccabili. AA 2009/2010 Visione Artificiale 16

SVG - Esempio AA 2009/2010 Visione Artificiale 17 <svg xmlns:dc=" xmlns:cc=" xmlns:rdf=" xmlns:svg=" xmlns=" xmlns:sodipodi=" xmlns:inkscape=" width=" " height=" " id="svg2" version="1.1" inkscape:version=" r9760" sodipodi:docname="Nuovo documento 1"> <defs id="defs4" /> <sodipodi:namedview id="base" pagecolor="#ffffff" bordercolor="#666666" borderopacity="1.0" inkscape:pageopacity="0.0" … inkscape:randomized="0" d="m , , , , , , , , , , z" transform="translate(0, )" inkscape:transform-center-x=" " inkscape:transform-center-y=" " />

PostScript n Linguaggio di descrizione della pagina n Permette di incorporare grafica vettoriale e raster Es: EPS che disegna un quadrato spesso 10 unit Es: EPS che disegna un quadrato spesso 10 unit %!PS-Adobe-3.0 EPSF-3.0 %BoundingBox: setlinewidth moveto 0 90 rlineto 90 0 rlineto rlineto closepath stroke n Usato soprattutto per la stampa dei documenti AA 2009/2010 Visione Artificiale 18

Formati video n Unico file una sequenza di immagini n Header: informazioni sulla sequenza – Dimensione del frame e profondità di colore – Frame rate – Tipo di compressione n Visione: meglio frame separati e non compressi. – Piu facile operare su un singoli frame con diverse app. – Sequenze lunghe: File di dimensioni minori, molti file AA 2009/2010 Visione Artificiale 19

Formati video AA 2009/2010 Visione Artificiale 20 n Formati non compressi (PVM) n Formati compressi (MPEG) HEADER Frame 1 Frame 2 Frame n … HEADERKeyFrame1Delta1 … Delta2 Deltan KeyFrame2 …

Acquisizione delle immagini n Sistemi di acquisizione immagini n Telecamere analogiche n Telecamere digitali n Smart cameras n Schede di acquisizione video n Interfacce di programmazione AA 2009/2010 Visione Artificiale 21

Panoramica AA 2009/2010 Visione Artificiale 22 n Immagini generate dalla telecamera (Tx) n Collegamento n Trasferite al sistema di elaborazione (Rx) TC Elaboratore

Videocamera (camera) AA 2009/2010 Visione Artificiale 23 n Ingressi – Alimentazione – Trigger – Scena inquadrata n Uscite – Segnale video (Analogico o Digitale) – Sincronizzazione n Parametri (fisici, segnali, software) – AGC (On/Off e riferimento), shutter, temp di colore…

Conversione A/D n Sistema di elaborazione (analogico) – Rumore (termico e interferenze) – Problemi di ricampionamento – Basse frequenze (circa 30 fps) – Formato standard (televisivo: 768x576) – Basso costo (dipende dal sensore) n Telecamera (digitale) – CMOS: conversione alla sorgente – Esistono alcuni standard (Es: DV, DCAM, Camera Link, USB …) – Prestazioni elevate: (fino a 1000 fps: crash test) – Software complesso – Costo variabile (Firewire basso, Camera Link elevato) n Collegamento (ibrido) – Necessità di usare telecamere con sensori particolari (di solito analogiche) e frame grabber digitali a basso costo AA 2009/2010 Visione Artificiale 24

Ritardi n Limmagine acquisita rappresenta un evento avvenuto nel passato. n TC, buffer di tx, rx, driver, API. n Per applicazioni realtime occorre avere bassi ritardi. (Elab + output) AA 2009/2010 Visione Artificiale 25 TC Elaboratore t t + t1 + t2 t1 t2

Sensori AA 2009/2010 Visione Artificiale 26

Tipica Pipeline Sensore AA 2009/2010 Visione Artificiale 27

CCD vs CMOS AA 2009/2010 Visione Artificiale 28 n Charge-Coupled Device: – Charge is actually transported across the chip and read at one corner of the array – Usage of a special manufacturing process to create the ability to transport charge across the chip without distortion. – Higher Fill Factor

CCD vs CMOS n Complimentary Metal-Oxide Semiconductor: – Several transistors at each pixel amplify and move the charge using more traditional wires – It is more flexible because each pixel can be read individually – Usage of the same traditional manufacturing processes to make most microprocessors. – Easy integration – Lower Fill Factor AA 2009/2010 Visione Artificiale 29

CMOS microlenses AA 2009/2010 Visione Artificiale 30

Colore: Separazione Spettrale AA 2009/2010 Visione Artificiale 31

Color Field Array image sensor AA 2009/2010 Visione Artificiale 32 Microlenti che focalizzano la luce dentro al filtro CFA Il CFA permette il passaggio di un solo colore per volta I fotorecettori accumulano gli elettroni ricevuti e il voltaggio viene trasformato in un valore numerico.

CFA image sensor AA 2009/2010 Visione Artificiale 33

Demosaicing linear interpolation AA 2009/2010 Visione Artificiale 34

Riepilogo AA 2009/2010 Visione Artificiale 35 (a)Grayscale mosaic image (b)Color vision mosaic image (c)Demosaicked full-color image (d)Post processed final image

Defects AA 2009/2010 Visione Artificiale 36

Telecamere Analogiche n Sensori – Visibile (mono e colore), NIR, FIR – Tecnologia CCD, CMOS n Formato n Standard PAL, NTSC AA 2009/2010 Visione Artificiale 37

Telecamere digitali n Sensori: visibile o NIR n Formato variabile – risoluzione n continua impostabile via SW (anche nel tempo) n elevata: sensori oltre 4096x4096 n supporto formati compressi (JPEG,…) n Interfacce di comunicazione – Low End: DV, DCAM, Ethernet – High End: CameraLink AA 2009/2010 Visione Artificiale 38

Smart camera n General Purpose System n Applicazioni industriali n Atom Z530 Z510 n Ram DDR2 533Mhz n SSD 4Gb AA 2009/2010 Visione Artificiale 39

Schema camera pc AA 2009/2010 Visione Artificiale 40 TC 1 Elaboratore Frame Grabber

Frame grabber analogici n Schede con uno o più ingressi video agganciati al bus del calcolatore n Caratterizzate da un chip di conversione – BT8x8, Philips SAA 7146, … – Necessari driver di dispositivo appositi n Sincronizzazione HW a basso costo n Con interfacce opportune si possono acquisire 2 segnali sincronizzati con 1 canale interallacciato n Necessaria unAPI di alto livello per mascherare le differenze tra I chip. Video For Linux (2) AA 2009/2010 Visione Artificiale 41

Frame grabber digitali a basso costo n Firewire, USB, Eth Controller integrati sulle MoBo n Elevato numero di dispositivi n Sincronizzazione SW o HW n API di alto livello – libdc1394. USB AA 2009/2010 Visione Artificiale 42

Sistemi multicanale AA 2009/2010 Visione Artificiale 43 n Per applicazioni avanzate occorrono più camere –Flusso dati molto grande –Sincronizzazione –Regolazione camere TC 1 Elaboratore TC 2 TC n …

Sincronizzazione n N camere si dicono sincronizzate quando (a parità di tempo di acquisizione) il ritardo tra i tempi di inizio acquisizione è basso n La sincronizzazione dipende dallapplicazione – Per fenomeni lenti (terreno) anche qualche secondo – Per fenomeni veloci (crash-test) si scende ai s n Hardware – Telecamere master/slave – Generatore di sincronismo n Software – Telecamere digitali con comandi di sincronismo AA 2009/2010 Visione Artificiale 44

API: Video for Linux 2 n API di acquisizione video integrata kernel 2.6 n Acquisizione frames n Proprietà del framegrabber (luminosità, contrasto) n Molto diffusa e stabile. n Supporta i principali framegrabber analogici (Driver integrati nel kernel o forniti dal produttore) AA 2009/2010 Visione Artificiale 45

DCAM n Protocollo per scambio dati con tc FireWire: – flusso di dati consegnati dalla telecamera – parametrizzazione della telecamera (luminosità, otturatore, bilanciamento bianco…) n Canale isocrono: video n Canale asincrono: comandi e parametri n API di alto livello: – libdc AA 2009/2010 Visione Artificiale 46

DCAM connessioni AA 2009/2010 Visione Artificiale 47 LinuxWindowsAppleEmbedded … DCAMCompatibleCamera (Vendor 1) IEEE 1394 BUS DCAMCompatibleCamera (Vendor n) FireWireHub DCAM DCAM DCAM DCAM DCAMCompatibleCamera (Vendor 2) …