Immagini
Le immagini Immagine fotografica (analogica): è composta da milioni di pigmenti colorati molto piccoli e spazialmente irregolari. Si parla di grana della fotografia sulla pellicola fotografica sono posti dei materiali fotosensibili che alterano il loro stato se colpiti dalla luce l’immagine e’ ottenuta per analogia con la quantità di luce che ha impresso i diversi punti della pellicola durante la fase dell’esposizione Immagine digitale: è composta da pixel (picture element) disposti su una griglia i diversi colori che rappresentano le immagini sono memorizzati come numeri in fase di acquisizione delle immagini digitali (macchina fotografica digitale) ad ogni colore e’ associato un numero in fase di visualizzazione (monitor) ad ogni numero e’ fatto corrispondere un colore Il pixel è generalmente quadrato.
Da analogico a digitale Il processo che trasforma un’immagine in una sequenza ordinata di numeri e’ detto digitalizzazione la digitalizzazione avviene con uno scanner (per una singola immagine) o con le macchine fotografiche digitali Campionamento spaziale operazione con la quale un’immagine continua e’ trasformata in un insieme di rettangoli più o meno grandi immagine come matrice di pixel Quantizzazione cromatica ad ogni pixel e’ associato un colore dato dalla media dei colori presenti all’interno della porzione di immagine sottesa al pixel Pixel: elemento minimo d’informazione Intuitivamente: la griglia regolare quadrata (o griglia di campionamento) viene sovrapposta all’immagine da digitalizzare. Ogni quadrato della griglia darà origine ad un pixel e il colore sarà la media dei colori degli oggetti che cadono all’interno di quel quadrato. Più la griglia di campionamento è fitta e migliore sarà il risultato (e maggiore sarà il numero di pixel generati) La quantizzazione è la conversione dell'immagine campionata in valori numerici.
Immagine digitale Un'immagine digitale è la rappresentazione di un'immagine bi-dimensionale tramite una serie di valori numerici, che la descrivono a seconda della tecnica utilizzata Le immagini digitali sono di due tipi immagini vettoriali insieme di punti uniti in linee o altre primitive grafiche immagini raster matrici di pixel Pixel = picture element La rappresentazione raster consiste nell’esprimere l’immagine semplicemente come l’insieme dei pixel che la compongono La rappresentazione vettoriale contiene una descrizione geometrica di ogni oggetto grafico che la compone
Esempi
Immagini vettoriali Nella grafica vettoriale, un’immagine consiste di oggetti grafici (punti, linee, rettangoli, curve, …) ognuno dei quali è definito da una funzione matematica qualità maggiore compressione rispetto alle immagini raster facilmente manipolabili (scalatura, rotazione, …) la realizzazione di immagini vettoriali non è una attività intuitiva La grafica vettoriale ha un notevole utilizzo nell'editoria, nell'architettura, nell'ingegneria e nella grafica realizzata al computer tutti i programmi di grafica tridimensionale salvano i lavori definendo gli oggetti come aggregati di primitive matematiche nei personal computer l'uso più evidente è la definizione dei font Utilizza disegni definiti da entità matematiche (punti, linee, rettangoli, curve, ecc.) alle quali possono essere attribuiti colori e anche sfumature. È radicalmente diversa dalla grafica raster in quanto nella grafica raster le immagini vengono descritte come una griglia di pixel opportunamente colorati. La grafica vettoriale, essendo definita attraverso equazioni matematiche, è indipendente dalla risoluzione. Ad es. una linea che percorre lo schermo trasversalmente se viene rappresentata utilizzando la grafica raster viene memorizzata come una sequenza di pixel colorati disposti a formare la linea. Se si provasse ad ingrandire una sezione della linea si vedrebbero i singoli pixel che compongono la linea. Se la medesima linea fosse memorizzata in modo vettoriale la linea sarebbe memorizzata come un'equazione che parte da un punto identificato con delle coordinate iniziali e termina in un altro punto definito con delle coordinate finali. Ingrandire una sezione della linea non produrrebbe artefatti visivi o la visualizzazione dei singoli pixel componenti l'immagine, dato che la linea sarebbe visualizzata sempre con la massima risoluzione consentita dal monitor. Quasi tutti i font utilizzati dai personal computer vengono realizzati in modo vettoriale, per consentire all'utente di variare la dimensione dei caratteri senza perdite di definizione
Immagini raster L’immagine è una griglia rettangolare (raster) di pixel Ad ogni pixel e’ associato un colore realistiche veloci da visualizzare occupano più memoria meno versatili da gestire Al contrario delle immagini vettoriali con l’ingrandimento la qualità dell’immagine peggiora Sono ideali per fotografie e illustrazioni pittoriche Esistono programmi per la vettorializzazione di immagini raster, ma non sono ancora stabili.
Rappresentazione dei colori Il colore puo’ essere definito con due tecniche modalità indicizzata: se l'immagine contiene pochi colori (massimo 256) si crea un elenco dei colori da utilizzare e nella scacchiera viene inserito l'indice che punta allo specifico colore del pixel palette di colori modalità true color: nel caso si vogliano utilizzare molti più colori il singolo pixel non definisce più l'indice a una tavolozza di colori ma definisce il colore direttamente. spazio dei colori: RGB, CMY, HSB, … In funzione del contenuto dell’immagine, dell’utilizzo, del dispositivo di visualizzazione, o in base ad aspetti percettivi del sistema visivo Il dispositivo di visualizzazione converte la palette in colori a 24 bpp usando la look up table (LUT)
Palette Nel caso di 8 bpp per immagini a colori viene utilizzato un sistema di codifica mediante palette (tavolozza di colori) e’ una lista di colori scelti nell'insieme di tutti quelli disponibili e’ possibile ottenere differenti effetti di colore sulla stessa immagine semplicemente cambiando la sua pallette Si sfrutta il concetto di look up table (LUT) ad ogni colore della tavolozza è associato ad un indice il pixel indica l’indice di questa tabella La rappresentazione dei pixel attraverso indici nella tavolozza permette un drastico risparmio di memoria e tempo computazionale, ma limita la gamma di colori utilizzabili a quelli presenti nella tavolozza Quando è necessario un numero di colori ancora maggiore – è questo il caso di tutte le rappresentazioni fotografiche o realistiche – le tavolozze non vengono usate; il colore è allora codificato direttamente nelle componenti cromatiche secondo il modello adoperato
Palette
Caratteristiche Dimensione Risoluzione numero di pixel che compongono un’immagine 1024x1024, 512x512, … Risoluzione densità dei pixel che formano l'immagine numero di pixel che sono contenuti nell'unità di misura considerata spesso misurata in dpi (dots per inch, ovvero punti per pollice) 1 inch = 2,54 cm) Lo schermo di un computer non può mostrare linee o disegni, ma soltanto, in definitiva, punti: se questi sono sufficientemente piccoli (tali, in pratica, da essere più piccoli della risoluzione percepita dall'occhio umano), l'osservatore ha l'impressione di vedere linee anziché punti allineati, e disegni anziché ammassi di puntini distinti.
Risoluzione La risoluzione lega la dimensione dell’immagine con la grandezza e con la densità dei punti con cui viene visualizzata Maggiore è la risoluzione migliore è la discriminazione dei dettagli e migliore è la possibilità di fare zooming La risoluzione interviene sia al momento della visualizzazione dell’immagine (es. quando cambio la risoluzione dello schermo) e sia al momento della sua acquisizione (es. con la macchina fotografica digitale) Per visualizzare un’immagine digitale su un monitor 72 o 96 dpi per una stampante a getto d’inchiostro tra i 150 e i 300 dpi per una stampante laser 600/1200 dpi Quando di acquisisce un’immagine e’ necessario specificare la risoluzione spaziale con cui si intende acquisire l’immagine. Rappresenta una densità ed è in relazione alla dimensione del supporto di visualizzazione (es. monitor o carta). Rappresenta la capacità di dettaglio (maggiore è la risoluzione è migliore è la discriminazione dei dettagli).
Esempi
Caretteristiche Profondità di colore l’informazione contenuta in un pixel e’ rappresentata in bit quantità di bit necessari per rappresentare il colore di un singolo pixel in un'immagine bitmap maggiore è il numero di bit per pixel, tanti più colori si potranno riprodurre questo concetto è anche noto come bit(s) per pixel, ovvero bpp se N è la profondità di colore il numero di possibili tonalità sarà 2N N=8; con un byte (8 bit) si possono codificare 256 tonalità Nota: con le profondità di colore più basse (ad es. N=8), il valore memorizzato per ciascun bit è generalmente un indice nella palette Il modello di profondità truecolor permette di riprodurre immagini in modo molto fedele alla realtà arrivando a rappresentare 16,7 milioni di colori distinti. Con questa profondità si usano 8 bit per rappresentare il rosso, 8 bit per rappresentare il blu ed 8 bit per rappresentare il verde. I 2^8=256 livelli d'intensità per ciascun canale si combinano per produrre un totale di 16.777.216 colori (256 × 256 × 256). Per la maggior parte delle immagini fotografiche questa profondità consente sfumature ancora più fini di quelle che l'occhio umano riesce a distinguere. Con 24 bit ogni pixel può assumere uno tra circa 16 milioni di colori diversi Problema: l’occupazione di memoria occupata dall’immagine potrebbe esplodere Le dimensioni più diffuse sono 4 o 8 bpp (bit per pixel) per immagini B/W o 8, 24, 32 bit per immagini a colori. Sembra che 10 bit per canale siano sufficienti per raggiungere i limiti assoluti della vista umana in quasi tutte le circostanze.
Occupazione di memoria Occupazione = Dimensione x Profondità di colore Esempio: immagine da stampare a 10x15 cm, risoluzione 300dpi, profondità di colore 24 bit piu’ di 6 Mb E’ necessario ridurre l’occupazione in memoria lavorando su risoluzione dimensione profondità di colore tecniche di compressione
Formati dei file grafici Tecniche di memorizzazione dei valori dei pixel: senza compressione: il numero dei valori memorizzati è M x N e non c'è nessun risparmio di spazio con compressione: il numero dei valori memorizzati è inferiore a M x N con un risparmio proporzionale al grado di compressione senza perdita di informazione (lossless) con perdita di informazione (lossy)
File non compressi Questi formati di file hanno richieste di elaborazione minima, non essendo necessari algoritmi di compressione (in fase di scrittura) e decompressione (in fase di lettura) Mancando di compressione, risultano particolarmente voluminosi, in termini di spazio occupato su disco (o altro dispositivo di memorizzazione) rispetto agli altri formati raw bmp La metodica RAW è per lo più utilizzata nelle macchine fotografiche Reflex digitali di alto livello, ma anche in quelle compatte di fascia alta
Bitmap Per ogni pixel sono indicati 3 byte, corrispondenti al rosso, al verde e al blu sono contenute altri informazioni necessarie per la corretta visualizzazione dell’immagine come numero di pixel in una riga, risoluzione spaziale, profondità di colore Dimensione file bitmap area * risoluzione grafica * profondità di bit esempio: un'immagine di dimensioni fisiche di 2,3 inch × 4,6 inch ha una risoluzione grafica di 150 dpi ed una profondità di colore RGB di 8 bit per canale cromatico. Quanta memoria occupa complessivamente? (5,3 × 4,6) × (150 × 150) × 3 = 1.645.650 byte = 1,57 Mb 8 bit per canale: RGB24. 256 × 256 × 256 = 224 = 16.777.216 colori complessivi 16 bit per canale: RGB48. 65536 × 65536 × 65536 = 248 colori complessivi
File compressi Le immagini salvate con un algoritmo di compressione dati lossless occupano meno spazio nei dispositivi di memorizzazione, mantenendo inalterata tutta l'informazione originale png gif La metodica RAW è per lo più utilizzata nelle macchine fotografiche Reflex digitali di alto livello, ma anche in quelle compatte di fascia alta
GIF e PNG Gif: formato sufficientemente leggero per poter essere trasferito in rete l’idea fu di estrarre per ogni immagine, dai 16 milioni di colori possibili, un sottoinsieme di 256 colori che meglio degli altri rappresentano i colori dell’immagine poiché l’immagine contiene solo 256 colori e’ facile avere sequenze di pixel simili in punti diversi dell’immagine e quindi e’ possibile comprimere i dati file di piccole dimensioni Png: non ha molte delle limitazioni tecniche del formato GIF può memorizzare immagini in colori reali (mentre il GIF era limitato a 256 colori) ha un canale dedicato per la trasparenza (canale alfa) Compressione senza perdita. Per disegni senza troppe sfumature supporta fino a 256 colori. Memorizza i dati in modo più efficiente
JPEG E’ il formato di compressione lossy più usato per la conservazione delle immagini l’idea è eliminare tutte le informazioni che il nostro cervello non è in grado di percepire si ottiene un’immagine contenuta in un file molto più leggero ma simile all’originale L’algoritmo è basato sullo studio della percezione umana rispetto agli stimoli visivi ed è adatto per la memorizzazione di fotografie e immagini realistiche se le memorizzassimo in bitmap avremmo dei file mastodontici In fase di salvataggio l’utente decide la qualità dell’immagine minore è la qualità dell’immagine più leggero è il file ma minori sono i dettagli presenti nell’immagine risultante Molti studi sul modo in cui percepiamo gli stimoli visivi, hanno evidenziato che non tutte le informazioni presenti in una immagine sono indispensabili, perchè molti dettagli non sono percepiti dal nostro cervello. Sono stati quindi definiti degli algoritmi di compressione delle informazioni presenti nelle immagini che, sulla base delle diverse sensibilità del nostro cervello, potessero eliminare le informazioni relative ad alcuni dettagli non percepiti. Eliminare questi dettagli non comporta alcuna perdita apparente di informazioni ma riduce la dimensione del file, Gli algoritmi di compressione che riducono le dimensioni dei file eliminando i dettagli scarsamente percepibili sono detti lossy. La compressione lossy porta ad una perdita di qualità: decomprimendo un file compresso la copia non è esattamente uguale all’originale; è peggiore ma in genere abbastanza simile. Questo perché tali algoritmi tendono a scartare le informazioni scarsamente percepibili.
Esempio la differenza tra un file memorizzato in formato lossy ed uno in formato lossless si evidenzia quando si effettuano degli zoom per visualizzare alcuni dettagli dell’immagine l’algoritmo jpeg non è ideale per comprimere immagini contenenti forti cambiamenti di colore (algoritmo poco idoneo a comprimere immagini poco realistiche) Agisce poco sulla luminosità, molto sul colore. Conserva la risoluzione cromatica
Il colore Le caratteristiche che si usano per distinguere un colore da un altro sono tonalità: e’ il colore “puro” saturazione: intensità di una specifica tonalità una tinta molto satura ha un colore vivido e squillante; al diminuire della saturazione, il colore diventa più debole e tende al grigio. Se la saturazione viene completamente annullata, il colore si trasforma in una tonalità di grigio luminosità: quantità totale di luce che una sorgente luminosa appare emettere incorpora la nozione acromatica di intensità è un attributo soggettivo, difficile da misurare alcune tinte sono implicitamente più luminose (brillanti) di altre La desaturazione di una fotografia digitalizzata è una delle tecniche con cui si può trasformare un'immagine a colori in una in bianco e nero La luminosità, soprattutto in fotografia, viene interpretata come concetto psicologico correlato alla percezione della luce emessa da un oggetto
Il colore
Spazio dei colori I colori possono essere ambientati in uno spazio colore che generalmente è uno spazio tridimensionale ogni colore è rappresentato da una terna di numeri XYZ Ci sono diverse rappresentazioni dello spazio colore RGB (red, green, blue) CMY (cian, magenta, yellow) HSL (hue, saturation, lightness) E’ possibile passare da una rappresentazione all’altra attraverso delle formule di conversione Lo scopo di un modello è quello di facilitare la specifica di un colore in un modo standard e condiviso.
Modello RGB Nel modello RGB, un colore è definito da 3 componenti che rappresentano i colori primari: rosso, verde e blu per convenienza, si normalizzano le componenti in modo da avere un cubo con componenti RGB appartenenti all’intervallo [0,1] per ogni pixel si indicano le quantità di rosso verde e blu che ne compongono il colore Sintesi additiva unendo i tre colori con la loro intensità massima si ottiene il bianco. La combinazione delle coppie di colori dà il cìano, il magenta e il giallo Un'immagine può essere scomposta, attraverso filtri o altre tecniche, in questi colori base che, miscelati tra loro, danno quasi tutto lo spettro dei colori visibili Sintesi additiva: il nostro cervello associa ad ogni punto un colore che e’ dato dalla somma di opportune quantità di rosso verde e blu. Questo e’ il sistema utilizzato anche nelle televisioni, nei monitor e nei proiettori: tutti i colori che vediamo quando emessi da questi strumenti sono rappresentati come un segnale composto dalla quantità di rosso, verde e blu. In formato digitale i colori sono generalmente rappresentati in formato RGB; le quantità di rosso verde e blu per ogni pixel sono definite da un valore compreso tra 0 e 255 (un byte) e quindi l’immagine risultante ha 24 bit di profondità.
Esempio RGB
Modello CMY Il modello CMY (Cyan, Magenta, Yellow), è tipicamente usato nelle stampanti poiché la carta è bianca e quindi si sottrae dal bianco piuttosto che aggiungere al nero come nel modello RGB Sintesi sottrattiva del colore I colori CMY sono complementari ai colori RGB il ciano (C) assorbe l’illuminazione rossa il magenta (M) assorbe il verde il giallo (Y) assorbe il blu il K (quando specificato), indica l’intensità del nero La stampa del colore viene fatta sovrapponendo inchiostro colorato sulla carta bianca, che non emette ma riflette la luce (bianca) incidente La sintesi sottrattiva di due stimoli di colore: mescolanza di stimoli di colore che giungono modificati all'occhio. L'esempio classico è quello della sovrapposizione di due inchiostri, per esempio inchiostro giallo sovrapposto ad inchiostro ciano, su un foglio bianco. In questo caso i due strati di inchiostro si comportano come filtri per la luce. L'inchiostro giallo assorbe una parte della luce. La parte rimanente attraversa l'inchiostro ciano che ne assorbe un'altra parte. La parte rimanente viene riflessa dalla carta bianca e costituisce lo stimolo di colore che arriva al nostro occhio.
Esempio CMYK
Modello HSB HSB (Hue Saturation Brightness ) o HSV (Hue Saturation Value ) rispecchia la modalità di percezione umana Ha tre parametri h: tonalità; indica il colore su una ruota di colori standard (tra 0° e 360°) s: saturazione; indica la purezza del colore ovvero la quantità di grigio rispetto alla tonalità (tra 0 e 100) b: luminosità; indica la chiarezza del colore (tra 0 e 100) Mentre RGB e CMY sono legati ai dispositivi di visualizzazione (i.e., monitor e stampanti), lo spazio HSL è legato alla percezione umana
Istogramma L’istogramma dell’immagine è la rappresentazione grafica della quantità di pixel per ogni livello di grigio presente nell’immagine l’asse orizzontale viene suddiviso in tante parti quanti sono i valori della profondità di colore dell’immagine l’asse verticale rappresenta il numero di pixel che hanno un particolare livello di grigio L’istogramma fornisce una raffigurazione sintetica del contenuto cromatico o di luminosità dell’immagine si perde l’informazione relativa alla posizione spaziale dei pixel Nelle immagini a colori si possono generare 3 istogrammi separati dipendono da come viene rappresentato il colore, es. RGB
Istogramma L’istogramma fornisce informazione sulla dinamica dell’immagine (estensione della gamma tonale) L’istogramma fornisce informazioni sulla gamma tonale (varietà di colori coinvolti nell’immagine) Problemi: gestione dinamica della luminosità, si cerca di tenere una luminosità che renda l’istogramma centrato sul valore medio dell’istogramma (per evitare le sovraesposizioni) Ma se sto fotografando paesaggi nevosi mi ritrovo con immagini scure Posso cambiare la LUT
Riferimenti http://www.ncsu.edu/scivis/lessons/colormodels/color_models2.html http://it.wikipedia.org/wiki/Grafica_raster http://it.wikipedia.org/wiki/Grafica_vettoriale http://it.wikipedia.org/wiki/Spazio_dei_colori
Scala tonale E’ la quantità di colori visualizzabili In un’immagine a livelli di grigio (ldg) è l’insieme di tutti i livelli di grigio che la compongono In un’immagine a colori è l’insieme di tinte e sfumature