Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra tecnologia e applicazioni
Che cosa si comunica? Informazione
Figura 1 – La trasmissione Mezzo Trasmissivo D Figura 1 – La trasmissione
Informazione e segnali Introduciamo un concetto molto importante per l’informatica delle comunicazioni: il concetto di segnale Il segnale come ciò che percorre il mezzo trasmissivo trasportando con sé l’informazione
I segnali e la matematica Un segnale può essere descritto come una funzione matematica che si evolve, ovvero varia, nel tempo. Formalmente: X=X(t) Rappresentazione di un segnale Grandezza misurata Tempo
Il teorema di Shannon e l’approssimazione la natura dell’informazione è inerentemente discreta Claude Elwood Shannon (1916 -2001) approssimare significa “rendere vicino” Approssimare è un’operazione che facciamo quotidianamente
Granularità o passo È la dimensione della approssimazione e rappresenta la grandezza sotto la quale non distinguiamo le differenze in una valutazione.
Si estraggono parti di informazione, che si definiscono campioni Il campionamento Si estraggono parti di informazione, che si definiscono campioni e che sono “esponenti rappresentativi” dell’informazione nel suo complesso, e che attraverso il teorema di Shannon possono condurre a ricostruire precisamente l’informazione complessiva
Caratteristiche del suono Il suono è caratterizzato da tre elementi o caratteristiche fisiche: altezza intensità timbro
Il trasduttore S D Mezzo trasmissivo Il trasduttore, come fa intuire la parola, è qualcosa che trasforma. T Mezzo trasmissivo T S D
La rappresentazione del suono X=X(t) ci descrive com’è fatto il suono e come varia nel tempo, rendendo ragione delle tre caratteristiche: altezza, intensità e timbro. Ma non solo, ci permette perfino di riportare in un grafico la “forma” del suono
Il campionamento dell’audio Il campionamento consiste nell’estrarre valori della funzione di “tanto in tanto” I valori estratti si definiscono campioni
La quantizzazione Le onde sonore possono assumere infiniti valori Dobbiamo trattare con insiemi infiniti di variabilità dei valori Questa cosa non è “buona” La quantizzazione è il procedimento per trasformare l’insieme infinito di valori, che possono assumere i campioni, in un insieme finito, ma sempre rappresentativo La quantizzazione è in sostanza un’approssimazione Il procedimento di quantizzazione consiste nel definire in anticipo un insieme di valori accettabili Il procedimendo del campionamento consiste nell’associare al valore reale della funzione il valore più vicino definito nella quantizzazione
Quantizzazioni e audio digitale Il numero dei livelli dell’audio digitale è espresso con un numero di bit. Si hanno quantizzazioni a 8, 16, 24, 32 bit. 8 bit Campionamento poco accurato 16 bit Fornisce la qualità tipica dei CD 24 bit È lo stato dell’arte Ad esempio, la quantizzazione a 8 bit possiede 256 livelli possibili.
Elementi tecnici del campionamento Chi effettua tecnologicamente queste operazioni? I convertitori Convertitori analogico digitali o ADC (Analogic to Digital Coverter) ADC e PC La più tipica di queste scatole nere è la scheda audio del computer. Essa si incarica della comunicazione di audio dal PC verso il mondo esterno e dal mondo esterno verso il PC. È dotata di ingressi e uscite alle quali è possibile collegare dei dispostivi esterni. Questi dispositivi esterni possono essere casse acustiche, microfoni, registratori, impianti stereo, uscite audio della televisione, ecc. I nostri ADC sono “scatole nere” che ricevono in ingresso un segnale analogico e danno in uscita un flusso di bit.
Il formato Questa struttura si chiama formato elaborato memorizzato Nello schema della digitalizzazione abbiamo un flusso di bit in uscita da un ADC. Il flusso dev’essere: elaborato memorizzato trasmesso dal sistema che lo riceve. Per fare questo il sistema deve dare una struttura logica ordinata a questo flusso. Questa struttura si chiama formato
I formati applicativi comuni I formati più comuni sono: il formato Wave (estensione dei file .wav), tipico degli ambienti Windows il formato Aiff tipico degli ambienti Apple il formato au tipico degli ambienti Unix o multipiattaforma. L’operazione che trasforma il flusso di bit in uscita dall’ADC in un formato è detta codifica. La codifica è responsabile delle caratteristiche: fisiche acustiche tecnologiche del segnale audio.
La compressione – Perché? Il grande problema dell’audio digitale è la dimensione del segnale digitale I formati che abbiamo appena visto non si preoccupano della dimensione del segnale, ma si occupano solamente di come rappresentarlo Per questa ragione sono state studiate delle tecniche mirate a ridurre le dimensioni dell’audio codificato. Un brano in formato CD Audio di 5 minuti di musica occupa uno spazio spropositato sull’hard disk: oltre 423 Mb (MegaByte).
Le tre fasi della compressione Attraverso considerazioni di psico-acustica, si eliminano tutte le componenti presenti nel suono che l’orecchio umano non percepisce. Attraverso considerazioni di fisica acustica, si applicano dei filtri che ripuliscono il segnale da tutto quello che c’è “in più”. Attraverso il procedimento detto codifica di Huffman, si eliminano le altre frequenze non udibili. Questi tre passaggi sono noti come codifica audio MPEG e definiscono i tre livelli di compressione crescenti noti con il nome di MPEG1 Layer-1 MPEG1 Layer-2 MPEG1 Layer-3 o MP3
La forza dell’MP3 Con un codificatore MP3 si arriva ad avere una compressione in grado di far risparmiare fino a 13 volte in termini di dimensione in bit. 5 minuti di suono digitale stereofonico compresso in MP3 occupano “solamente” da 4.1 a 4.4 MByte
Da video analogico a video digitale Campionamento Quantizzazzione Codifica Compressione
Campionamento
Parole chiave La dimensione della griglia si definisce risoluzione I quadratini della griglia sono detti pixel, ovvero picture elements DPI = Dot Per Inch
Quantizzazione L’insieme dei colori dei singoli pixel e delle rispettive tonalità è un insieme teoricamente infinito. L’occhio umano non è in grado di percepire tutte le possibili sfumature di colore Ogni singolo colore è rappresentato da tre numeri: {r,g,b} Le terne variano da {0,0,0} (nero) a {255,255,255} (bianco)
Codifica di immagini statiche È molto diverso elaborare un’informazione statica (immagini, foto) o una dinamica (filmati o animazioni). La codifica di un’immagine statica, realizzata effettuando la memorizzazione dei valori delle componenti cromatiche che rappresentano i singoli pixel, è chiamata bitmap o raster
Compressione Compressione senza perdita Compressione con perdita Nella compressione con perdita è necessaria l’approssimazione Esempi di formati di compressione Gif (Graphic Interchange Format) Jpeg (Joint Photographic Expert Group ) Png (Portable Network Graphics) Tiff (Tagged Image File Format) Bmp (Basic Multilingual Plane) Tipologia delle applicazioni Grafica pubblicitaria Grafica aziendale Fotoritocco Architettura Edilizia Progetto di componenti meccaniche Progetto di componenti elettroniche Ecc
La codifica di immagini dinamiche L’evoluzione nel tempo dell’immagine televisiva è una sequenza frame Ogni frame è suddiviso in linee Il frame è costituito da due field: field pari field dispari Si parla di video interallacciato
Sistemi di codifica YUV (o YCbCr) nel sistema PAL YIQ nel sistema NTSC Si codificano i singoli field
Flusso dati un segnale televisivo PAL richiede un flusso dati di 200 Mbps un segnale televisivo NTSC richiede un flusso dati di 165 Mbps un segnale televisivo ad alta definizione richiede circa 1 Gbps
Compressione di immagini dinamiche Nel video è presente informazione non percepibile Si procede a eliminare informazioni senza perdere in qualità, sfruttando il fatto che l’occhio umano è più sensibile alla luminanza che alla crominanza. La tecnica usata è la decimazione: viene memorizzata una informazione di crominanza ogni due pixel, oppure ogni quattro oppure ogni otto ecc.
La compressione MPEG Il Motion Picture Export Group fu inventato da Leonardo Chiariglione, ingegnere nato a Borgionera di Villar Dora Definisce standard per: la compressione dati video la compressione dati audio la sincronizzazione audio-video
Tipi di MPEG MPEG-1: bitrate massimo 1.5 Mbit/s MPEG-2: bitrate massimo 16 Mbps MPEG-3: Rollback in MPEG-2 MPEG-4: progettato per la trasmissione video su rete MPEG-7: progettato per la codifica audiovisiva in relazione al contenuto semantico
La compressione DivX capacità di trasmettere informazioni con basso bitrate, ma con qualità elevata Normalmente un film su DVD utilizza lo standard MPEG-2 e occupa fino a 7 Gbyte (normalmente) Utilizzando il formato DivX occupa circa 1 Gbyte al massimo
Formato DV Digital video Panasonic, Sony, Jvc e Philips È uno standard per la registrazione di video digitale di alta qualità. Bitrate 25mbps Formato dv50 con bitrate 50 mbps. È utilizzato nel campo del video professionale e le moderne telecamere funzionano con questo standard
Codifica e decodifica: il CODEC È il cuore della compressione COmpressor/DECompressor È l’algoritmo con cui si selezionano le informazioni da scartare e quelle da tenere
Caratteristiche applicative dei processi di codifica Il processo di codifica richiede molto tempo a disposizione e sistemi di elaborazione molto potente. Hardware dedicato Lunghi tempi di elaborazione Poco adatto alle operazioni “a casa” N.B. Bisogna aggiungere che quest’ultima affermazione si sta leggermente modificando, grazie all’introduzione di processori sempre più veloci.