’’Campionamento e codifica di immagini e suoni’’

’’Campionamento e codifica di immagini e suoni’’
Concetto di continuo e discreto La codifica di immagini e suoni Conversione A/D e D/A di un segnale Campionamento, Quantizzazione e digitalizzazione  Il teorema di Shannon e la frequenza di campionamento Ricostruzione del segnale campionato: problemi di distorsione Teorema di Fourier e Spettro di un segnale

Funzionalità di un calcolatore

Il calcolatore: modello architetturale
1. Elaborazione Interconnessione 2. Memorizzazione 3. Comunicazione (interfaccia) Memoria Elettronica Magnetica Collegamenti (BUS/Cavi) Unità Centrale di Elaborazione Periferiche

Lo schema di riferimento

Organizzazione tipica di un calcolatore “bus oriented”
Unità di controllo Unità aritmetico logica (ALU) Registri CPU Terminale Unità disco Stampante Dispositivi di I/O CPU Memoria centrale Bus

Tre tipologie di istruzioni
Istruzioni aritmetico-logiche (Elaborazione dati) Somma, Sottrazione, Divisione, … And, Or, Xor, … Maggiore, Minore, Uguale, Minore o uguale, … Controllo del flusso delle istruzioni Sequenza Selezione semplice, a due vie, a n vie, … Ciclo a condizione iniziale, ciclo a condizione finale, … Trasferimento di informazione Trasferimento dati e istruzioni tra CPU e memoria Trasferimento dati e istruzioni tra CPU e dispositivi di ingresso/uscita (attraverso le relative interfacce)

Elementi di una CPU Unità di controllo
legge le istruzioni dalla memoria e ne determina il tipo. Unità aritmetico–logica esegue le operazioni necessarie per eseguire le istruzioni. Registri memoria ad alta velocità usata per risultati temporanei e informazioni di controllo; il valore massimo memorizzabile in un registro è determinato dalle dimensioni del registro; esistono registri di uso generico e registri specifici: Program Counter (PC) – qual è l’istruzione successiva; Instruction Register (IR) – istruzione in corso d’esecuzione; …

’’Codifica di immagini e suoni’’ - Campionamento
Concetto di continuo e discreto La codifica di immagini e suoni Conversione A/D e D/A di un segnale Campionamento, Quantizzazione e digitalizzazione  Il teorema di Shannon e la frequenza di campionamento Ricostruzione del segnale campionato: problemi di distorsione Teoremaa di Fourier e Spettro di un segnale

La codifica delle informazioni è discreta
I dati multimediali La realtà è continua La codifica delle informazioni è discreta Immagini Suoni

Acquisizione ed Elaborazione di Segnali
Segnale: variazione di una grandezza fisica (es. tensione) a cui è associata una informazione Il calcolatore memorizza ed elabora vari tipi di informazioni: numeri, testi, immagini, suoni, filmati, ecc. Occorre rappresentare tale informazione in formato facilmente manipolabile dall’elaboratore

Memoria e informazioni
ISTRUZIONI INFORMAZIONE REALI DATI NUMERICI INTERI NON NUMERICI CARATTERI Rappresentazione mediante opportuna codifica ALTRI

I dati multimediali DWG …….. ALTRI Immagini Vettori Mappa di bit
Filmati TIFF BMP JPEG GIF …….. Audio MPEG AVI …….. WAV MIDI …….. COMPRESSIONE DEI DATI

Acquisizione ed elaborazione delle immagini
Prima che fotografie e immagini possano essere elaborate sul computer, esse devono essere digitalizzate (espresse come numeri zero e uno) tramite un processo chiamato campionamento, quantizzazione e codifica La più piccola unità che compone un'immagine digitalizzata è chiamata pixel (abbreviazione di picture element). Un'immagine digitale è una collezione di pixel.

Pixel – Picture element
Le immagini vengono scomposte in griglie Le caselle di una griglia vengono chiamate pixel La risoluzione indica il numero di pixel in cui è suddivisa un’immagine pixel La rappresentazione di un’immagine mediante la codifica a pixel viene chiamata bitmap Un pixel rappresenta in realtà non soltanto un punto dell’immagine, ma piuttosto una regione quadrata coincidente con una cella della griglia Il valore associato al pixel rappresenta la intensità media nella cella

Esempio di digitalizzazione
Si deve stabilire una convenzione per ordinare i pixel della griglia; assumiamo che i pixel siano ordinati dal basso verso l’alto e da sinistra verso destra. La rappresentazione della figura è data dalla stringa binaria Come si può osservare la ricostruzione è un’approssimazione dell’immagine originaria.

Esempio di digitalizzazione
La rappresentazione sarà più fedele all’aumentare del numero dei pixel, ossia all’aumentare del numero di quadratini della griglia in cui è suddivisa l’immagine.

Codifica delle immagini
Assegnando un bit (1,0) ad ogni pixel è possibile codificare solo immagini in bianco e nero Per codificare le immagini con diversi livelli di grigio oppure a colori si usa la stessa tecnica: per ogni pixel viene assegnata una sequenza di bit Per memorizzare un pixel non è più sufficiente un solo bit Per esempio, se utilizziamo quattro bit possiamo rappresentare 24 = 16 livelli di grigio o 16 colori diversi Mentre con otto bit ne possiamo distinguere 28 = 256, ecc.

L’uso del colore Il colore può essere generato componendo 3 colori: red, green, blue (RGB) Ad ogni colore si associa una possibile sfumatura Usando 8 bit per ogni colore si possono ottenere 256 sfumature per il rosso, 256 per il blu e 256 per il verde che, combinate insieme, danno origine a circa 16,8 milioni di colori diversi (precisamente colori) Ogni pixel per essere memorizzato richiede 3 byte

Risoluzione Il numero di pixel presenti sullo schermo (righe x colonne) prende il nome di risoluzione Risoluzione tipiche sono 640 x x x pixel Esempio: Per distinguere 256 colori sono necessari otto bit per la codifica di ciascun pixel La codifica di un’immagine formata da 640 x 480 pixel richiederà 640 x 480 X8 = bit ( byte ca.300 kByte)

Effetti della variazione di definizione
Una stessa immagine può essere rappresentata con un numero differente di pixel, per esempio modificando le dimensioni dei pixel, a parità di dimensioni dell’immagine:

Grafica bitmap Le immagini codificate pixel per pixel sono dette immagini in grafica bitmap Le immagini bitmap occupano parecchio spazio Esistono delle tecniche di compressione che permettono di ridurre le dimensioni Ad esempio, se più punti vicini di un’immagine assumono lo stesso colore, si può memorizzare la codifica del colore una sola volta e poi ricordare per quante volte deve essere ripetuta I formati come GIF, JPEG e PNG sono formati compressi per le immagini I formati come Postscript e PDF per i documenti

DEFINIZIONE DEI COLORI
Sistema RGB Grigio scuro 30 Blu 255 Verde Rosso Nero Bianco Colori risultanti 3°byte blu 2° byte verde 1° byte

COMBINAZIONI DI COLORI
I componenti fondamentali possono essere il Rosso, Verde e Blu (Red, Green, Blue-> RGB) usati per: produrre luminosità, come nell’esempio sopra visto, dalla cui massima combinazione deriva il bianco (usato, ad esempio, per produrre il colore su monitor)

COMBINAZIONI DI COLORI
Oppure i componenti fondamentali possono essere il ciano magenta e giallo (CMY) usati per sottrarre luminosità, come nel caso della combinazione CMY (Cyan Magenta Yellow), dalla cui massima combinazione deriva il nero (usato, ad esempio, per produrre delle stampe su carta)

Profondità di colore Poiché si utilizzano 3 byte per rappresentare ogni pixel, queste immagini vengono definite a 24 bit Una immagine a colori di 100x100 pixel avrà bisogno di 100 x 100 x 3 byte = byte per essere rappresentata Il numero di punti, calcolato come Numero Colonne x Numero Righe, rappresenta la risoluzione di un’immagine (640x480) La risoluzione può venire espressa, però, anche in dpi (dot per inch) (es. 300 dpi)

Scala di grigi 1 canale 8 bit 256 toni di grigio 638 Kbyte B/N 1 canale 1 bit per canale b/n 81 kbyte Scala di colore 1 canale 8 bit 256 colori 638 Kb RGB 3 canali, 8 bit per canale (mil di col) 1870 Kb

Codifica di immagini in movimento
Un filmato è una sequenza di immagini statiche (dette fotogrammi o frame) Per codificare un filmato si “digitalizzano” i suoi fotogrammi Esempio: 30 immagini ad alta risoluzione (640X480X8) al secondo 30 immagini/sec x bit/imm. = bit/sec Un minuto richiederebbe 60 sec x = bit ( byte ca. 5.5 MByte) Compressione: MPEG (Moving Picture Expert Group), differenza tra fotogrammi Esempi di altri formati per il video: AVI, MOV,DivX

Video ed animazioni Per rappresentare una sequenza di immagini si possono memorizzare tutti i fotogrammi uno dietro l’altro. L’occhio umano ha la proprietà che quando un’immagine viene impressa sulla retina, viene mantenuta alcuni millisecondi prima di svanire. Se una serie di immagini viene proiettata alla velocità di 50 o più immagini/sec, l’occhio non si accorge che ciò che sta vedendo sono immagini discrete. La fluidità del moto e determinata dal numero di immagini diverse per secondo, mentre lo sfarfallio e determinato dal numero di volte per secondo in cui lo schermo e ridisegnato.

Video digitali Un video XGA( ) con 24 bit/pixel e 25 immagini/s va trasmesso a 472Mbps! E’ ovvio che la trasmissione in forma non compressa di materiale multimediale è del tutto fuori questione. Vanno studiate strategie per comprimere l’informazione a nostra disposizione.

Le immagini in Movimento
L’occhio umano ricostruisce l’informazione di movimento se riceve una successione sufficientemente rapida di immagini fisse Cinema: 24 fotogrammi/sec TV: 25 o 30 fotogrammi/sec Lo standard MPEG (Moving Picture Expert Group) è sostanzialmente la codifica di ciascun frame fisso, oltre alla codifica di suoni, attraverso tecniche di Compressione dei dati. senza compressione, 1 min. di filmato a 24 fotogrammi /sec occuperebbe 644MB

Esempi di compressione:
Per ridurre la quantità di informazioni del filmato, si può memorizzare il primo fotogramma e, a seguire, registrare solo le modifiche rispetto ai fotogrammi precedenti. E’ inoltre possibile comprimere le informazioni residue ignorando le variazioni di colore così piccole da non poter essere colte dall’occhio umano in un’immagine in movimento.

Compressione Compressione senza perdita (lossless)
Tali algoritmi sfruttano la ridondanza presente nei dati, rappresentando l’informazione multipla una sola volta ed indicando il numero di ripetizioni oppure tengono conto della frequenza statistica degli elementi dell’informazione. Esempio: il codice di huffman è il tipico codice completamente reversibile Compressione con perdita (lossy). I sistemi di codifica con perdita di informazione sono importanti, perché a volte accettare perdita di informazione può far guadagnare molto in termini di compressione. Esempi di formati di questo tipo sono JPEG, MPEG, MP3, ecc…

Formato JPEG (Joint Photographic Experts Group)
1° Salvataggio 2° Salvataggio 3° Salvataggio Si tratta di un formato detto “a perdita di dati”; esso parte dalla constatazione che l’occhio umano percepisce maggiormente una variazione di luminanza piuttosto che una variazione di crominanza. Ogni nuovo processo di compressione del file produce un deterioramento dell’immagine.

Codifica dei suoni Fisicamente un suono è rappresentato come un’onda che descrive la variazione della pressione dell’aria nel tempo (onda sonora) t Sull’asse delle ascisse viene rappresentato il tempo e sull’asse delle ordinate viene rappresentata la variazione di pressione corrispondente al suono stesso

Periodo di campionamento Tcamp
Codifica dei suoni Si effettuano dei campionamenti sull’onda (cioè si misura il valore del segnale a intervalli di tempo costanti ∆t ) e si codificano in forma digitale le informazione estratte da tali campionamenti t Periodo di campionamento Tcamp ∆t Quanto più frequentemente il valore di intensità del segnale viene campionato, tanto più precisa sarà la sua rappresentazione Il numero di campioni raccolti per ogni secondo definisce la frequenza di campionamento fCamp che si misura in Hertz (Hz)

Codifica dei suoni La sequenza dei valori numerici ottenuti dai campioni può essere facilmente codificata con sequenze di bit (quantizzazione) Una approssimazione! t La rappresentazione del segnale è tanto più precisa quanto maggiore è il numero di bit utilizzati per codificare l’informazione estratta in fase di campionamento

Codifica dei suoni (esempio)
Se volessimo codificare la musica di qualità CD dovremmo: Usare due registrazioni corrispondenti a due microfoni distinti Campionare il segnale musicale producendo campioni al secondo (44.1 KHz) Per ogni campione (che è un numero) si usano 16 bit per codificarlo Campionare a 16 bit vuol dire avere 216 valori da assegnare alla forma d’onda in quel punto (65356) Per cui, il numero di bit che sarebbero necessari per codificare ogni secondo è pari a: 2 x campioni x 16 bit/campione = bit ca.172 kByte Un brano di circa 3 minuti quindi occupa circa 35 MByte Per facilitare la trasmissione in rete di flussi multimediali (sia audio e che video) si ricorre ad algoritmi di compressione

Riassumendo: per digitalizzare un segnale.......
CAMPIONAMENTO: si estraggono ad intervalli regolari dei campioni del segnale. La frequenza con cui si estraggono i campioni è detta frequenza di campionamento (misurata in Hz). QUANTIZZAZIONE: si convertono i valori numerici che rappresentano le ampiezze del segnale (variabili in origine in un intervallo continuo) in un numero finito di valori. CODIFICA: Il segnale, dopo essere stato campionato e quantizzato, per poter essere utilizzato dall’elaboratore, deve ancora essere convertito in digitale, secondo un’opportuna codifica. (8 oppure 16 bit)

Segnali audio - Campionamento
Esiste una frequenza di campionamento (detta valore di Nyquist) che garantisce la ricostruzione fedele del segnale. Teorema Nyquist - Shannon : Il segnale può essere ricostruito completamente se è stato campionato ad una frequenza Fc maggiore del doppio della frequenza della componente del segnale di frequenza più alta fM (Fc >= 2 fM) Es. l’orecchio umano è in grado di percepire frequenze tra i 20Hz e i 22 KHz la frequenza di campionamento per l’audio (limite di Nyquist) si pone quindi attorno ai 44 KHz.

Larghezza di Banda La larghezza di banda (di una trasmissione, di un segnale o di un canale di comunicazione) è la velocità di trasmissione dell'informazione. Nel caso delle comunicazioni digitali la banda si misura direttamente in bit al secondo (kbit/s, Mbit/s ecc.), mentre per le comunicazioni analogiche la banda si misura in modo indiretto, ed è data dall'intervallo di frequenze occupato dal segnale: per esempio, una comunicazione telefonica analogica occupa le frequenze che vanno da 300 a 3400 Hz, quindi ha una banda di 3100 Hz (cioè ). L'intervallo di frequenze è strettamente correlato alla quantità di informazione che può fluire attraverso un canale, in base al teorema del campionamento di Nyquist-Shannon.

Banda di un canale e banda di un segnale
Per banda di un canale di comunicazione si intende la sua massima velocità di trasmissione, cioè la massima quantità di informazione che esso può trasmettere nell'unità di tempo (massima banda disponibile). Per banda di un segnale si intende invece la minima velocità di trasmissione necessaria perché possa essere trasmesso senza errori o distorsione (minima banda necessaria).

Il teorema del campionamento di Nyquist-Shannon (1949) definisce il minimo della frequenza di campionamento di un segnale, necessario per evitare distorsioni dello stesso. Dato un segnale, con larghezza di banda finita e nota, la frequenza minima di campionamento di tale segnale deve essere almeno il doppio della sua massima frequenza: Fc >= 2 fM Il campionamento è un passo del processo di conversione analogico-digitale di un segnale. Consiste nel prelievo di campioni (samples) da un segnale analogico e continuo nel tempo ogni t secondi. t è l'intervallo di campionamento, mentre Fc=1 / t è la frequenza di campionamento (es. 1 kHz  1/1.000 s = 1 ms)

Il risultato del campionamento è un segnale con valori discreti (segnale digitale)
Tale segnale sarà in seguito quantizzato e codificato per renderlo accessibile a qualsiasi elaboratore digitale. Il teorema del campionamento pone un vincolo per la progettazione di apparati di conversione analogico-digitale: se si ha a disposisione un campionatore che lavora a frequenza Fc , è necessario mandargli in ingresso un segnale a banda limitata da Fc /2. In generale un segnale analogico non è limitato in frequenza, ma dovrà essere filtrato per eliminare le componenti di frequenza maggiore di Fc /2, a tale scopo si usa un filtro anti-aliasing (filtro passa basso)

Effetto Aliasing Consiste in una sovrapposizione del segnale campionato che rende impossibile l'esatta ricostruzione del segnale originale e tale ricostruzione risulterà distorta. Per questo motivo ogni apparato di conversione analogico-digitale ha un filtro anti-alias (filtro passa basso) a monte del campionatore, che limita lo spettro del segnale di ingresso a Fc >= 2 fM

Simulazione di un Segnale sinusoidale a frequenza 27 Hz campionato con differenti frequenze di Campionamento (Sample) fc=37 fs fc=10,5 fs fc=1KHz fc=333 Hz fc=1,8 fs fc=50 Hz fc=110 Hz ..Un errato campionamento ha generato una frequenza differente da quella del segnale (freq. di aliasing)

Il teorema di Shannon-Nyquist e la frequenza di campionamento
Dato un segnale continuo e a banda limitata esso è descritto completamente dai suoi campioni, se essi sono presi ad una frequenza almeno doppia rispetto alla frequenza massima del segnale Es: Periodo T=37ms f segnale=1/(37 ms)= 27 Hz Volt ADC DAC 8 bit ? in clock t [MilliSecondi] f campionamento Sample Clock

Simulazione di un Segnale sinusoidale a frequenza 27 Hz campionato con differenti frequenze di Campionamento (Sample) fc=37 fs fc=10,5 fs fc=1KHz fc=333 Hz fc=1,8 fs fc=50 Hz fc=110 Hz ..Un errato campionamento ha generato una frequenza differente da quella del segnale (freq. di aliasing)

PRODUZIONE DEL SUONO L’orecchio umano riesce a udire suoni da 20 Hz a 20KHz con una sensibilità maggiore nell’intervallo tra 2 e 4 KHz (la voce umana varia da 500 Hz a 2KHz) Per il teorema di Shannon e Nyquist la frequenza di campionamento di un’onda sonora deve essere doppia rispetto alla massima frequenza da riprodurre per ottenere una conversione completa del segnale analogico Alla qualità audio CD la frequenza di campionamento è di 44.1 KHz (il doppio di KHz) Campionare a 16 bit vuol dire avere 216 valori da assegnare alla forma d’onda in quel punto (65356) Campionare a 8 bit vuol dire averne solo 256

PRODUZIONE DEL SUONO Per la voce un campionamento accettabile è di 8 bit a 22 KHz 10 sec di audio digitale stereo a Hz equivalgono a byte (1,68 Mb) per questo motivo in un Cd audio trovano posto solo circa 70 min di musica Formati audio: Wave (.wav) formato nativo di Microsoft Windows MP3 MPEG(Motion Picture Expert Group) layer 3 Usa un complesso algoritmo di compressione basato sulla fisiologia dell’orecchio (mascheramento) che riduce l’occupazione dei file da un minimo di 12 a1 fino ad un massimo di 96 a 1 Real Audio (Real Networks) formato per lo streaming audio/video AIFF utilizzato da Apple in QuickTime MIDI Codifica le note e gli strumenti che devono eseguirle Efficiente, ma solo musica, non voce, scarsa qualità del suono

Convertitori Analogici Digitali (ADC) e Digitali Analogici (DAC)

Dispositivi di codifica (ADC)
Suono onda di pressione dell’aria Microfono Converte il suono in segnale elettrico Cavo elettrico 1 Trasporta il segnale elettrico analogico fino al ADC Analog to Digital Converter Cavo elettrico 2 Trasporta il segnale elettrico digitale verso il computer Campionamento Quantizzazione Segnale analogico Segnale campionato Segnale digitale Analog to Digital Converter

Dispositivi di codifica (DAC)
Esiste anche il processo inverso, che trasforma l’informazione da digitale ad analogica. Nel caso del suono questo compito è svolto dal D.A.C. (Digital to Analog Converter) che trasforma il segnale digitale in segnale elettrico analogico; tale segnale viene successivamente trasformato in onda sonora dalle casse acustiche. Suono onda di pressione dell’aria Cavo elettrico 2 Trasporta il segnale elettrico analogico fino alla cassa Digital to Analog Converter Cavo elettrico 1 Trasporta il segnale elettrico digitale verso il DAC Cassa Acustica Trasforma il segnale elettrico analogico in suono

Spettro di un segnale fc >2 fs
Il campionamento introduce un aliasing: in pratica il campionamento provoca “duplicazioni” dello spettro del segnale. Se non si rispetta il teorema di Shannon l’aliasing introdotto dal campionamento impedisce la ricostruzione del segnale originale, in quanto due spettri adiacenti si sovrappongono! fc >2 fs ADC freq freq fs fs fc

Spettro di un segnale L’effetto di un errato campionamento, nell’ambito del dominio delle frequenze Per un buon funzionamento del campionatore e per evitare aliasing, si introduce un filtro passa basso che limita lo spettro del segnale di ingresso a fc >2 fs fc <2 fs ADC Filtro PB

Vmax / 2n : intervallo di quantizzazione
Conversione analogico - digitale - La qualità della conversione.. Segnale in forma numerica + errore di quantizzazione Vin ADC DAC 8 bit Segnale analogico ricostruito dal DAC Segnale analogico dal trasduttore 8 bit  28=256 livelli Esempio: Vin max=3 Volt => Risoluzione 3/256 = 0.01Volt Vin max=10Volt => Risoluzione 10/256 = 0.04Volt Vmax / 2n : intervallo di quantizzazione Dove n è il numero di bit del campionatore intervallo di quantizzazione Con risoluzione maggiore di 8 bit avremmo ottenuto un risultato affetto da minor errore!

Digitale  Analogico

Analogico  Digitale

Bitrate Nell’ambito multimediale il bitrate rappresenta la quantità di informazione che è memorizzata/trasmessa per unità di tempo. Tipicamente il bitrate è scelto in modo tale da ottimizzare due parametri contrastanti come la qualità del materiale multimediale e la quantità di banda occupata Audio (MP3) 32 kbit/s — MW (AM) qualità 96 kbit/s — FM qualità Video (MPEG2) 16 kbit/s — Videochiamata 128 – 384 kbit/s — Videoconferenza 1 Mbit/s — VHS qualità 5 Mbit/s — DVD qualità 15 Mbit/s — HDTV qualità

Supporti digitali a tecnologia ottica
La scrittura e lettura di un supporto ottico si basa sulla tecnologia laser: Il disco è costituito di un materiale riflettente che presenta delle incisioni (zone opache) sulla sua superficie. Un raggio laser, attraverso un sistema di lenti, viene diversamente riflesso (zone incise o no). Tramite un prisma il raggio riflesso viene deviato su una cellula fotoelettrica che rileva il fascio e produce una sequenza di cifre binarie.

Compact Disk (CD) 650 MByte (si utilizza una sola faccia) Digital Versatile/Video Disk (DVD) 9 – 17 GByte (25 volte la capacità di un CD) Sono esteriormente simili (diametro 120 mm e spessore 12 mm)

Supporti digitali a tecnologia ottica (CD)
Compact Disk – Read Only Memory (CD - ROM) (scrivibile ma non riscrivibile) Compact Disk – Read Write (CD-RW) (riscrivibile n volte) Compact Disk – Audio (CD-Audio) (utilizzato per la musica)

Formati file audio (non compressi)
Wav Utilizzato su sistemi operativi Microsoft Windows. Valori consentiti: Frequenza di campionamento: 11KHz, 22 KHz o 44 KHz Livelli di quantizzazione: 8 bit o 16 bit Numero di canali: 1 o 2 (stereofonia) Queste informazioni sono contenute nel file, ma restano trasparenti all’utilizzatore. Dimensioni eccessive: milioni di bit per qualche minuto di musica!

Formati file audio (non compressi)
Au (Audio m-law) Utilizzato su sistemi operativi Sun Microsystem e Mac. Caratteristica principale: m-law encoding La scala dei livelli di quantizzazione sull’asse Y non è lineare ma logaritmica cioè sono utilizzati più livelli di quantizzazione per i segnali a basse frequenze e meno livelli per i segnali ad alte frequenze Approssima meglio l’onda del segnale audio Anche in questo caso: troppi bit per un file di musica!

Formati file audio (compressi)
Necessità di compressione per poter minimizzare lo spazio e favorire la distribuzione di musica su Internet MPEG (Moving Picture Experts Group) si occupa di sviluppo di algoritmi di compressione di file audio e video Sistemi di compressione di tipo percettivo: si fa riferimento alla percezione umana del suono e si eliminano le informazioni inerenti a quella parte di segnale che l’uomo non è in grado di percepire. Sono compressioni di tipo lossy cioè il file decompresso non è identico all’originale (perdita di informazioni).

Formati file audio (compressi)
MPEG Audio: nome che indica tutti gli algoritmi di compressione di file audio Tre livelli di compressione : Layer I Layer II Layer III comunemente riconosciuto come MP3 Ogni livello corrisponde ad una diversa qualità di riproduzione audio: maggiore qualità maggiore complessità ed efficacia dell’algoritmo

MP3 Algoritmo di tipo lossy e source encoding (o percettivo): non tanto una ricostruzione fedele del segnale ma una ricostruzione quanto più simile all’originale, anche con forme d’onda diverse . MP3 tende a ridurre il numero di bit di codifica dei campioni (meno di 16 bit) piuttosto che la frequenza di campionamento.

MP3 Possibili scelte: Bassa compressione ed alta qualità
(192K – 300K bit per secondo) Media compressione e media qualità (128K bit per secondo) 12 ore di musica su CD Alta compressione e bassa qualità (16k bit per secondo)

Pulse Code Modulation Campionamento (Hz) Bit Mono/Stereo Occupazione Kb/s / / / / / / / /172

Spettro di un segnale e l’analisi armonica di Fourier
Sviluppo di funzione periodica in serie di FOURIER: Il teorema di Fourier afferma che una qualsiasi funzione periodica può essere ottenuta sommando un certo numero di funzioni sinusoidali di opportuna ampiezza, frequenza e fase. ( fondamentale + armoniche) Ad esempio un’onda quadra può essere scomposta in una sommatoria che coinvolge una sinusoide (fondamentale) alla stessa frequenza del segnale e tutte le armoniche dispari di ampiezze decrescenti

Video - MPEG Lo standard MPEG video ente che sviluppa MP3 (Moving Picture Experts Group) . versioni: MPEG MPEG MPEG

Video – Compressione La compensazione del moto è la principale tecnica di compressione dello standard MPEG. Sfrutta le somiglianze esistenti tra frame successivi (ridondanza temporale) trova per ogni macroblocco la sua migliore definione (best match) nel frame di riferimento

Video – MPEG 1 La compressione è effettuata rimuovendo:
Ridondanza spaziale compressione dei singoli fotogrammi (JPEG) Ridondanza temporale: compressione che sfrutta le relazioni tra i diversi fotogrammi, per rimuovere informazioni ridondanti qualità del filmato paragonabile a quella di un videoregistratore VHS.

Video – MPEG 2 E’ scalabile: prevede diversi profili con diverse qualità adatti ad applicazioni differenti e diversi livelli di compressione per ciascun profilo. Offre la possibilità di gestire differenti aspect-ratio (tra cui il 16:9 WideScreen) E’ adatto alla trasmissione streaming. Mantiene informazioni sull’origine del materiale video

Video – MPEG 4 Introduce il concetto di VOP (Video Object Planes), in cui ogni parte della sequenza video di ingresso viene divisa in un numero di regioni con immagini di forma arbitraria. Il singolo oggetto audiovisivo può essere sia sintetico che naturale. Ogni oggetto può essere manipolato dall'utente in ogni sua caratteristica La codifica di ogni oggetto riporta le sue caratteristiche essenziali

Compressione Huffman Ideato nel 1952 dal matematico D.A. Huffman
Metodo di compressione senza perdita gli elementi che si ripetono frequentemente sono identificati da un codice breve,gli elementi rari nel file originale ricevono nel file compresso una codifica lunga è tanto più efficace quanto più ampie sono le differenze di frequenza degli elementi del file originale,

Compressione LZW è il risultato delle modifiche apportate nel 1984 da Terry Welch ai due algoritmi sviluppati nel 1977 e nel 1978 da Jacob Ziv e Abraham Lempel, permette di comprimere archivi di dati sfruttando la ricorsivita' delle stringhe relative alle informazioni in essi contenute. Viene creato un dizionario delle stringhe di simboli ricorrenti nel file, costruito in modo tale che ad ogni nuovo termine aggiunto al dizionario sia accoppiata in modo esclusivo un'unica stringa. Esiste un dizionario di partenza costituito dai 256 simboli

Con 25 immagini al secondo quanto costa trasmettere in digitale?
Video digitali Un’immagine ferma riprodotta a 20 immagini/s non mostrerà movimenti a scatti ma conterrà sfarfallio perché un’immagine decadrà dalla retina prima che appare la successiva. Un film con 20 immagini/sec, ciascuna riprodotta 4 volte di fila, non avrà sfarfallio, ma il moto apparirà discontinuo. Il problema si risolve se si trasmettono 25 immagini/s e vengono poi riprodotte due volte. Con 25 immagini al secondo quanto costa trasmettere in digitale?

(Moving Picture expert Group)
MPEG Audio (Moving Picture expert Group) Attualmente lo standard, senza compressione, per le registrazioni audio prevede campioni di 16 bit ( “sfumature”) registrati ad una frequenza di 44,1 kHz. Per gestire un secondo di audio di qualità sono necessari circa 1400 Kbit/s! Una minore profondità del campione (8 bit invece di 16) comporta una perdita in termini di dinamica; una riduzione della frequenza di campionamento comporta una perdita nella risoluzione. L’utilizzo della compressione MPEG consente di ridurre a un dodicesimo l’occupazione di memoria dei campioni audio. Essa non intacca né la risoluzione né la dinamica.

Elementi di psicoacustica
Se si emette un suono ad una determinata frequenza, con una certa energia, l’udito non sarà capace di percepire le frequenze immediatamente prossime anche se queste hanno volumi (cioè energia) appena inferiori. Questo fenomeno è noto con il nome di mascheramento

Algoritmo di compressione
La compressione si ottiene effettuando la trasformata veloce di fourier sul segnale audio. Lo spettro viene diviso in 32 bande di frequenza ognuna delle quali viene elaborata separatamente. Quando sono presenti due canali stereo, viene anche sfruttata la ridondanza inerente nell’avere due sorgenti audio altamente sovrapponibili. L’audio MPEG può comprimere un CD di rock’n roll fino a 128 kbps senza alcuna perdita di qualità percettibile. Per un concerto di pianoforte sono necessari almeno 196 kbps.

Risoluzione di un’immagine
Ogni periferica (stampante, scanner, schermo…) che riceve e riproduce immagini ha una specifica risoluzione Risoluzione di 20 dpi La risoluzione spaziale è il più piccolo dettaglio distinguibile in una immagine: il rapporto tra dimensione dell’immagine e numero di punti che utilizziamo per descriverla si chiama risoluzione e si misura in dpi (dots per inch, punti per pollice). 160 dpi 160 dpi 72 dpi 160 dpi

Rappresentazioni di immagini più complesse
Si codificano i toni di grigio Si associa una codifica di un tono di grigio ad ogni pixel Le immagini a scale di grigio contengono sfumature ma non colori (solo bianco, nero e grigio). Una fotografia in bianco e nero è un'immagine a scale di grigio.

Immagini Vettoriali Un'altra forma di grafica su computer viene chiamata grafica vettoriale e si basa su formule numeriche. E’ possibile individuare la presenza di strutture elementari di natura più complessa, quali linee, circonferenze, archi, ecc. Quando si inviano immagini vettoriali al monitor o alla stampante, queste vengono convertite in pixel in base alla dimensione dell'immagine in output.

Immagini a colori Definizione dei colori: in ogni punto, per rappresentare un qualsiasi colore dello spettro, è sufficiente definire l’intensità dei tre colori fondamentali (per le immagini a video). Il numero di bit utilizzati per rappresentare il colore di un singolo pixel si chiama PROFONDITA’ DEL COLORE. Disponendo di un byte per ogni colore fondamentale, potremo rappresentare 256*256*256 = colori. 2 bit 4 bit 8 bit 24 bit

Immagini a colori Quindi anche le immagini a colori possono essere memorizzate in forma numerica (digitale) suddividendole in milioni di punti, per ognuno dei quali si definisce il colore in termini numerici. La qualità di un’immagine dipende dal numero di punti (risoluzione) in cui viene suddivisa e dai toni di colore permessi dalla codifica. Le immagini bitmap vengono quindi memorizzate come una lunga sequenza di bit il cui significato dipende dalla particolare codifica adottata.

Bitmap e risoluzione Il formato di rappresentazione per punti che abbiamo visto è definito BITMAP (o RASTER). E’ particolarmente adatta per riprodurre, fotografie, dipinti e tutte le immagini per le quali ogni punto dell’immagine è significativo e deve essere descritto da un singolo elemento indipendente. Nel caso in cui una immagine sia destinata alla stampa la risoluzione richiesta è di di 300 dpi. Lo standard usato per il video è di 72 dpi.

Immagini vettoriali In tale formato è presente tutta l’informazione necessaria a riprodurre l’immagine, a prescindere dalle dimensioni, pertanto si elimina il problema legato al rapporto tra risoluzione e definizione (per ingrandire o ridurre la riproduzione basta agire sul sistema di coordinate). Evidentemente non si presterà per rappresentare immagini composte da continue variazioni di colore, quali ad esempio le fotografie. Esso si utilizza per immagini più simili a disegni che a fotografie, è possibile definire la figura in termini matematici

Mascheramento Mascheramento generato da un tono ad 1 kHz a 60 dB.
Si è osservato che il mascheramento copre un range di 100Hz per frequenze inferiori ai 500 Hz, ma cresce velocemente per frequenze oltre i 500Hz. Persistenza del mascheramento: l’energia del tono mascherante non decade immediatamente, ma ha la persistenza di qualche millisecondo.

SAMPLE AND HOLD Il Sample and Hold nasce dall’esigenza di campionare il segnale analogico e provvedere a mantenerlo per tutto il tempo della conversione in digitale. Il circuito che realizza tale operazione è costituito da un interruttore e un condensatore.

S/H = 0 T chiuso Campionamento del segnale Vi=V-=V+=v(t)
S/H = 1 T aperto Mantenimento del valore v(t) Il 2° A.O. fa scaricare lentamente il condensatore durante la fase di Hold

S/H basso BJT interdetto
T chiuso S/H alto BJT conduce T aperto

La conversione A/D fa corrispondere a ogni campo di valori analogici un dato numerico.
Solo per il valore analogico al centro del campo la conversione è esatta. Q=Ax-A* Q= errore di quantizzazione; Ax=grandezza da convertire

Sull’asse delle ascisse è riportata la tensione analogica d’ingresso mentre sull’asse delle ordinate è riportato il codice generato in uscita Q(1/2).LSB ADC 4 bit

Q varia linearmente all’interno di ogni intervallo: è massimo alle due estremità e nullo al centro
Andamento dell’errore assoluto in funzione della grandezza analogica.

Conversione A/D a 8 bit Ad esempio al terzo “colpo di clock” del campionatore, viene estratto un campione pari a 2,6 Volt, che nel blocco successivo viene associato al codice Si noti l’errore di quantizzazione effettuato!

Compressione Huffman Albero di Huffman - alla base gli elementi più rari - elementi frequenti vicini alla radice - il codice ident. di ogni elemento è, partendo dalla radice, 0 se si va verso il figlio di sinistra e 1 se si va verso quello di destra - es..: b=01

’’Campionamento e codifica di immagini e suoni’’

Presentazioni simili

Presentazione sul tema: "’’Campionamento e codifica di immagini e suoni’’"— Transcript della presentazione:

Presentazioni simili

Sul progetto

Feed-back

Entrare

Autorizzarsi attraverso i social network:

’’Campionamento e codifica di immagini e suoni’’

Presentazioni simili

Presentazione sul tema: "’’Campionamento e codifica di immagini e suoni’’"— Transcript della presentazione:

Presentazioni simili

Sul progetto

Feed-back