La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Campionamento e codifica di immagini e suoni Concetto di continuo e discreto La codifica di immagini e suoni Conversione A/D e D/A di un segnale Campionamento,

Presentazioni simili


Presentazione sul tema: "Campionamento e codifica di immagini e suoni Concetto di continuo e discreto La codifica di immagini e suoni Conversione A/D e D/A di un segnale Campionamento,"— Transcript della presentazione:

1

2 Campionamento e codifica di immagini e suoni Concetto di continuo e discreto La codifica di immagini e suoni Conversione A/D e D/A di un segnale Campionamento, Quantizzazione e digitalizzazione Il teorema di Shannon e la frequenza di campionamento Ricostruzione del segnale campionato: problemi di distorsione Teorema di Fourier e Spettro di un segnale

3 Funzionalità di un calcolatore

4 1. Elaborazione Interconnessione 2. Memorizzazione 3. Comunicazione (interfaccia) Unità Centrale di Elaborazione Memoria Elettronica Memoria Magnetica Il calcolatore: modello architetturale Periferiche Collegamenti (BUS/Cavi)

5 Lo schema di riferimento

6 Organizzazione tipica di un calcolatore bus oriented CPU Memoria centrale Bus Unità di controllo Unità aritmetico logica (ALU) Registri CPU Terminale Unità disco Stampante Dispositivi di I/O

7 Tre tipologie di istruzioni Istruzioni aritmetico-logiche (Elaborazione dati) –Somma, Sottrazione, Divisione, … –And, Or, Xor, … –Maggiore, Minore, Uguale, Minore o uguale, … Controllo del flusso delle istruzioni –Sequenza –Selezione semplice, a due vie, a n vie, … –Ciclo a condizione iniziale, ciclo a condizione finale, … Trasferimento di informazione –Trasferimento dati e istruzioni tra CPU e memoria –Trasferimento dati e istruzioni tra CPU e dispositivi di ingresso/uscita (attraverso le relative interfacce)

8 Elementi di una CPU Unità di controllo –legge le istruzioni dalla memoria e ne determina il tipo. Unità aritmetico–logica –esegue le operazioni necessarie per eseguire le istruzioni. Registri –memoria ad alta velocità usata per risultati temporanei e informazioni di controllo; –il valore massimo memorizzabile in un registro è determinato dalle dimensioni del registro; –esistono registri di uso generico e registri specifici: Program Counter (PC) – qual è listruzione successiva; Instruction Register (IR) – istruzione in corso desecuzione; …

9 Codifica di immagini e suoni - Campionamento Concetto di continuo e discreto La codifica di immagini e suoni Conversione A/D e D/A di un segnale Campionamento, Quantizzazione e digitalizzazione Il teorema di Shannon e la frequenza di campionamento Ricostruzione del segnale campionato: problemi di distorsione Teoremaa di Fourier e Spettro di un segnale

10 I dati multimediali La realtà è continua La codifica delle informazioni è discreta Immagini Suoni

11 Acquisizione ed Elaborazione di Segnali Il calcolatore memorizza ed elabora vari tipi di informazioni: numeri, testi, immagini, suoni, filmati, ecc. Occorre rappresentare tale informazione in formato facilmente manipolabile dallelaboratore Segnale: variazione di una grandezza fisica (es. tensione) a cui è associata una informazione

12 Memoria e informazioni INFORMAZIONE ISTRUZIONI DATI NUMERICI INTERI REALI NON NUMERICI CARATTERI ALTRI Rappresentazione mediante opportuna codifica

13 I dati multimediali ALTRIImmagini Audio Filmati Mappa di bit Vettori TIFF BMP JPEG GIF …….. MPEG AVI …….. WAV MIDI …….. COMPRESSIONE DEI DATI DWG ……..

14

15 Prima che fotografie e immagini possano essere elaborate sul computer, esse devono essere digitalizzate (espresse come numeri zero e uno) tramite un processo chiamato campionamento, quantizzazione e codifica Acquisizione ed elaborazione delle immagini La più piccola unità che compone un'immagine digitalizzata è chiamata pixel (abbreviazione di picture element). Un'immagine digitale è una collezione di pixel.

16 Pixel – Picture element Le immagini vengono scomposte in griglie Le caselle di una griglia vengono chiamate pixel La risoluzione indica il numero di pixel in cui è suddivisa unimmagine pixel La rappresentazione di unimmagine mediante la codifica a pixel viene chiamata bitmap Un pixel rappresenta in realtà non soltanto un punto dellimmagine, ma piuttosto una regione quadrata coincidente con una cella della griglia Il valore associato al pixel rappresenta la intensità media nella cella

17 Esempio di digitalizzazione Si deve stabilire una convenzione per ordinare i pixel della griglia; assumiamo che i pixel siano ordinati dal basso verso lalto e da sinistra verso destra. La rappresentazione della figura è data dalla stringa binaria Come si può osservare la ricostruzione è unapprossimazione dellimmagine originaria.

18 Esempio di digitalizzazione La rappresentazione sarà più fedele allaumentare del numero dei pixel, ossia allaumentare del numero di quadratini della griglia in cui è suddivisa limmagine.

19 Codifica delle immagini Assegnando un bit (1,0) ad ogni pixel è possibile codificare solo immagini in bianco e nero Per codificare le immagini con diversi livelli di grigio oppure a colori si usa la stessa tecnica: per ogni pixel viene assegnata una sequenza di bit Per memorizzare un pixel non è più sufficiente un solo bit –Per esempio, se utilizziamo quattro bit possiamo rappresentare 2 4 = 16 livelli di grigio o 16 colori diversi –Mentre con otto bit ne possiamo distinguere 2 8 = 256, ecc.

20 Luso del colore Il colore può essere generato componendo 3 colori: red, green, blue (RGB) Ad ogni colore si associa una possibile sfumatura Usando 8 bit per ogni colore si possono ottenere 256 sfumature per il rosso, 256 per il blu e 256 per il verde che, combinate insieme, danno origine a circa 16,8 milioni di colori diversi (precisamente colori) Ogni pixel per essere memorizzato richiede 3 byte

21 Risoluzione Il numero di pixel presenti sullo schermo (righe x colonne) prende il nome di risoluzione Risoluzione tipiche sono 640 x x x 1024 pixel Esempio: –Per distinguere 256 colori sono necessari otto bit per la codifica di ciascun pixel –La codifica di unimmagine formata da 640 x 480 pixel richiederà 640 x 480 X8 = bit ( byte ca.300 kByte)

22 Effetti della variazione di definizione Una stessa immagine può essere rappresentata con un numero differente di pixel, per esempio modificando le dimensioni dei pixel, a parità di dimensioni dellimmagine:

23 Grafica bitmap Le immagini codificate pixel per pixel sono dette immagini in grafica bitmap –Le immagini bitmap occupano parecchio spazio Esistono delle tecniche di compressione che permettono di ridurre le dimensioni –Ad esempio, se più punti vicini di unimmagine assumono lo stesso colore, si può memorizzare la codifica del colore una sola volta e poi ricordare per quante volte deve essere ripetuta I formati come GIF, JPEG e PNG sono formati compressi per le immagini I formati come Postscript e PDF per i documenti

24 DEFINIZIONE DEI COLORI Grigio scuro 30 Blu25500 Verde02550 Rosso00255 Nero000 Bianco255 Colori risultanti 3°byte blu 2° byte verde 1° byte Rosso Sistema RGB

25 COMBINAZIONI DI COLORI I componenti fondamentali possono essere il Rosso, Verde e Blu (Red, Green, Blue-> RGB) usati per: produrre luminosità, come nellesempio sopra visto, dalla cui massima combinazione deriva il bianco (usato, ad esempio, per produrre il colore su monitor)

26 COMBINAZIONI DI COLORI Oppure i componenti fondamentali possono essere il ciano magenta e giallo (CMY) usati per sottrarre luminosità, come nel caso della combinazione CMY (Cyan Magenta Yellow), dalla cui massima combinazione deriva il nero (usato, ad esempio, per produrre delle stampe su carta)

27 Profondità di colore Poiché si utilizzano 3 byte per rappresentare ogni pixel, queste immagini vengono definite a 24 bit Una immagine a colori di 100x100 pixel avrà bisogno di 100 x 100 x 3 byte = byte per essere rappresentata Il numero di punti, calcolato come Numero Colonne x Numero Righe, rappresenta la risoluzione di unimmagine (640x480) La risoluzione può venire espressa, però, anche in dpi (dot per inch) (es. 300 dpi)

28 B/N 1 canale 1 bit per canale b/n 81 kbyte Scala di grigi 1 canale 8 bit 256 toni di grigio 638 Kbyte Scala di colore 1 canale 8 bit 256 colori 638 Kb RGB 3 canali, 8 bit per canale (mil di col) 1870 Kb

29 Codifica di immagini in movimento Un filmato è una sequenza di immagini statiche (dette fotogrammi o frame) Per codificare un filmato si digitalizzano i suoi fotogrammi Esempio: –30 immagini ad alta risoluzione (640X480X8) al secondo –30 immagini/sec x bit/imm. = bit/sec –Un minuto richiederebbe 60 sec x = bit ( byte ca. 5.5 MByte) Compressione: MPEG (Moving Picture Expert Group), differenza tra fotogrammi Esempi di altri formati per il video: AVI, MOV,DivX

30 Video ed animazioni Per rappresentare una sequenza di immagini si possono memorizzare tutti i fotogrammi uno dietro laltro. Locchio umano ha la proprietà che quando unimmagine viene impressa sulla retina, viene mantenuta alcuni millisecondi prima di svanire. Se una serie di immagini viene proiettata alla velocità di 50 o più immagini/sec, locchio non si accorge che ciò che sta vedendo sono immagini discrete. La fluidità del moto e determinata dal numero di immagini diverse per secondo, mentre lo sfarfallio e determinato dal numero di volte per secondo in cui lo schermo e ridisegnato.

31 Video digitali Un video XGA( ) con 24 bit/pixel e 25 immagini/s va trasmesso a 472Mbps! Vanno studiate strategie per comprimere linformazione a nostra disposizione. E ovvio che la trasmissione in forma non compressa di materiale multimediale è del tutto fuori questione.

32 Le immagini in Movimento Locchio umano ricostruisce linformazione di movimento se riceve una successione sufficientemente rapida di immagini fisse Cinema: 24 fotogrammi/sec TV: 25 o 30 fotogrammi/sec Lo standard MPEG (Moving Picture Expert Group) è sostanzialmente la codifica di ciascun frame fisso, oltre alla codifica di suoni, attraverso tecniche di Compressione dei dati. –senza compressione, 1 min. di filmato a 24 fotogrammi /sec occuperebbe 644MB

33 Per ridurre la quantità di informazioni del filmato, si può memorizzare il primo fotogramma e, a seguire, registrare solo le modifiche rispetto ai fotogrammi precedenti. E inoltre possibile comprimere le informazioni residue ignorando le variazioni di colore così piccole da non poter essere colte dallocchio umano in unimmagine in movimento. Compressione Esempi di compressione:

34 Compressione Compressione senza perdita (lossless) Compressione con perdita (lossy). Tali algoritmi sfruttano la ridondanza presente nei dati, rappresentando linformazione multipla una sola volta ed indicando il numero di ripetizioni oppure tengono conto della frequenza statistica degli elementi dellinformazione. Esempio: il codice di huffman è il tipico codice completamente reversibile I sistemi di codifica con perdita di informazione sono importanti, perché a volte accettare perdita di informazione può far guadagnare molto in termini di compressione. Esempi di formati di questo tipo sono JPEG, MPEG, MP3, ecc…

35 Formato JPEG (Joint Photographic Experts Group) Si tratta di un formato detto a perdita di dati; esso parte dalla constatazione che locchio umano percepisce maggiormente una variazione di luminanza piuttosto che una variazione di crominanza. Ogni nuovo processo di compressione del file produce un deterioramento dellimmagine. 1° Salvataggio 2° Salvataggio 3° Salvataggio

36 Codifica dei suoni Fisicamente un suono è rappresentato come unonda che descrive la variazione della pressione dellaria nel tempo (onda sonora) Sullasse delle ascisse viene rappresentato il tempo e sullasse delle ordinate viene rappresentata la variazione di pressione corrispondente al suono stesso t

37 Codifica dei suoni Si effettuano dei campionamenti sullonda (cioè si misura il valore del segnale a intervalli di tempo costanti t ) e si codificano in forma digitale le informazione estratte da tali campionamenti Quanto più frequentemente il valore di intensità del segnale viene campionato, tanto più precisa sarà la sua rappresentazione Il numero di campioni raccolti per ogni secondo definisce la frequenza di campionamento f Camp che si misura in Hertz (Hz) t t Periodo di campionamento T camp

38 Codifica dei suoni La sequenza dei valori numerici ottenuti dai campioni può essere facilmente codificata con sequenze di bit (quantizzazione) La rappresentazione del segnale è tanto più precisa quanto maggiore è il numero di bit utilizzati per codificare linformazione estratta in fase di campionamento Una approssimazione! t

39 Codifica dei suoni (esempio) Se volessimo codificare la musica di qualità CD dovremmo: –Usare due registrazioni corrispondenti a due microfoni distinti –Campionare il segnale musicale producendo campioni al secondo (44.1 KHz) –Per ogni campione (che è un numero) si usano 16 bit per codificarlo Campionare a 16 bit vuol dire avere 2 16 valori da assegnare alla forma donda in quel punto (65356) –Per cui, il numero di bit che sarebbero necessari per codificare ogni secondo è pari a: 2 x campioni x 16 bit/campione = bit ca.172 kByte Un brano di circa 3 minuti quindi occupa circa 35 MByte Per facilitare la trasmissione in rete di flussi multimediali (sia audio e che video) si ricorre ad algoritmi di compressione

40

41

42

43

44 Riassumendo: per digitalizzare un segnale CAMPIONAMENTO: si estraggono ad intervalli regolari dei campioni del segnale. La frequenza con cui si estraggono i campioni è detta frequenza di campionamento (misurata in Hz). QUANTIZZAZIONE: si convertono i valori numerici che rappresentano le ampiezze del segnale (variabili in origine in un intervallo continuo) in un numero finito di valori. CODIFICA: Il segnale, dopo essere stato campionato e quantizzato, per poter essere utilizzato dallelaboratore, deve ancora essere convertito in digitale, secondo unopportuna codifica. (8 oppure 16 bit)

45 Segnali audio - Campionamento Esiste una frequenza di campionamento (detta valore di Nyquist) che garantisce la ricostruzione fedele del segnale. Teorema Nyquist - Shannon : Il segnale può essere ricostruito completamente se è stato campionato ad una frequenza F c maggiore del doppio della frequenza della componente del segnale di frequenza più alta f M (F c >= 2 f M ) Es. lorecchio umano è in grado di percepire frequenze tra i 20Hz e i 22 KHz la frequenza di campionamento per laudio (limite di Nyquist) si pone quindi attorno ai 44 KHz.

46 La larghezza di banda (di una trasmissione, di un segnale o di un canale di comunicazione) è la velocità di trasmissione dell'informazione. Nel caso delle comunicazioni digitali la banda si misura direttamente in bit al secondo (kbit/s, Mbit/s ecc.), mentre per le comunicazioni analogiche la banda si misura in modo indiretto, ed è data dall'intervallo di frequenze occupato dal segnale: per esempio, una comunicazione telefonica analogica occupa le frequenze che vanno da 300 a 3400 Hz, quindi ha una banda di 3100 Hz (cioè ). L'intervallo di frequenze è strettamente correlato alla quantità di informazione che può fluire attraverso un canale, in base al teorema del campionamento di Nyquist-Shannon. Larghezza di Banda

47 Per banda di un canale di comunicazione si intende la sua massima velocità di trasmissione, cioè la massima quantità di informazione che esso può trasmettere nell'unità di tempo (massima banda disponibile). Per banda di un segnale si intende invece la minima velocità di trasmissione necessaria perché possa essere trasmesso senza errori o distorsione (minima banda necessaria). Banda di un canale e banda di un segnale

48 Il teorema del campionamento di Nyquist-Shannon (1949) definisce il minimo della frequenza di campionamento di un segnale, necessario per evitare distorsioni dello stesso. Dato un segnale, con larghezza di banda finita e nota, la frequenza minima di campionamento di tale segnale deve essere almeno il doppio della sua massima frequenza: F c >= 2 f M Il campionamento è un passo del processo di conversione analogico-digitale di un segnale. Consiste nel prelievo di campioni (samples) da un segnale analogico e continuo nel tempo ogni t secondi. t è l'intervallo di campionamento, mentre F c =1 / t è la frequenza di campionamento (es. 1 kHz 1/1.000 s = 1 ms)

49 Il risultato del campionamento è un segnale con valori discreti (segnale digitale) Tale segnale sarà in seguito quantizzato e codificato per renderlo accessibile a qualsiasi elaboratore digitale. Il teorema del campionamento pone un vincolo per la progettazione di apparati di conversione analogico-digitale: se si ha a disposisione un campionatore che lavora a frequenza F c, è necessario mandargli in ingresso un segnale a banda limitata da F c /2. In generale un segnale analogico non è limitato in frequenza, ma dovrà essere filtrato per eliminare le componenti di frequenza maggiore di F c /2, a tale scopo si usa un filtro anti-aliasing (filtro passa basso)

50 Effetto Aliasing Consiste in una sovrapposizione del segnale campionato che rende impossibile l'esatta ricostruzione del segnale originale e tale ricostruzione risulterà distorta. Per questo motivo ogni apparato di conversione analogico-digitale ha un filtro anti-alias (filtro passa basso) a monte del campionatore, che limita lo spettro del segnale di ingresso a F c >= 2 f M

51 Simulazione di un Segnale sinusoidale a frequenza 27 Hz campionato con differenti frequenze di Campionamento (Sample) fc=1KHz fc=333 Hz fc=110 Hz fc=37 fs fc=10,5 fs fc=50 Hz fc=1,8 fs..Un errato campionamento ha generato una frequenza differente da quella del segnale (freq. di aliasing)

52 Il teorema di Shannon-Nyquist e la frequenza di campionamento Dato un segnale continuo e a banda limitata esso è descritto completamente dai suoi campioni, se essi sono presi ad una frequenza almeno doppia rispetto alla frequenza massima del segnale t [MilliSecondi] Es: Periodo T=37ms f segnale=1/(37 ms)= 27 Hz Volt ADC 8 bit DAC Sample Clock ? f campionamento in clock

53 Simulazione di un Segnale sinusoidale a frequenza 27 Hz campionato con differenti frequenze di Campionamento (Sample) fc=1KHz fc=333 Hz fc=110 Hz fc=37 fs fc=10,5 fs fc=50 Hz fc=1,8 fs..Un errato campionamento ha generato una frequenza differente da quella del segnale (freq. di aliasing)

54 Lorecchio umano riesce a udire suoni da 20 Hz a 20KHz con una sensibilità maggiore nellintervallo tra 2 e 4 KHz (la voce umana varia da 500 Hz a 2KHz) Per il teorema di Shannon e Nyquist la frequenza di campionamento di unonda sonora deve essere doppia rispetto alla massima frequenza da riprodurre per ottenere una conversione completa del segnale analogico Alla qualità audio CD la frequenza di campionamento è di 44.1 KHz (il doppio di KHz) Campionare a 16 bit vuol dire avere 2 16 valori da assegnare alla forma donda in quel punto (65356) Campionare a 8 bit vuol dire averne solo 256 PRODUZIONE DEL SUONO

55 Per la voce un campionamento accettabile è di 8 bit a 22 KHz 10 sec di audio digitale stereo a Hz equivalgono a byte (1,68 Mb) per questo motivo in un Cd audio trovano posto solo circa 70 min di musica Formati audio: Wave (.wav) formato nativo di Microsoft Windows MP3 MPEG(Motion Picture Expert Group) layer 3 Usa un complesso algoritmo di compressione basato sulla fisiologia dellorecchio (mascheramento) che riduce loccupazione dei file da un minimo di 12 a1 fino ad un massimo di 96 a 1 Real Audio (Real Networks) formato per lo streaming audio/video AIFF utilizzato da Apple in QuickTime MIDI –Codifica le note e gli strumenti che devono eseguirle –Efficiente, ma solo musica, non voce, scarsa qualità del suono PRODUZIONE DEL SUONO

56 Convertitori Analogici Digitali (ADC) e Digitali Analogici (DAC)

57 Dispositivi di codifica (ADC) Suono onda di pressione dellaria Microfono Converte il suono in segnale elettrico Cavo elettrico 1 Trasporta il segnale elettrico analogico fino al ADC Analog to Digital Converter Cavo elettrico 2 Trasporta il segnale elettrico digitale verso il computer Campionamento Quantizzazione Segnale analogico Segnale campionatoSegnale digitale Analog to Digital Converter

58 Dispositivi di codifica (DAC) Esiste anche il processo inverso, che trasforma linformazione da digitale ad analogica. Nel caso del suono questo compito è svolto dal D.A.C. (Digital to Analog Converter) che trasforma il segnale digitale in segnale elettrico analogico; tale segnale viene successivamente trasformato in onda sonora dalle casse acustiche. Suono onda di pressione dellaria Cavo elettrico 2 Trasporta il segnale elettrico analogico fino alla cassa Digital to Analog Converter Cavo elettrico 1 Trasporta il segnale elettrico digitale verso il DAC Cassa Acustica Trasforma il segnale elettrico analogico in suono

59 Spettro di un segnale Il campionamento introduce un aliasing: in pratica il campionamento provoca duplicazioni dello spettro del segnale. Se non si rispetta il teorema di Shannon laliasing introdotto dal campionamento impedisce la ricostruzione del segnale originale, in quanto due spettri adiacenti si sovrappongono! freq fs ADC freq fsfc fc >2 fs

60 Spettro di un segnale fc <2 fs Leffetto di un errato campionamento, nellambito del dominio delle frequenze Per un buon funzionamento del campionatore e per evitare aliasing, si introduce un filtro passa basso che limita lo spettro del segnale di ingresso a fc >2 fs ADC Filtro PB

61 Conversione analogico - digitale - La qualità della conversione.. ADC 8 bit DAC Segnale analogico dal trasduttore Segnale in forma numerica + errore di quantizzazione Segnale analogico ricostruito dal DAC Con risoluzione maggiore di 8 bit avremmo ottenuto un risultato affetto da minor errore! 8 bit 2 8 =256 livelli Esempio: V in max=3 Volt => Risoluzione 3/256 = 0.01Volt V in max=10Volt => Risoluzione 10/256 = 0.04Volt Vmax / 2 n : intervallo di quantizzazione Dove n è il numero di bit del campionatore VinVin intervallo di quantizzazione

62 Digitale Analogico

63 Analogico Digitale

64 Bitrate Nellambito multimediale il bitrate rappresenta la quantità di informazione che è memorizzata/trasmessa per unità di tempo. Tipicamente il bitrate è scelto in modo tale da ottimizzare due parametri contrastanti come la qualità del materiale multimediale e la quantità di banda occupata Audio (MP3) 32 kbit/s MW (AM) qualità 96 kbit/s FM qualità Video (MPEG2) 16 kbit/s Videochiamata 128 – 384 kbit/s Videoconferenza 1 Mbit/s VHS qualità 5 Mbit/s DVD qualità 15 Mbit/s HDTV qualità

65 Supporti digitali a tecnologia ottica La scrittura e lettura di un supporto ottico si basa sulla tecnologia laser: Il disco è costituito di un materiale riflettente che presenta delle incisioni (zone opache) sulla sua superficie. Un raggio laser, attraverso un sistema di lenti, viene diversamente riflesso (zone incise o no). Tramite un prisma il raggio riflesso viene deviato su una cellula fotoelettrica che rileva il fascio e produce una sequenza di cifre binarie.

66 Supporti digitali a tecnologia ottica

67

68 Compact Disk (CD)650 MByte (si utilizza una sola faccia) Digital Versatile/Video Disk (DVD)9 – 17 GByte (25 volte la capacità di un CD) Supporti digitali a tecnologia ottica Sono esteriormente simili (diametro 120 mm e spessore 12 mm)

69 Compact Disk – Read Only Memory (CD - ROM) (scrivibile ma non riscrivibile) Compact Disk – Read Write (CD-RW) (riscrivibile n volte) Supporti digitali a tecnologia ottica (CD) Compact Disk – Audio (CD-Audio) (utilizzato per la musica)

70 Formati file audio (non compressi) Wav Utilizzato su sistemi operativi Microsoft Windows. Valori consentiti: Frequenza di campionamento: 11KHz, 22 KHz o 44 KHz Livelli di quantizzazione: 8 bit o 16 bit Numero di canali: 1 o 2 (stereofonia) Queste informazioni sono contenute nel file, ma restano trasparenti allutilizzatore. Dimensioni eccessive: milioni di bit per qualche minuto di musica!

71 Formati file audio (non compressi) Au (Audio m-law) Utilizzato su sistemi operativi Sun Microsystem e Mac. Caratteristica principale: m-law encoding La scala dei livelli di quantizzazione sullasse Y non è lineare ma logaritmica cioè sono utilizzati più livelli di quantizzazione per i segnali a basse frequenze e meno livelli per i segnali ad alte frequenze Approssima meglio londa del segnale audio Anche in questo caso: troppi bit per un file di musica!

72 Formati file audio (compressi) Necessità di compressione per poter minimizzare lo spazio e favorire la distribuzione di musica su Internet MPEG (Moving Picture Experts Group) si occupa di sviluppo di algoritmi di compressione di file audio e video Sistemi di compressione di tipo percettivo: si fa riferimento alla percezione umana del suono e si eliminano le informazioni inerenti a quella parte di segnale che luomo non è in grado di percepire. Sono compressioni di tipo lossy cioè il file decompresso non è identico alloriginale (perdita di informazioni).

73 Formati file audio (compressi) MPEG Audio: nome che indica tutti gli algoritmi di compressione di file audio Tre livelli di compressione : Layer I Layer II Layer III comunemente riconosciuto come MP3 Ogni livello corrisponde ad una diversa qualità di riproduzione audio: maggiore qualità maggiore complessità ed efficacia dellalgoritmo

74 MP3 Algoritmo di tipo lossy e source encoding (o percettivo): non tanto una ricostruzione fedele del segnale ma una ricostruzione quanto più simile alloriginale, anche con forme donda diverse. MP3 tende a ridurre il numero di bit di codifica dei campioni (meno di 16 bit) piuttosto che la frequenza di campionamento.

75 MP3 Possibili scelte: Bassa compressione ed alta qualità (192K – 300K bit per secondo) Media compressione e media qualità (128K bit per secondo) 12 ore di musica su CD Alta compressione e bassa qualità (16k bit per secondo)

76 Fine

77 Pulse Code Modulation Campionamento (Hz) Bit Mono/Stereo Occupazione Kb/s / / / / / / / /172

78 Sviluppo di funzione periodica in serie di FOURIER: Il teorema di Fourier afferma che una qualsiasi funzione periodica può essere ottenuta sommando un certo numero di funzioni sinusoidali di opportuna ampiezza, frequenza e fase. ( fondamentale + armoniche) Ad esempio unonda quadra può essere scomposta in una sommatoria che coinvolge una sinusoide (fondamentale) alla stessa frequenza del segnale e tutte le armoniche dispari di ampiezze decrescenti Spettro di un segnale e lanalisi armonica di Fourier

79 Video - MPEG Lo standard MPEG video ente che sviluppa MP3 (Moving Picture Experts Group). versioni: MPEG MPEG MPEG

80 Video – Compressione La compensazione del moto è la principale tecnica di compressione dello standard MPEG. Sfrutta le somiglianze esistenti tra frame successivi (ridondanza temporale) trova per ogni macroblocco la sua migliore definione (best match) nel frame di riferimento

81 Video – MPEG 1 La compressione è effettuata rimuovendo: Ridondanza spaziale compressione dei singoli fotogrammi (JPEG) Ridondanza temporale: compressione che sfrutta le relazioni tra i diversi fotogrammi, per rimuovere informazioni ridondanti qualità del filmato paragonabile a quella di un videoregistratore VHS.

82 Video – MPEG 2 E scalabile: prevede diversi profili con diverse qualità adatti ad applicazioni differenti e diversi livelli di compressione per ciascun profilo. Offre la possibilità di gestire differenti aspect-ratio (tra cui il 16:9 WideScreen) E adatto alla trasmissione streaming. Mantiene informazioni sullorigine del materiale video

83 Video – MPEG 4 Introduce il concetto di VOP (Video Object Planes), in cui ogni parte della sequenza video di ingresso viene divisa in un numero di regioni con immagini di forma arbitraria. Il singolo oggetto audiovisivo può essere sia sintetico che naturale. Ogni oggetto può essere manipolato dall'utente in ogni sua caratteristica La codifica di ogni oggetto riporta le sue caratteristiche essenziali

84 Compressione Huffman Ideato nel 1952 dal matematico D.A. Huffman Metodo di compressione senza perdita gli elementi che si ripetono frequentemente sono identificati da un codice breve,gli elementi rari nel file originale ricevono nel file compresso una codifica lunga è tanto più efficace quanto più ampie sono le differenze di frequenza degli elementi del file originale,

85 Compressione LZW è il risultato delle modifiche apportate nel 1984 da Terry Welch ai due algoritmi sviluppati nel 1977 e nel 1978 da Jacob Ziv e Abraham Lempel, permette di comprimere archivi di dati sfruttando la ricorsivita' delle stringhe relative alle informazioni in essi contenute. Viene creato un dizionario delle stringhe di simboli ricorrenti nel file, costruito in modo tale che ad ogni nuovo termine aggiunto al dizionario sia accoppiata in modo esclusivo un'unica stringa. Esiste un dizionario di partenza costituito dai 256 simboli

86 Video digitali Unimmagine ferma riprodotta a 20 immagini/s non mostrerà movimenti a scatti ma conterrà sfarfallio perché unimmagine decadrà dalla retina prima che appare la successiva. Un film con 20 immagini/sec, ciascuna riprodotta 4 volte di fila, non avrà sfarfallio, ma il moto apparirà discontinuo. Il problema si risolve se si trasmettono 25 immagini/s e vengono poi riprodotte due volte. Con 25 immagini al secondo quanto costa trasmettere in digitale?

87 MPEG Audio (Moving Picture expert Group) Attualmente lo standard, senza compressione, per le registrazioni audio prevede campioni di 16 bit ( sfumature) registrati ad una frequenza di 44,1 kHz. Per gestire un secondo di audio di qualità sono necessari circa 1400 Kbit/s! Lutilizzo della compressione MPEG consente di ridurre a un dodicesimo loccupazione di memoria dei campioni audio. Essa non intacca né la risoluzione né la dinamica. Una minore profondità del campione (8 bit invece di 16) comporta una perdita in termini di dinamica; una riduzione della frequenza di campionamento comporta una perdita nella risoluzione.

88 Elementi di psicoacustica Se si emette un suono ad una determinata frequenza, con una certa energia, ludito non sarà capace di percepire le frequenze immediatamente prossime anche se queste hanno volumi (cioè energia) appena inferiori. Questo fenomeno è noto con il nome di mascheramento

89 Algoritmo di compressione La compressione si ottiene effettuando la trasformata veloce di fourier sul segnale audio. Lo spettro viene diviso in 32 bande di frequenza ognuna delle quali viene elaborata separatamente. Quando sono presenti due canali stereo, viene anche sfruttata la ridondanza inerente nellavere due sorgenti audio altamente sovrapponibili. Laudio MPEG può comprimere un CD di rockn roll fino a 128 kbps senza alcuna perdita di qualità percettibile. Per un concerto di pianoforte sono necessari almeno 196 kbps.

90 La risoluzione spaziale è il più piccolo dettaglio distinguibile in una immagine: il rapporto tra dimensione dellimmagine e numero di punti che utilizziamo per descriverla si chiama risoluzione e si misura in dpi (dots per inch, punti per pollice). Risoluzione di unimmagine Risoluzione di 20 dpi Ogni periferica (stampante, scanner, schermo…) che riceve e riproduce immagini ha una specifica risoluzione 72 dpi 160 dpi

91 Le immagini a scale di grigio contengono sfumature ma non colori (solo bianco, nero e grigio). Una fotografia in bianco e nero è un'immagine a scale di grigio. Si codificano i toni di grigio Si associa una codifica di un tono di grigio ad ogni pixel Rappresentazioni di immagini più complesse

92 Un'altra forma di grafica su computer viene chiamata grafica vettoriale e si basa su formule numeriche. Quando si inviano immagini vettoriali al monitor o alla stampante, queste vengono convertite in pixel in base alla dimensione dell'immagine in output. Immagini Vettoriali E possibile individuare la presenza di strutture elementari di natura più complessa, quali linee, circonferenze, archi, ecc.

93 Definizione dei colori: in ogni punto, per rappresentare un qualsiasi colore dello spettro, è sufficiente definire lintensità dei tre colori fondamentali (per le immagini a video). Immagini a colori Il numero di bit utilizzati per rappresentare il colore di un singolo pixel si chiama PROFONDITA DEL COLORE. Disponendo di un byte per ogni colore fondamentale, potremo rappresentare 256*256*256 = colori. 2 bit4 bit8 bit24 bit

94 Quindi anche le immagini a colori possono essere memorizzate in forma numerica (digitale) suddividendole in milioni di punti, per ognuno dei quali si definisce il colore in termini numerici. Immagini a colori La qualità di unimmagine dipende dal numero di punti (risoluzione) in cui viene suddivisa e dai toni di colore permessi dalla codifica. Le immagini bitmap vengono quindi memorizzate come una lunga sequenza di bit il cui significato dipende dalla particolare codifica adottata.

95 Bitmap e risoluzione Il formato di rappresentazione per punti che abbiamo visto è definito BITMAP (o RASTER ). E particolarmente adatta per riprodurre, fotografie, dipinti e tutte le immagini per le quali ogni punto dellimmagine è significativo e deve essere descritto da un singolo elemento indipendente. Nel caso in cui una immagine sia destinata alla stampa la risoluzione richiesta è di di 300 dpi. Lo standard usato per il video è di 72 dpi.

96 Immagini vettoriali In tale formato è presente tutta linformazione necessaria a riprodurre limmagine, a prescindere dalle dimensioni, pertanto si elimina il problema legato al rapporto tra risoluzione e definizione (per ingrandire o ridurre la riproduzione basta agire sul sistema di coordinate). Evidentemente non si presterà per rappresentare immagini composte da continue variazioni di colore, quali ad esempio le fotografie. Esso si utilizza per immagini più simili a disegni che a fotografie, è possibile definire la figura in termini matematici

97 Mascheramento Mascheramento generato da un tono ad 1 kHz a 60 dB. Si è osservato che il mascheramento copre un range di 100Hz per frequenze inferiori ai 500 Hz, ma cresce velocemente per frequenze oltre i 500Hz. Persistenza del mascheramento: lenergia del tono mascherante non decade immediatamente, ma ha la persistenza di qualche millisecondo.

98 SAMPLE AND HOLD Il Sample and Hold nasce dallesigenza di campionare il segnale analogico e provvedere a mantenerlo per tutto il tempo della conversione in digitale. Il circuito che realizza tale operazione è costituito da un interruttore e un condensatore.

99 S/H = 0 T chiuso Campionamento del segnale V i =V -= V + =v(t) S/H = 1 T aperto Mantenimento del valore v(t) Il 2° A.O. fa scaricare lentamente il condensatore durante la fase di Hold

100 S/H basso BJT interdettoT chiuso S/H alto BJT conduceT aperto

101 La conversione A/D fa corrispondere a ogni campo di valori analogici un dato numerico. Solo per il valore analogico al centro del campo la conversione è esatta. Q =A x -A * Q = errore di quantizzazione; A x =grandezza da convertire

102 Sullasse delle ascisse è riportata la tensione analogica dingresso mentre sullasse delle ordinate è riportato il codice generato in uscita ADC 4 bit Q (1/2).LSB

103 Q varia linearmente allinterno di ogni intervallo: è massimo alle due estremità e nullo al centro Andamento dellerrore assoluto in funzione della grandezza analogica.

104 Conversione A/D a 8 bit Ad esempio al terzo colpo di clock del campionatore, viene estratto un campione pari a 2,6 Volt, che nel blocco successivo viene associato al codice Si noti lerrore di quantizzazione effettuato!

105 Fine

106 Compressione Huffman Albero di Huffman - alla base gli elementi più rari - elementi frequenti vicini alla radice - il codice ident. di ogni elemento è, partendo dalla radice, 0 se si va verso il figlio di sinistra e 1 se si va verso quello di destra - es..: b=01


Scaricare ppt "Campionamento e codifica di immagini e suoni Concetto di continuo e discreto La codifica di immagini e suoni Conversione A/D e D/A di un segnale Campionamento,"

Presentazioni simili


Annunci Google