La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Università degli studi di Messina Facoltà di Scienze MM.FF.NN. Corso di laurea in Informatica U.Bonino Tecniche di compressione segnali audio: modello.

Presentazioni simili


Presentazione sul tema: "Università degli studi di Messina Facoltà di Scienze MM.FF.NN. Corso di laurea in Informatica U.Bonino Tecniche di compressione segnali audio: modello."— Transcript della presentazione:

1 Università degli studi di Messina Facoltà di Scienze MM.FF.NN. Corso di laurea in Informatica U.Bonino Tecniche di compressione segnali audio: modello psicoacustico per Mpeg 1 Layer III mediante MatLab Tesi di laurea di: Alberto Pagano Relatrice: Prof.ssa Luigia PUCCIO Anno Accademico 1999/2000

2 Tecnologia digitale n Il recente sviluppo delle tecnologie digitali ha reso fondamentale lutilizzo di compressione audio/video nel campo delle telecomunicazioni –Es. teleconferenze, videotelefonia, ecc.

3 ISO (International Standards Organization) MPEG (Moving Pictures Expert Group) Sviluppare codifiche standard internazionali per la digitalizzazione, la compressione e la decompressione audio/video

4 MPEG n Il primo lavoro è conosciuto come MPEG 1 n codifica di fotogrammi in movimento con audio associato per larchiviazione su memorie di massa digitali con una occupazione di 1.5 Mbits al secondo n il progetto è suddiviso in 5 parti: n system; n video; n audio; n conformance testing; n software simulation.

5 MPEG 1 n In MPEG 1 sono presenti 3 layer di compressione n Dal primo al terzo troviamo un incremento nella complessità dellalgoritmo e nelle performance, con un miglioramento della qualità audio. Rapporti di compressione 4:1 8:1 12:1

6 Conversione analogico/digitale Frequenza di campionamento Risoluzione dei campioni

7 Musica digitale n Un normale CD audio viene campionato ad una frequenza di Hz, quantizzazione di 16 bit Campioni per secondo44100 x Canali (stereo) 2 x Byte 2 x secondi 60 = ______________ byte 10 Mbyte n Spazio occupato su disco da un minuto di musica stereo:

8 Algoritmo di compressione MP3 n È labbreviazione di MPEG 1 layer III –formato di audio compresso nato con lintento di consentirne la trasmissione ad alta qualità attraverso le linee di telecomunicazione, limitando il più possibile loccupazione di spazio e quindi di banda passante

9 Come funziona la compressione n Lossy: –algoritmi di compressione che si basano su delle osservazioni inerenti la percezione umana. n Audio percettivi: –non hanno lo scopo di restituire il segnale dingresso intatto dopo la decodifica, ma quello di assicurare che il segnale di uscita sia il più possibile uguale alloriginale n Ci si è basati sulle ricerche nel campo della Psicoacustica

10 Psicoacustica n Scienza che studia il comportamento del cervello di fronte a stimoli sonori contemporanei Soglia di udibilità Mascheramento In frequenza Temporale

11 Soglia di udibilità n Lorecchio umano è in grado di percepire suoni contenuti in uno spettro di frequenza che va dai 20 hz ai 20 khz (spettro delludibile)

12 Mascheramento in frequenza n Emettendo un suono ad una determinata frequenza, ludito non sarà capace di percepire le frequenze immediatamente prossime anche se hanno volume (energia) appena inferiori

13 Mascheramento temporale n Suoni normalmente percepibili possono non esserlo più se immediatamente preceduti da suoni più intensi.

14 Implementazione del modello psicoacustico Banco di filtri (32 bande) Quantizzazione e codifica Modellopsicoacustico Packing dei dati Input audio SMR SMR = Signal to Mask Ratio Schema di principio di un Encoder Mpeg Layer III Outputaudio

15 Prova sperimentale n Applicazione del modello psicoacustico 1 descritto nello standard ISO/IEC : –Information technology - Coding of moving pictures and associated audio for digital storage media at up to 1.5 Mbits/s - part 3: Audio Lalgoritmo è stato implementato tramite linguaggio MatLab ver. 5.2 su sistema Win 98

16 Modello psicoacustisco n Determinazione dei massimi locali; 1/6

17 Modello psicoacustico n Divisione in componenti tonali e non-tonali –tonali: sinusoidale, cioè generato da una sola frequenza (suono puro) –non-tonali : suono complesso, generato da più frequenze * tonali * non-tonali 2/6

18 Modello psicoacustico n Decimazione delle maschere Soglia sonora in condizioni di quiete 3/6

19 Modello psicoacustico n Calcolo delle soglie di mascheramento per ogni componente tonale e non-tonale rimasto dopo la decimazione 4/6

20 Modello psicoacustico n Le soglie di percettibilità delle maschere tonali e non- tonali vengono combinate insieme per generare una soglia di mascheramento globale. frequenza dB 5/6

21 Modello psicoacustico n La soglia di mascheramento globale viene rapportata al livello del massimo segnale rilevato nelle sottobande, ottenendo così il rapporto segnale/mascheramento tra lenergia del segnale e la soglia di mascheramento per ogni sottobanda 6/6

22 Mpeg/Audio - prestazioni n La compressione Mpeg/Audio dà compressione trasparente n Test effettuati dal comitato MPEG dimostrano che esperti ascoltatori statisticamente non riuscivano a distinguere il brano originale da quello codificato

23 3,71 Mbyte Confronto wav - mp3 n File originale –22 sec, formato WAV, 16 bit Hz, stereo, 21 sec. n File compresso –22 sec, formato MP3, 16 bit, Hz, stereo, 21 sec. Spazio occupato su disco: 346 Kbyte Rapporto di compressione: 11:1 11:1

24 Confronto tra spettri sonori Spettro della trasformata di Fourier del segnale originale (formato WAV) Spettro della trasformata di Fourier del segnale compresso (formato MP3) Hz

25 Occupazione su supporto digitale per i file ai diversi campionamenti Mbyte 10:1 3:1

26 Conclusioni n Il compressore Mpeg/Audio è un ottimo compressore audio per segnali digitali ad alta risoluzione. (Come i normalissimi CD Audio)


Scaricare ppt "Università degli studi di Messina Facoltà di Scienze MM.FF.NN. Corso di laurea in Informatica U.Bonino Tecniche di compressione segnali audio: modello."

Presentazioni simili


Annunci Google