Tecniche di compressione segnali audio:

Slides:



Advertisements
Presentazioni simili
29/10/2008Imparare a registrare Antonio Arzedi 1 INTRODUZIONE ALLAUDIO DIGITALE Analogico Digitale.
Advertisements

UNIVERSITÀ DEGLI STUDI DI PARMA
Elaborazione numerica del suono
Sistema Uditivo e Analisi in Frequenza
21 Marzo 2006"Le misure e le previsioni in acustica edilizia"1 Requisiti acustici passivi degli edifici - Elaborazione e presentazione dei dati - Enrico.
Sistema Uditivo e Analisi in Frequenza
Suono digitale 3.0 ITP Sergio Capone.
Classe III A A.s – 2010 Programma di Informatica
CODIFICA DELLE INFORMAZIONI
L’oscillatore digitale
Cenni sul campionamento
I suoni Il campionamento File Wave e Midi I suoni in Windows 98
La gestione dell'audio Creazione, acquisizione, formati di file a cura di Loris Tissìno (
Televisione Digitale Terrestre Aspetti Tecnici
Filtri Multirate e Banchi di Filtri
UNIVERSITA’ DEGLI STUDI DI TRIESTE FACOLTA’ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA A.A / 2005 Tesi di Laurea Triennale SVILUPPO.
’’Campionamento e codifica di immagini e suoni’’
’’Campionamento e codifica di immagini e suoni’’
Codifica dei caratteri
Digitalizzazione EMG: Valori Tipici
Sistemi e Tecnologie della Comunicazione
MUSICA E INTERNET LEONARDO BOF RICCARDO FERRETTI
Informazione multimediale
Codifica dell’ Informazione non numerica
Moving Pictures Experts Group Giovanni Margarita 50/193 Rosario Savarese 50/377.
Corso di Informatica per Giurisprudenza
DATA PROCESSING UNIVERSITÀ DEGLI STUDI DI ROMA “LA SAPIENZA”
Università degli Studi di Roma La Sapienza
Dal tempo continuo al tempo discreto
Introduzione ai calcolatori
Laboratorio di El&Tel Elaborazione numerica dei segnali: analisi delle caratteristiche dei segnali ed operazioni su di essi Mauro Biagi.
Componenti e tecnologie multimediali
UNIVERSITA’ STUDI DI ROMA “FORO ITALICO”
Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale Paolo Mereghetti DISCo – Dipartimento di Informatica, Sistemistica e Comunicazione.
Schema a blocchi di un convertitore A/D a sovracampionamento
PROGETTO DI UN FILTRO POLIFASE FIR DECIMATORE PER IMPIEGO IN UN SISTEMA MULTISTANDARD UMTS-WLAN RELATORE: Prof. Carla Vacchi CORRELATORE: Ing. Everest.
Sistemi di comunicazione
GRANDEZZE ANALOGICHE E DIGITALI

Scritture Segrete Lezione n. 8 La steganografia moderna - parte 2
Digitalizzazione Un segnale viene digitalizzato, se il suo stato originario analogico viene tradotto e rappresentato mediante un insieme numerabile di.
RAPPRESENTAZIONE DELLE INFORMAZIONI
LA PERCEZIONE DEL SUONO
Codifica dei dati in un elaboratore elettronico
Codifica dell’informazione
Psicologia dello sviluppo e dell'educazione (laurea magistrale)
Fondamenti di elaborazione multimediale
Informazioni e dati A. Ferrari. Informazione automatica Informatica deriva dalla contrazione di altri due termini: informazione e automatica e sta a significare.
DIGITALIAZZAZIONE Di Alessio.
Codifica di Immagini Fabio Cantaro.
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 9
Free Powerpoint Templates Page 1 Free Powerpoint Templates I SEGNALI: ANALOGI-DIGITALI Luca Santucci 5°A Progr.
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 6 PULSE CODE MODULATION (PCM)
Codifica dell’informazione
Corsi di Laurea in Biotecnologie
Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra tecnologia e applicazioni.
ANALISI ARMONICA Corsi di DIPLOMA UNIVERSITARIO
Informazione multimediale
1 Informatica Generale Alessandra Di Pierro Ricevimento: Giovedì ore presso Dipartimento di Informatica, Via Buonarroti,
RETI NON LOCALI Parte Prima FONIA ANALOGICA E FONIA DIGITALE Gianfranco Prini DSI - Università di Milano
Corso di Laurea in Biotecnologie corso di Informatica Paolo Mereghetti DISCo – Dipartimento di Informatica, Sistemistica e Comunicazione.
Riconoscimento frequenze di note musicali Corso ESIM Prof. P. Daponte Gruppo di lavoro: Mario Calì 195/ Marco Gallucci 195/ Roberto De Falco.
SOMMARIO La Digitalizzazione La Compressione LA DIGITALIZZAZIONE La digitalizzazione consiste nella trasformazione di un oggetto in una sequenza di numeri,
STRUTTURE DEI DATI (COMPLESSI). TESTO (codifica informazioni testuali) TESTO: (es. libro) sequenza di capitoli, paragrafi,pagine,righe, parole.
X CONVEGNO NAZIONALE GIT IL GPS IN BEEBOOK Geosciences and Information Technologies Carlo CesariniSan Leo (Rimini) – 18 giugno 2015 Carlo Cesarini (laureando.
La psicoacustica e le nuove frontiere della musica
Transcript della presentazione:

Tecniche di compressione segnali audio: Università degli studi di Messina Facoltà di Scienze MM.FF.NN. Corso di laurea in Informatica “U.Bonino” Tecniche di compressione segnali audio: modello psicoacustico per Mpeg 1 Layer III mediante MatLab Tesi di laurea di: Alberto Pagano Relatrice: Prof.ssa Luigia PUCCIO Anno Accademico 1999/2000

Tecnologia digitale Il recente sviluppo delle tecnologie digitali ha reso fondamentale l’utilizzo di compressione audio/video nel campo delle telecomunicazioni Es. teleconferenze, videotelefonia, ecc.

ISO (International Standards Organization) MPEG (Moving Pictures Expert Group) Sviluppare codifiche standard internazionali per la digitalizzazione, la compressione e la decompressione audio/video

MPEG Il primo lavoro è conosciuto come MPEG 1 “codifica di fotogrammi in movimento con audio associato per l’archiviazione su memorie di massa digitali con una occupazione di 1.5 Mbits al secondo” il progetto è suddiviso in 5 parti: system; video; audio; conformance testing; software simulation.

MPEG 1 In MPEG 1 sono presenti 3 layer di compressione 12:1 In MPEG 1 sono presenti 3 layer di compressione Dal primo al terzo troviamo un incremento nella complessità dell’algoritmo e nelle performance, con un miglioramento della qualità audio. 8:1 4:1 Rapporti di compressione

Conversione analogico/digitale Frequenza di campionamento Risoluzione dei campioni

Musica digitale Un normale CD audio viene campionato ad una frequenza di 44100 Hz, quantizzazione di 16 bit Spazio occupato su disco da un minuto di musica stereo: Campioni per secondo 44100 x Canali (stereo) 2 x Byte 2 x secondi 60 = ______________ 10.584.000 byte  10 Mbyte

Algoritmo di compressione MP3 È l’abbreviazione di MPEG 1 layer III formato di audio compresso nato con l’intento di consentirne la trasmissione ad alta qualità attraverso le linee di telecomunicazione, limitando il più possibile l’occupazione di spazio e quindi di banda passante

Come funziona la compressione Lossy: algoritmi di compressione che si basano su delle osservazioni inerenti la percezione umana. Audio percettivi: non hanno lo scopo di restituire il segnale d’ingresso intatto dopo la decodifica, ma quello di assicurare che il segnale di uscita sia il più possibile uguale all’originale Ci si è basati sulle ricerche nel campo della Psicoacustica

Psicoacustica Scienza che studia il comportamento del cervello di fronte a stimoli sonori contemporanei Soglia di udibilità Mascheramento In frequenza Temporale

Soglia di udibilità L’orecchio umano è in grado di percepire suoni contenuti in uno spettro di frequenza che va dai 20 hz ai 20 khz (spettro dell’udibile)

Mascheramento in frequenza Emettendo un suono ad una determinata frequenza, l’udito non sarà capace di percepire le frequenze immediatamente prossime anche se hanno volume (energia) appena inferiori

Mascheramento temporale Suoni normalmente percepibili possono non esserlo più se immediatamente preceduti da suoni più intensi.

Implementazione del modello psicoacustico Output audio Input audio Banco di filtri (32 bande) Quantizzazione e codifica Packing dei dati SMR Modello psicoacustico Schema di principio di un Encoder Mpeg Layer III SMR = Signal to Mask Ratio

Prova sperimentale Applicazione del modello psicoacustico 1 descritto nello standard ISO/IEC 111172-3: “Information technology - Coding of moving pictures and associated audio for digital storage media at up to 1.5 Mbits/s - part 3: Audio” L’algoritmo è stato implementato tramite linguaggio MatLab™ ver. 5.2 su sistema Win 98™

Modello psicoacustisco 1/6 Modello psicoacustisco Determinazione dei massimi locali;

Modello psicoacustico 2/6 Modello psicoacustico Divisione in componenti tonali e non-tonali tonali: sinusoidale, cioè generato da una sola frequenza (suono puro) non-tonali : suono complesso, generato da più frequenze * tonali * non-tonali

Modello psicoacustico 3/6 Modello psicoacustico Decimazione delle maschere Soglia sonora in condizioni di quiete

Modello psicoacustico 4/6 Modello psicoacustico Calcolo delle soglie di mascheramento per ogni componente tonale e non-tonale rimasto dopo la decimazione

Modello psicoacustico 5/6 Modello psicoacustico Le soglie di percettibilità delle maschere tonali e non-tonali vengono combinate insieme per generare una soglia di mascheramento globale. dB frequenza

Modello psicoacustico 6/6 Modello psicoacustico La soglia di mascheramento globale viene rapportata al livello del massimo segnale rilevato nelle sottobande, ottenendo così il rapporto segnale/mascheramento tra l’energia del segnale e la soglia di mascheramento per ogni sottobanda

Mpeg/Audio - prestazioni La compressione Mpeg/Audio dà compressione “trasparente” Test effettuati dal comitato MPEG dimostrano che esperti ascoltatori statisticamente non riuscivano a distinguere il brano originale da quello codificato

Confronto wav - mp3 3,71 Mbyte 346 Kbyte File originale File compresso 22 sec, formato WAV, 16 bit 44100 Hz, stereo, 21 sec. File compresso 22 sec, formato MP3, 16 bit, 44100 Hz, stereo, 21 sec. Spazio occupato su disco: 3,71 Mbyte 346 Kbyte Rapporto di compressione:  11:1

Confronto tra spettri sonori Spettro della trasformata di Fourier del segnale originale (formato WAV) 14000 Hz Spettro della trasformata di Fourier del segnale compresso (formato MP3)

Occupazione su supporto digitale per i file ai diversi campionamenti 10:1 3:1 Mbyte

Conclusioni Il compressore Mpeg/Audio è un ottimo compressore audio per segnali digitali ad alta risoluzione. (Come i normalissimi CD Audio)