Loudness e “livello del dialogo” nelle trasmissioni radiotelevisive

Loudness e “livello del dialogo” nelle trasmissioni radiotelevisive
¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria Dell’Osso, ²Anna Grazia Santoro ¹ FUB, Roma { } ² ISCOM, Roma } 1. TITOLO 1 5° Convegno Nazionale AISV - Università di Zurigo, 4-6 febbraio 2009

MOTIVAZIONI 2. MOTIVAZIONI
L’interesse per la misura del livello del volume nei contenuti multimediali, ed in particolare nelle trasmissioni televisive, ha in questi ultimi anni visto una rinnovata attenzione. Gli enti di ricerca, gli organismi normativi, le industrie e infine i broadcaster hanno tutti mostrato un rinato impegno sull’argomento ognuno nei rispettivi ruoli. La Fondazione Bordoni e l’Istituto Superiore delle Comunicazioni da alcuni anni stanno congiuntamente conducendo sia delle ricerche, sia delle campagne di misura. Se in passato si è trattato particolarmente dell’annoso problema livello sonoro dei segmenti pubblicitari, oggi vogliamo affrontare la questione con una visione di più ampio respiro che mira allo studio della qualità del segnale audio e alle prospettive di fruizione in scenari “full-digital”. 2. MOTIVAZIONI 2

3. ABSTRACT Abstract In questo lavoro si vuole verificare e discutere
il problema dei livelli di volume del segnale audio, ed in particolare del parlato, nelle trasmissioni televisive. Al fine di esaminare l’attuale situazione si è proceduto ad una ampia raccolta di materiale, e ad una preliminare serie di comparazioni che vanno ad esaminare, secondo le più recenti tecniche di misura, i tre problemi principali che sono: il dislivello tra canali (C2C – channel to channel) il dislivello tra programmi (P2P – program to program) il dislivello tra programma e pubblicità (P2A – program to advertising) o alternativamente del programma versus tutto il rimanente cioè “pubblicità+promo+jingle+etc.” 3. ABSTRACT Vengono anche affrontati alcuni aspetti della “qualità” del segnale audio (e della voce), in particolare sia per quanto riguardi i livelli assoluti del segnale vocale rispetto al segnale trasmesso, sia relativamente al fattore e alle modalità di “compressione”. 3

Il segnale televisivo analizzato (il database audio)
Una delle caratteristiche di questo lavoro è l’ampia dimensione del segnale audio analizzato. Sono state selezionate 14 emittenti, e per ciascuna di esse si è registrato il segnale trasmesso dalle ore 12 alle 24 per tutti i giorni della settimana (in maniera non contigua) per un totale di 12*7*14 = 1176 ore di segnale. Le registrazioni sono state effettuate tramite un sintonizzatore professionale per il digitale terrestre (o suo equivalente) nel periodo da novembre 08 a gennaio 09. Tutti i segnali sono stati acquisiti in modalità “full digital” e memorizzati nel formato stereo, 48k, 16 bit, per un totale di circa 800 Gb di segnale. Per 9 di queste emittenti il segnale è stato segmentato secondo i palinsesti, dall’ inizio di un programma all’inizio del successivo, le rimanti 5 emittenti, tutte a carattere monotematico, non sono invece state segmentate. 4. IL SEGNALE 4

La misura di “Loudness”
secondo la normativa internazionale ITU 1770 5. LOUDNESS scenario compatibile dal monofonico al 5.1 (nel nostro caso tutto il segnale è stereo) un primo filtro modella l’interferenza dell’onda acustica con la testa dell’ascoltatore … un secondo filtro opera una curva di adattamento simile alla “curva-B”, quindi si sommano i valori RMS pesandoli …. E’ stato sviluppato un software per il calcolo del loudness che opera simultaneamente diverse misure (RMS,LU) a diversi tempi (short term 1&2, long term, integration, file based, inf) e che applica anche una soglia di “gating” alle misure. 5

Gating vs Dialogue Intellicence
pro e contro di due tecniche (forse) antagoniste È necessario effettuare la misura solo sui segmenti percettivamente “significativi” del segnale audio. A tal fine si utilizzano queste due “semplici” tecniche: GATING: si prende in considerazione solo il segnale che supera una certa soglia, omettendo tutto il segnale a “basso” volume (sotto una certa soglia). DI (Dialogue Intelligence): è la soluzione scelta da Dolby e quindi da molti broadcaster e consiste nel considerare solo il segnale in cui è presente del parlato. 6. GATING vs D.I. PRO È semplice da realizzare È applicabile su tutti i tipi di segnale È facilmente modulabile Si può variare con grande elasticità CONTRO Necessità la definizione di una soglia Trovare un compromesso per la soglia può essere difficile Ha funzione banale per i casi estremi di soglia troppo grande o troppo piccola È relativo (necessita un livello di riferimento ordinario o assoluto) PRO È sicuramente una delle metriche utilizzate dagli utenti Permette risultati ottimali nella fase di sviluppo È gia disponibile su molti sistemi commerciali, che hanno mostrato eccellenti prestazioni CONTRO Non può essere applicata su tutti i segnali (e.g. musica, ecc.) È una tecnica complessa (VAD), e “imprecisa” È difficile (ma non impossibile) pensare di definire uno standard 6

La variazione c2c (channel to channel)
dBLu Legenda: Per tutte le 14 emittenti si è calcolato il valore di loudness dalle ore 12 alle 24 per tutti e sette i giorni della settimana. La rappresentazione a -72dBLu (in nero nel grafico) rappresenta in pratica il loudness di tutto il segnale con la sola esclusione del silenzi “assoluti” o di “nero”. I successivi valori a -8, -6, ecc. sono calcolati in relazione al valore misurato a -72dBLu e sono quindi livelli di loudness con “gating” relativi. Ogni singolo punto rappresenta quindi la misura integrale su 12 ore di segnale, operata con una determinata soglia di gating. Dal grafico risulta chiaramente che ogni emittente trasmette con un livello “tipico” che per alcune è molto stabile, mentre per altre ha piccole variazioni intorno al decibel. Solo per due emittenti si sono riscontrati oscillazioni intorno ai 3 dB, dovute probabilmente a problemi tecnici. Risulta invece fortemente disallineato il livello medio delle emittenti che raggiunge, nel caso estremo, il ragguardevole valore di quasi 10 dBLu. 7

La variazione p2p (program to program)
dBLu Legenda: il tratto orizzontale all’interno del box è la mediana del loudness dei programmi sull’intera settimana di registrazione I lati orizzontali dei box riportano i percentili al 25% e 75% della distribuzione del loudness dei programmi sull’intera settimana Gli estremi dei segmenti segmenti verticali rappresentano il loudness massimo e minimo della programmazione nell’intera settimana Per le emittenti monotematiche non segmentate secondo il palinsesto (ultimi 5 dati) si è calcolato il loudness ogni 30 minuti, e si è operata la medesima analisi tutte le analisi sono state effettuate con un gating relativo a -8dBr. La situazione ideale dovrebbe non solo avere tutte le mediane allineate ad un unico valore, ma la dimensione dei rettangoli dovrebbe essere praticamente nulla e altrettanto a distanza zero, rispetto alla mediana, dovrebbero essere i valori di minimo e massimo. Questa soluzione ideale è possibile semplicemente normalizzando ad un valore di riferimento il livello di loudness di un intero programma e mantenendo, avendo sufficiente headroom, la dinamica originale del contenuto audio. 8

DI vs Gating: long term 9. GATING vs D.I. – EX1
Nella maggior parte delle trasmissioni, il principale messaggio comunicativo è convogliato dal parlato. È quindi ragionevole che l’utente regoli il proprio “confort level” di ascolto sulla base del volume del segnale vocale trasmesso. 9. GATING vs D.I. – EX1 dBLu Legenda: Si è analizzato il segnale giornaliero (12 ore) di emittenti generaliste o monotematiche (film, news, musica). Per ciascuna è misurato il loudness: la colonna in verde è il sistema di riferimento LM100 della Dolby. I punti sono i valori ottenuti con il nostro programma con soglia assoluta a -72dBLu (BLU) e con soglia relativa a -8DbLu(r) (ROSSO). Per i generalisti e per le news le tecniche sembrano equivalenti. Sui contenuti tipo film il valore di gating ha effetto (vedi separazione dei punti). In generale non vi sono differenze eclatanti su misure integrali molto lunghe. L’approccio del Dialogue Intellicenge, che va ad effettuare la misura solo quando è rilevato del segnale vocale, sembrerebbe pertanto il più corretto. Abbiamo effettuato delle misure comparative del segnale utilizzando le due tecnologie sia su lungo termine, sia su singole tipologie di programmi e/o di contenuti al fine di investigare l’ “equivalenza” dei due metodi, anche in funzione dei contenuti. Per i contenuti selezionati si è effettuata una estrazione dai programmi del solo segnale vocale (senza presenza di rumori di fondo o musica) e anche su questo si sono operate le diverse misure di loudness. 9

DI vs Gating: film, fiction e talk-show
Ovviamente per quanto riguarda la tipologia R (pubblicità, promo, sigle, jingle, ecc), in posizione centrale nei grafici, i risultati non cambiano né in funzione del contesto, né della emittente ed questi mostrano un’ampia compatibilità tra il DI ed il Gating. Per quanto riguarda invece programmi di “qualità” come film e fiction la tecnica DI sembra essere mediamente compatibile con il semplice calcolo del loudness a -72dBLu sia per il programma nel suo insieme (A), sia per la parte di solo parlato (S). Essendo queste parti di maggior “qualità” rispetto alla R, ovvero essendo meno compresse, mostrano valori significativamente diversi con gating a -8dBLu(r). Per i talk-show ancora le tecniche risultano compatibili, e la differenza tra le due soluzioni di Gating diviene, in questo caso, trascurabile. Inoltre, come è ragionevole, le misure del programma (A), e del solo parlato (S) risultano praticamente identiche. Anche in questo caso quindi DI e Gating sembra possano trovare un punto di incontro, ed in particolare un gating “semplice” a -72dBLu può ancora essere il candidato più promettente come alternativa alla tecnica di Dialogue Intelligence. F I L M dBLu 10. GATING vs D.I. – EX2 F I C T I O N dBLu TALK SHOW dBLu Legenda: A = programma (a sinistra nel grafico) R = pubblicità, jingle, promo,ecc. (al centro del grafico) S = parlato “pulito” estratto manualmentedel solo programma (a destra nel grafico)) 10

11. COMPRESSIONE E PARLATO
Compressione, Qualità e Parlato Considerando “naturale” il segnale realizzato in fase di doppiaggio (o in presa diretta), una sua prima manipolazione avviene nella fase di post-produzione e di missaggio. In questa fase possiamo ancora considerare il parlato come “corretto” anche se questo è stato artatamente modificato per renderlo “più naturale”. Oggi il risultato dopo il playout può invece essere fortemente alterato sia per necessità tecnologiche, sia perché il broadcaster può volere “andare incontro” ad una utenza scarsamente educata alla qualità audio. Con il passaggio al digitale il primo problema è tecnicamente risolto. Il secondo è più grave, e la sua soluzione può essere ottenuta solo perseguendo una politica di controllo e di educazione alla qualità audio. A mero titolo di esempio si riportano i valori dopo il playout misurati in un programma di recente produzione di un urlo (voce molto sostenuta) e di un normale dialogo. L’urlo in natura* risulta circa 15/20 dB più alto del parlato, mentre nel segnale registrato è solo di 2/3dB maggiore. dubbing 11. COMPRESSIONE E PARLATO mixing playout 11 allo stato attuale non è possibile conoscere il valore dopo il mixing

12. CONCLUSIONI Conclusioni 12
Si è svolta una ampia campagna di misure sul loudness di emittenti su digitale terrestre, verificando di fatto che i problemi di disallineamento tra emittente ed emittente, tra programma e programma, tra programma e pubblicità sussistono, e a volte assumono aspetti macroscopici. Si è inoltre dimostrata una ragionevole compatibilità delle metodologie oggi più in voga per la misura del broadcast loudness. 12. CONCLUSIONI I risultati tuttavia invitano ad una estrema cautela, specialmente oggi, qualora si voglia studiare le caratteristiche acustico/fonetiche del segnale vocale radio-televisivo in quanto questo non può essere considerato né naturale, né il risultato fedele della post produzione. Questa sperimentazione conferma, come precedentemente auspicato, la necessità di studio, definizione e applicazione di raccomandazioni riguardanti misure e procedure per garantire un determinato livello di qualità audio. Congiuntamente deve essere promossa una campagna di sensibilizzazione atta a migliorare la sensibilità alla qualità alle esperienze di ascolto da parte degli utenti. 12

Loudness e “livello del dialogo” nelle trasmissioni radiotelevisive

Presentazioni simili

Presentazione sul tema: "Loudness e “livello del dialogo” nelle trasmissioni radiotelevisive"— Transcript della presentazione:

Presentazioni simili

Sul progetto

Feed-back

Entrare

Autorizzarsi attraverso i social network:

Loudness e “livello del dialogo” nelle trasmissioni radiotelevisive

Presentazioni simili

Presentazione sul tema: "Loudness e “livello del dialogo” nelle trasmissioni radiotelevisive"— Transcript della presentazione:

Presentazioni simili

Sul progetto

Feed-back