Scaricare la presentazione
1
Innovazione nelle Indagini statistiche sui trasporti
Laura De Sandro in collaborazione con Stefania Fegatelli “Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto” Roma, dicembre 2011
2
Innovazione nelle indagini statistiche sui trasporti
SOMMARIO Esplicitazione del problema Trattamento Mancate Risposte Record Linkage L’ integrazione con dati delle capitanerie di porto Utilizzo dei mirror data Roma, 6 dicembre 2011
3
Esplicitazione del problema
Innovazione nelle indagini statistiche sui trasporti Esplicitazione del problema LA CAUSA: Complessità organizzativa dell’indagine Difficoltà di individuare l’universo dei rispondenti L’EFFETTO: dichiarazioni mancanti (non pervenute o non effettuate) di Arrivo/Partenza MANCATE RISPOSTE TOTALI dichiarazioni non complete di Arrivo/Partenza L’evento nave A/P viene rilevato, ma senza dettagli sul carico MANCATE RISPOSTE PARZIALI Roma, 6 dicembre 2011
4
Esplicitazione del problema
Innovazione nelle indagini statistiche sui trasporti Esplicitazione del problema TRATTAMENTO MANCATE RISPOSTE Utilizzo modelli delle capitanerie di porto Utilizzo mirror data Roma, 6 dicembre 2011
5
Esplicitazione del problema
Innovazione nelle indagini statistiche sui trasporti Esplicitazione del problema Il metodo di IMPUTAZIONE scelto: Record Linkage (RL) tra la base dati Istat e una fonte amministrativa La FONTE amministrativa UFFICIALE scelta: il modello 61 delle CAPITANERIE DI PORTO, trasmesso all’Istat dal Ministero delle Infrastrutture e Trasporti Roma, 6 dicembre 2011
6
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE Perché un Record Linkage? Perché la nave, dichiarata in ‘arrivo (partenza)’ dall’agente marittimo, viene registrata anche in capitaneria di porto con il suo carico, cioè con la sua merce e i suoi passeggeri Roma, 6 dicembre 2011
7
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE Punti di forza dei modelli 61 stesso campo d’osservazione dell’indagine fornisce l’universo delle navi arrivate/partite permette di integrare eventuali MR, totali e parziali, rispetto ai viaggi (navi arrivate/partite), alla merce o ai passeggeri Roma, 6 dicembre 2011
8
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE Punti di debolezza dei modelli 61 non sono generati da una procedura automatizzata, quindi non sono immediatamente trattabili da Istat contengono informazioni aggregate con riferimento al numero di navi arrivate/partite e alle tonnellate di merce e al numero di passeggeri sbarcati/imbarcati Roma, 6 dicembre 2011
9
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE Ipotesi di base le unità statistiche devono essere definite allo stesso modo nelle diverse fonti o provenire dalla stessa fonte le unità devono fare riferimento allo stesso collettivo statistico il contenuto informativo delle variabili della fonte “donatrice” deve essere identico a quello delle variabili “oggetto” di indagine IPOTESI SODDISFATTE!! Roma, 6 dicembre 2011
10
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE Il match e la match key Tecnica di exact matching con una chiave di abbinamento che identifichi univocamente l’evento ‘nave arrivata/partita’ Ad ogni evento (nel nostro caso l’evento nave arrivata/partita) da integrare corrisponde un solo record ‘donatore’ Roma, 6 dicembre 2011
11
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE Il match e la match key La chiave di abbinamento: Numero IMO (International Maritime Organization) mese direzione (arrivo/partenza) porto dichiarante porto di origine/destinazione zona di origine/destinazione Roma, 6 dicembre 2011
12
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE LA FORMALIZZAZIONE Dall’insieme di tutte le coppie formate da unità appartenenti alle fonti A e B, A × B ={(a, b) : a є A, b є B}, si determinano due sottoinsiemi disgiunti ed esaustivi M e u, per cui M∩u =ø e MUu = A × B Roma, 6 dicembre 2011
13
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE LA FORMALIZZAZIONE M = unità rilevate in entrambe le fonti “match” u= unità rilevate in A e non presenti in B, e viceversa “non-match” Roma, 6 dicembre 2011
14
Innovazione nelle indagini statistiche sui trasporti
RECORD LINKAGE LA FORMALIZZAZIONE A = la base dati Istat B = la base dati delle capitanerie di porto; IL RL VIENE EFFETTUATO SU SOTTOINSIEMI DELLE 2 FONTI, selezionati in base alla variabile ‘TIPO DI NAVE’, per individuare correttamente il tipo di carico da integrare Gli insiemi finali M ed u sono pertanto l’unione di tanti sottoinsiemi, le cui coppie contengono, in entrambe le fonti, la merce e i passeggeri da integrare Roma, 6 dicembre 2011
15
L’integrazione della MERCE
Innovazione nelle indagini statistiche sui trasporti L’integrazione della MERCE TIPI DI CARICO INTEGRATI: merce in Rinfusa liquida attraverso il tipo nave Portarinfuse liquide merce in Rinfusa solida attraverso il tipo nave Portarinfuse solide merce in container attraverso tipo nave Portacontainer merce in traghetto attraverso il tipo nave Traghetto merce in Trasportatore non specializzato attraverso l’omonimo tipo nave
16
L’integrazione di PASSEGGERI e NAVI
Innovazione nelle indagini statistiche sui trasporti L’integrazione di PASSEGGERI e NAVI segue ALTRE INTEGRAZIONI: Numero di passeggeri attraverso il tipo nave Traghetto-Aliscafo Movimenti di TUTTE le NAVI Arrivate/Partite Roma, 6 dicembre 2011
17
Innovazione nelle indagini statistiche sui trasporti
L’ INTEGRAZIONE RISULTATI DEL linkage l’evento Nave Arrivata/Partita si rileva nei modelli 61 e non nella fonte Istat INTEGRAZIONE MR TOTALI Roma, 6 dicembre 2011
18
Innovazione nelle indagini statistiche sui trasporti
L’ INTEGRAZIONE l’evento Nave Arrivata/Partita si rileva in entrambe le fonti, ma merce, passeggeri e/o il numero di navi A/P non coincidono, si tiene conto di quanto dichiarato nei modelli 61 INTEGRAZIONE MR PARZIALI 18 Roma, 6 dicembre 2011
19
ESEMPIO di integrazione delle tonn. merce
Innovazione nelle indagini statistiche sui trasporti ESEMPIO di integrazione delle tonn. merce RINFUSA LIQUIDA ISTAT RINFUSA LIQUIDA Fonte AMM. RINFUSA SOLIDA ISTAT RINFUSA SOLIDA Fonte AMM. TRAGHETTI ISTAT TRAGHETTI Fonte AMM. PORTACONTAINER ISTAT PORTACONTAINER Fonte AMM. Roma, 6 dicembre 2011
20
L’utilizzo dei MIRROR DATA
Innovazione nelle indagini statistiche sui trasporti L’utilizzo dei MIRROR DATA Il Trattamento delle MR totali e parziali prevede anche una integrazione utilizzando i mirror data. Attualmente sono utilizzate entrambe le tecniche: RL per l’Integrazione con i mirror data RL per l’Integrazione con dati amministrativi delle capitanerie di porto Roma, 6 dicembre 2011
21
Arrivo in B da A A B Partenza da A per B L’utilizzo dei MIRROR DATA
Innovazione nelle indagini statistiche sui trasporti L’utilizzo dei MIRROR DATA Ogni porto può avere al massimo 2 eventi (Nave Arrivata/Partita) verificabili per una coppia di porti AB il n. max = 4 Arrivo in B da A A B Partenza da A per B Roma, 6 dicembre 2011
22
RL e mirror data: la match key
Innovazione nelle indagini statistiche sui trasporti RL e mirror data: la match key La chiave differisce da quella utilizzata per integrare con dati delle capit. di porto nella variabile Direzione (Arrivo/Partenza): Numero IMO (International Maritime Organization) mese direzione (arrivo/partenza) porto dichiarante porto di origine/destinazione zona di origine/destinazione Roma, 6 dicembre 2011
23
Innovazione nelle indagini statistiche sui trasporti
ESEMPI DI MIRROR Civitavecchia Olbia Roma, 6 dicembre 2011
24
Innovazione nelle indagini statistiche sui trasporti
ESEMPI DI MIRROR P.Empedocle Linosa Lampedusa Roma, 6 dicembre 2011
25
Innovazione nelle indagini statistiche sui trasporti
Sviluppi futuri INFORMATIZZAZIONE dei modelli 61, ad opera del Ministero delle Infrastrutture e Trasporti Procedure automatiche per l’individuazione e il recupero dei ‘non rispondenti’, utilizzando anche i risultati del RL Roma, 6 dicembre 2011
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.