Innovazione nelle Indagini statistiche sui trasporti Laura De Sandro in collaborazione con Stefania Fegatelli “Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto” Roma, 06 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti SOMMARIO Esplicitazione del problema Trattamento Mancate Risposte Record Linkage L’ integrazione con dati delle capitanerie di porto Utilizzo dei mirror data Roma, 6 dicembre 2011
Esplicitazione del problema Innovazione nelle indagini statistiche sui trasporti Esplicitazione del problema LA CAUSA: Complessità organizzativa dell’indagine Difficoltà di individuare l’universo dei rispondenti L’EFFETTO: dichiarazioni mancanti (non pervenute o non effettuate) di Arrivo/Partenza MANCATE RISPOSTE TOTALI dichiarazioni non complete di Arrivo/Partenza L’evento nave A/P viene rilevato, ma senza dettagli sul carico MANCATE RISPOSTE PARZIALI Roma, 6 dicembre 2011
Esplicitazione del problema Innovazione nelle indagini statistiche sui trasporti Esplicitazione del problema TRATTAMENTO MANCATE RISPOSTE Utilizzo modelli delle capitanerie di porto Utilizzo mirror data Roma, 6 dicembre 2011
Esplicitazione del problema Innovazione nelle indagini statistiche sui trasporti Esplicitazione del problema Il metodo di IMPUTAZIONE scelto: Record Linkage (RL) tra la base dati Istat e una fonte amministrativa La FONTE amministrativa UFFICIALE scelta: il modello 61 delle CAPITANERIE DI PORTO, trasmesso all’Istat dal Ministero delle Infrastrutture e Trasporti Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE Perché un Record Linkage? Perché la nave, dichiarata in ‘arrivo (partenza)’ dall’agente marittimo, viene registrata anche in capitaneria di porto con il suo carico, cioè con la sua merce e i suoi passeggeri Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE Punti di forza dei modelli 61 stesso campo d’osservazione dell’indagine fornisce l’universo delle navi arrivate/partite permette di integrare eventuali MR, totali e parziali, rispetto ai viaggi (navi arrivate/partite), alla merce o ai passeggeri Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE Punti di debolezza dei modelli 61 non sono generati da una procedura automatizzata, quindi non sono immediatamente trattabili da Istat contengono informazioni aggregate con riferimento al numero di navi arrivate/partite e alle tonnellate di merce e al numero di passeggeri sbarcati/imbarcati Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE Ipotesi di base le unità statistiche devono essere definite allo stesso modo nelle diverse fonti o provenire dalla stessa fonte le unità devono fare riferimento allo stesso collettivo statistico il contenuto informativo delle variabili della fonte “donatrice” deve essere identico a quello delle variabili “oggetto” di indagine IPOTESI SODDISFATTE!! Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE Il match e la match key Tecnica di exact matching con una chiave di abbinamento che identifichi univocamente l’evento ‘nave arrivata/partita’ Ad ogni evento (nel nostro caso l’evento nave arrivata/partita) da integrare corrisponde un solo record ‘donatore’ Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE Il match e la match key La chiave di abbinamento: Numero IMO (International Maritime Organization) mese direzione (arrivo/partenza) porto dichiarante porto di origine/destinazione zona di origine/destinazione Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE LA FORMALIZZAZIONE Dall’insieme di tutte le coppie formate da unità appartenenti alle fonti A e B, A × B ={(a, b) : a є A, b є B}, si determinano due sottoinsiemi disgiunti ed esaustivi M e u, per cui M∩u =ø e MUu = A × B Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE LA FORMALIZZAZIONE M = unità rilevate in entrambe le fonti “match” u= unità rilevate in A e non presenti in B, e viceversa “non-match” Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti RECORD LINKAGE LA FORMALIZZAZIONE A = la base dati Istat B = la base dati delle capitanerie di porto; IL RL VIENE EFFETTUATO SU SOTTOINSIEMI DELLE 2 FONTI, selezionati in base alla variabile ‘TIPO DI NAVE’, per individuare correttamente il tipo di carico da integrare Gli insiemi finali M ed u sono pertanto l’unione di tanti sottoinsiemi, le cui coppie contengono, in entrambe le fonti, la merce e i passeggeri da integrare Roma, 6 dicembre 2011
L’integrazione della MERCE Innovazione nelle indagini statistiche sui trasporti L’integrazione della MERCE TIPI DI CARICO INTEGRATI: merce in Rinfusa liquida attraverso il tipo nave Portarinfuse liquide merce in Rinfusa solida attraverso il tipo nave Portarinfuse solide merce in container attraverso tipo nave Portacontainer merce in traghetto attraverso il tipo nave Traghetto merce in Trasportatore non specializzato attraverso l’omonimo tipo nave
L’integrazione di PASSEGGERI e NAVI Innovazione nelle indagini statistiche sui trasporti L’integrazione di PASSEGGERI e NAVI segue ALTRE INTEGRAZIONI: Numero di passeggeri attraverso il tipo nave Traghetto-Aliscafo Movimenti di TUTTE le NAVI Arrivate/Partite Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti L’ INTEGRAZIONE RISULTATI DEL linkage l’evento Nave Arrivata/Partita si rileva nei modelli 61 e non nella fonte Istat INTEGRAZIONE MR TOTALI Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti L’ INTEGRAZIONE l’evento Nave Arrivata/Partita si rileva in entrambe le fonti, ma merce, passeggeri e/o il numero di navi A/P non coincidono, si tiene conto di quanto dichiarato nei modelli 61 INTEGRAZIONE MR PARZIALI 18 Roma, 6 dicembre 2011
ESEMPIO di integrazione delle tonn. merce Innovazione nelle indagini statistiche sui trasporti ESEMPIO di integrazione delle tonn. merce RINFUSA LIQUIDA ISTAT RINFUSA LIQUIDA Fonte AMM. RINFUSA SOLIDA ISTAT RINFUSA SOLIDA Fonte AMM. TRAGHETTI ISTAT TRAGHETTI Fonte AMM. PORTACONTAINER ISTAT PORTACONTAINER Fonte AMM. Roma, 6 dicembre 2011
L’utilizzo dei MIRROR DATA Innovazione nelle indagini statistiche sui trasporti L’utilizzo dei MIRROR DATA Il Trattamento delle MR totali e parziali prevede anche una integrazione utilizzando i mirror data. Attualmente sono utilizzate entrambe le tecniche: RL per l’Integrazione con i mirror data RL per l’Integrazione con dati amministrativi delle capitanerie di porto Roma, 6 dicembre 2011
Arrivo in B da A A B Partenza da A per B L’utilizzo dei MIRROR DATA Innovazione nelle indagini statistiche sui trasporti L’utilizzo dei MIRROR DATA Ogni porto può avere al massimo 2 eventi (Nave Arrivata/Partita) verificabili per una coppia di porti AB il n. max = 4 Arrivo in B da A A B Partenza da A per B Roma, 6 dicembre 2011
RL e mirror data: la match key Innovazione nelle indagini statistiche sui trasporti RL e mirror data: la match key La chiave differisce da quella utilizzata per integrare con dati delle capit. di porto nella variabile Direzione (Arrivo/Partenza): Numero IMO (International Maritime Organization) mese direzione (arrivo/partenza) porto dichiarante porto di origine/destinazione zona di origine/destinazione Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti ESEMPI DI MIRROR Civitavecchia Olbia Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti ESEMPI DI MIRROR P.Empedocle Linosa Lampedusa Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui trasporti Sviluppi futuri INFORMATIZZAZIONE dei modelli 61, ad opera del Ministero delle Infrastrutture e Trasporti Procedure automatiche per l’individuazione e il recupero dei ‘non rispondenti’, utilizzando anche i risultati del RL Roma, 6 dicembre 2011