La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 RJSDMX (Connettori SDMX per Software Statistici) Attilio Mattiocco Banca DItalia Area Ricerca Economica.

Presentazioni simili


Presentazione sul tema: "1 RJSDMX (Connettori SDMX per Software Statistici) Attilio Mattiocco Banca DItalia Area Ricerca Economica."— Transcript della presentazione:

1 1 RJSDMX (Connettori SDMX per Software Statistici) Attilio Mattiocco Banca DItalia Area Ricerca Economica

2 2 Cosè RJSDMX RJSDMX è un package per R, sviluppato dalla Banca dItalia, per laccesso a dati SDMX disseminati da providers istituzionali E stato ideato per portare in un ambiente computazionale R (nella forma di time series di tipo zoo) dati esposti attraverso Web Services SDMX. RJSDMX offre anche alcune funzionalità di base per query su metadati strutturali. Queste funzioni servono ad esplorare la struttura dei flussi SDMX e costruire le successive query dati. Il package è costituito da un nucleo principale di codice Java racchiuso in una façade di codice R. Questa architettura ha permesso di sviluppare, in maniera molto efficiente (alto riuso di codice), un framework di Connettori SDMX per diversi software statistici

3 3 I Connettori SDMX internet/intranet ECBOECDISTAT BISInfostat In futuro Enterprise Applications ECB Secure OECD Secure IMF SDMX Providers SDMX Connectors SDMX client

4 4 Ragioni dei Connettori SDMX La prima fase di un tipico processo di calcolo consiste nellacquisizione dei dati oggetto dellanalisi. Questa operazione, specialmente nel caso di dati esterni allorganizzazione, è spesso molto inefficiente e implica operazioni manuali (spesso ripetitive) o complessi processi di replica su sistemi interni. Data Process Data Dissemination SDMX Provider Data Capture

5 5 Ragioni dei Connettori SDMX Luso combinato di SDMX e Web Services permette di semplificare notevolmente il passo di acquisizione di dati esterni. Si consideri, in particolare, lincremento di efficienza nel caso di processi ripetitivi Data Process Data Dissemination SDMX Provider Data Capture Esiste però una complessità molto alta nella gestione dei web services SDMX. I Connettori SDMX sono stati quindi sviluppati allo scopo di mascherare tutte le complessità dello standard e delle tecnologie web utilizzate

6 6 Larea Ricerca Economica della Banca dItalia Area Ricerca ISTAT ECBOECD IMF SDMX data providers Altri data providers DataStream, WorldBank, OpenData SDMX Altri protocolli Accesso nativo INFOSTAT BIPBISS PRISMA... SDMX Connettori INFOSTAT Connettori SDMX

7 7 Roadmap Supporto della versione 2.1 dello standard SDMX Sviluppo del client per i dati della Banca dei Regolamenti Internazionali Switch da protocollo SOAP a REST Potenziamento della estensibilità della libreria Java: pieno supporto di client sviluppati esternamente Rilascio dellinfrastruttura come Open Source, in un progetto indipendente o allinterno di una più generale infrastruttura SDMX

8 8 Grazie! attilio.mattiocco bancaditalia.it gianpaolo.lopez

9 9 Backup

10 10 Load RJSDMX Il package viene caricato nel workspace insieme alle sue dipendenze

11 11 Lista dei Data Providers disponibili I providers disponibili dipendono dalla versione del package e possono essere ottenuti con la funzione getDataProviders(). Il client java interno può essere usato come una libreria di API per lo sviluppo di ulteriori SDMX Providers

12 12 Il client ecb si connette ai web services forniti dallo Statistical Data Warehouse della BCE Creazione di un client per la BCE

13 13 I nomi da usare per la creazione dei vari client sono gli stessi ottenuti con la funzione getDataProviders() Creazione di un client per lOCSE

14 14 La funzione getDataFlows può essere usata con o senza il parametro pattern. Nel primo caso darà in output tutti i data flows disponibili nel provider. Lista dei data flows disponibili in un provider

15 15 Per ottenere le dimensioni di un data flow si può usare la funzione getDimensions() Analisi della struttura di un Data Flow

16 16 La funzione getTimeSeries() prende in input una stringa che identifica una time series, e la carica nel workspace, in un oggetto di tipo zoo Accesso a una time series

17 17 Il parametro id della funzione getTimeSeries è una sequnza di token. Il primo deve corrispondere al nome di un data flow (e.g. EXR). I successivi tokens devono corrispondere ai codici delle dimensioni dello stesso data flow. e.g.EXR.A.USD.EUR.SP00.A# EXR flow in ECB, tutte le dimensioni specificate REFSERIES.IT.PPPGDP.A# REFSERIES flow in OECD, come sopra Se non si vogliono specificare valori per alcune dimensioni, si possono usare delle wildcard. In ogni caso comunque il numero di tokens della quey deve corrispondere al numero delle dimensioni e.g.EXR.*.USD.EUR.SP00.A# La dimensione frequenza non è specificata REFSERIES.ITA.*.A# come sopra Se si vogliono specificare valori multipli per una dimensione si può usare il simbolo | (logical or): e.g.EXR.M|A.*.EUR.SP00.A# frequenza annuale e mensile, tutte le valute REFSERIES.ITA|AUS.*.A# tutti i subject, location Italy e Australia Query language semplificato per la getTimeSeries

18 18 Un esempio di query che ritorna una lista di time series Accesso a una lista di time series


Scaricare ppt "1 RJSDMX (Connettori SDMX per Software Statistici) Attilio Mattiocco Banca DItalia Area Ricerca Economica."

Presentazioni simili


Annunci Google