Università degli Studi di Milano Dati FAIR Findable, Accessible, Interoperable, Reusable: dalla teoria alla pratica Paola Galimberti Università degli Studi di Milano paola.galimberti@unimi.it
Solo un po’ di teoria (vecchie e nuove interpretazioni) ---------------------------------- In molte discipline quando si fa ricerca si producono enormi quantità di dati a sostegno di una determinata teoria I dati che non funzionano in questo contesto vengono eliminati, e non sono resi disponibili per altri scienziati. In questa interpretazione dei dati essi sono la prova della plausibilità di una ipotesi formulata ex ante, la certificazione di una nuova scoperta. Nel nuovo approccio ai dati, essi vengono posti come risultato di una ricerca con un proprio valore scientifico che va oltre la conferma di una determinata teoria e che ne permette interpretazioni diverse a seconda del background dello scienziato che li analizza (Leonelli 2018)
Di cosa stiamo parlando? World of data Raw data (primary data) Di cosa stiamo parlando? Processed Data Negative Results Processed Data Processed Data Inconclusive Results Processed Data Processed Data Processed Data Positive results Shared Data Positive results Shared Data Pub. Data Shared Data Pub. Data Released Data OA Ensuring legal and ethical compliance is key issue in this context
I dati in un grande ateneo ---------------------------------- Quali dati? Quanti dati? In quali formati? Sono ricercabili? Quale tipo di apertura? Chi è il titolare dei dati? Dove vengono archiviati? E’ capitato che si siano persi dei dati? E’ prevista una conservazione a lungo termine?
Perché i dati della ricerca ci interessano? ---------------------------------- Research integrity Corretta attribuzione delle responsabilità (chi ha fatto cosa e quando) Riproducibilità Riutilizzo
Perché i dati della ricerca ci interessano? ---------------------------------- A livello europeo è stato (da tempo) dato grande rilievo al tema dei dati della ricerca Let me underline one initiative that I am supporting to make digital technology work for governance and transparency: by opening up public data. In the digital age, data takes on a whole new value, and with new technology we can do great things with it. Opening it up is not just good for transparency, it also stimulates great web content, and provides the fuel for a future economy. That's why I say that data is the new oil for the digital age. Neelie Kroes (Vice-President of the European Commission responsible for the Digital Agenda) Bratislava 5 maggio 2012
Perché i dati della ricerca ci interessano? ---------------------------------- A livello europeo è stato (da tempo) dato grande rilievo al tema dei dati della ricerca In H2020 è previsto l’accesso aperto ai dati della ricerca con la possibilità di opt out
Come si mobilitano i dati? ---------------------------------- I dati, per poter essere conservati, condivisi, riutilizzati, devono essere trattati in maniera standard e avere determinate caratteristiche. Devono essere FAIR
---------------------------------- Findable ---------------------------------- F1. Utilizzo di Identificativi univoci e persistenti F2. Uso di un set di metadati arricchito F3. I metadati comprendono anche l’identificativo univoco dei dati che descrivono F4. (meta)dati vengono registrati o indicizzati in una risorsa ricercabile
---------------------------------- Accessible ---------------------------------- A1. I (meta)dati sono recuperabili attraverso identificatori utilizzando un protocollo di comunicazione standard A1.1.Il protocollo è aperto, libero e implementabile ovunque A1.2 Il protocollo permette la autenticazione e ove necessario procedure di autorizzazione A2. I metadati sono sempre accessibili anche quando i dati non lo sono
---------------------------------- Interoperable ---------------------------------- I1. I (meta)dati usano un linguaggio per la rappresentazione della conoscenza: formale, accessibile, condiviso e applicabile ad ampio spettro I2 I(meta)dati usano vocabolari the seguono I principi FAIR I3. I (meta)dati comprendono il link qualificato ad altri metadati
---------------------------------- Reusable ---------------------------------- R1. I (meta)dati sono descritti attraverso una pluralità di attributi R1.1. I (meta)dati sono rilasciati con un licenza di utilizzo chiara R1.2. Ai (meta)dati è associata la definizione chiara della provenienza R1.3. I (meta)dati seguono gli standard rilevanti per la comunità di riferimento
Alcuni punti essenziali ---------------------------------- L’istituzione deve fornire supporto nella gestione dei dati Discipline diverse hanno un approccio diverso ai dati (pluralismo scientifico legato alle metodologie specializzate elaborate per poter studiare e comprendere le proprietà uniche dei fenomeni oggetto di studio)
---------------------------------- L’istituzione deve fornire supporto nella gestione dei dati ---------------------------------- Contestualizzazione: Questionario/intervista su Quali dati, quanti dati, in che formati, che tipo di conservazione, data loss, che tipo di supporto è richiesto, che tipo di apertura/diffusione viene data Assistenza nella compilazione di DMPs (predisposizione di una struttura anche non fissa per il supporto alla compilazione dei piani: ict, aspetti legali, questioni etiche, metadati ecc) Creazione di un repository che faciliti la gestione dei dati secondo i principi FAIR Definizione di politiche chiare da condividere con tutti i dipartimenti su research data management: ruoli e responsabilità, tempi di archiviazione
Discipline diverse hanno approcci diversi ai dati ---------------------------------- Il tema della Provenance: Molte discipline utilizzano dati prodotti da altri (si pensi ad esempio alla statistica) Quanto sono effettivamente riutilizzabili i dati?
Da: Peter Wittenburg Max Planck Computing & Data Facility (Presentazione presso ERC )
Accessibilità/Riusabilità dei dati ---------------------------------- La conservazione dei dati ha un costo. Nella scelta di cosa conservare e quanto a lungo è necessario considerare questo costo. https://www.edugroepen.nl/sites/RDM_platform/Financieel1/Data%20Management%20Costs.aspx
Un cambiamento culturale ---------------------------------- I principi FAIR possono (devono?) essere seguiti anche se non si prevede apertura o condivisione dei dati Il supporto delle istituzioni dal punto di vista delle infrastrutture, legale,etico, organizzativo è fondamentale. La cosa risulta difficile nella misura in cui a livello nazionale il silenzio rispetto a un tema così importante a livello europeo è assordante.
Un cambiamento culturale ---------------------------------- 2016
---------------------------------- Qualcosa si muove… ---------------------------------- In assenza di politiche chiare livello nazionale si sono sviluppate iniziative autonome che nascono da esigenze comuni (di strumenti, politiche, infrastrutture, informazione, formazione) IOSSG – è un gruppo autoconvocato e operativo di esperti provenienti da diversi ambiti e da diversie orgnizzazioni (Open AIRE, Università di Milano, Università Ca' Foscari Venezia, Politecnico di Milano, Università di Torino, Università di Bologna, Università di Trento, Università di Parma, Università di Padova, Università di Vienna, Università di Trieste) che si propone di sviluppare strumenti utili da condividere con gli altri atenei (attualmente modello di policy e modello di DMP) Open AIRE, IOSSG e RDA Italia organizzano una serie di webinar sulle tematiche della scienza aperta (con un focus particolare sui dati)
Dalle politiche ai fatti - Milano ---------------------------------- L’università di Milano si è dotata di una politica su Research data management La policy nasce come conseguenza di una cinquantina di interviste svolte nei dipartimenti per capire lo stato del trattamento dei dati nell’Ateneo Un supporto fondamentale è stato dato da IOSSG e dalla collaborazione con l’Università di Vienna Il modello di policy su RDM elaborato è presente sul sito di IOSSG ed è stato adottato dalla CRUI
Dalle politiche ai fatti - Milano ---------------------------------- L’università di Milano ha avviato una sperimentazione con Dataverse per la gestione e il deposito dei dati secondo i principi FAIR Nei piani triennali di alcuni Dipartimenti ci sono obiettivi espliciti sulla gestione e conservazione dei dati secondo i principi FAIR
Dalle politiche ai fatti - Venezia ---------------------------------- L'Ateneo, nell'applicazione della normativa, ha identificato come organo competente il Data Monitoring Board, cui i ricercatori devono sottoporre un Data Management Plan (DMP) relativo alla raccolta e produzione dei dati della ricerca e alla metodologia con cui verranno gestiti. I Data Management Plans sono una componente indispensabile del ciclo di vita dei dati, perché definiscono quali azioni sono necessarie per garantire l'accessibilità durante ogni fase del progetto. I DMP seguono i principali FAIR (Findable, Accessible, Interoperable, Reusable) per assicurare il massimo di efficienza, uso e riutilizzo dei dati.
Dalle politiche ai fatti - Bologna ----------------------------------
Dalle politiche ai fatti ---------------------------------- Anche se il contesto non aiuta gli atenei, trovandosi nella necessità di rispondere alle richieste dei finanziatori hanno cominciato ad organizzarsi Non si parte da zero e molto si può apprendere dalle iniziative in atto sia da noi che in Europa Il sito oa Italia raccoglie una serie (aggiornata) di risorse su RDM
Grazie per l’attenzione