Maria Teresa Biagetti Convegno AIB CILW 2016 La rinascita delle risorse dell’informazione: granularità, interoperabilità e integrazione dei dati Roma 21 ottobre 2016 Ontologie per l’interoperabilità semantica tra fonti eterogenee del patrimonio culturale Maria Teresa Biagetti Dipartimento di Scienze documentarie linguistico-filologiche e geografiche Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
musei - biblioteche - archivi Maria Teresa Biagetti Accesso integrato alle informazioni e agli oggetti digitali presenti in collezioni eterogenee appartenenti a musei - biblioteche - archivi I MUSEI E IL PATRIMONIO CULTURALE ICOM INTERNATIONAL COUNCIL OF MUSEUMS http://icom.museum/ (20.000 musei e 35.000 esperti del settore - dati del 2016) Patrimonio culturale tangibile e intangibile: I musei e il patrimonio intangibile (tradizioni orali, performing arts) nella definizione di ICOM: “Museums and Intangible Cultural Heritage The International Council of Museums serves society and its development and is committed to guaranteeing the protection, conservation and transfer of cultural goods. Museums can contribute significantly to the protection of intangible cultural heritage by means of recordings and transcriptions.” http://icom.museum/programmes/intangible-heritage/ UNESCO - Convention for the Safeguarding of the Intangible Cultural Heritage (2003) http://www.unesco.org/culture/ich/en/1com Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Maria Teresa Biagetti Le ontologie sono gli strumenti fondamentali per facilitare l’accesso alle informazioni e agli oggetti digitali che sono gestiti da sistemi diversi, ciascuno dei quali presenta modalità di descrizione e di organizzazione dei dati sue proprie. ICOM – International council of museums http://icom.museum/ e CIDOC International Committee for Documentation http://network.icom.museum/cidoc/ hanno realizzato CIDOC-CRM Conceptual Reference Model standard ISO:21127:2006 (revisione 2014) ICOM-CIDOC. Definition of the CIDOC Conceptual Reference Model Version 6.2.1 October 2015 http://old.cidoc-crm.org/docs/cidoc_crm_version_6.2.1.pdf CIDOC-CRM è una ontologia formale utilizzata a livello internazionale il cui scopo è rendere possibile lo scambio e l’integrazione delle descrizioni, delle informazioni e della documentazione per la ricerca tra fonti eterogenee del patrimonio culturale: collezioni museali, siti archeologici, monumenti, e documentazione scientifica conservata negli archivi e nelle biblioteche. Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Ontology Based Data Access (OBDA) Gli OBDA systems prevedono: Negli ultimi anni si è imposto un nuovo paradigma che permette l’integrazione di dati strutturati provenienti da fonti diverse: Ontology Based Data Access (OBDA) Gli OBDA systems prevedono: 1) Una ontologia, cioè la concettualizzazione specifica di un campo d’interesse appositamente creata 2) fonti di dati strutturati 3) un sistema per mappare i dati attraverso le classi e le proprietà dell’ontologia. Nel caso di singoli progetti per la valorizzazione del patrimonio culturale, la creazione di specifiche ontologie necessita comunque di un modello concettuale unico di riferimento, e può trarre beneficio dall’uso di una ontologia generale dedicata a questo settore, come CIDOC-CRM. Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Ontologie formali scritte in un linguaggio formale Maria Teresa Biagetti Ontologie formali scritte in un linguaggio formale Ontologie di dominio e Upper ontologies (Top-level) "An ontology is a formal, explicit specification of shared conceptualization" (Rudi Studer, V. Richard Benjamins, Dieter Fensel. Knowledge Engineering: Principles and Methods, "Data & Knowledge Engineering", 25 (1998), n. 1-2, p. 161-198: p. 184.) Rappresentazione della conoscenza Description Logics First-order Logic Description Logics subsumption instance consistency OWL Web Ontology Language Overview. (W3C Recommendation 10 February 2004) http://www.w3.org/TR/owl-features/ OWL 2 Web Ontology Language Document Overview (W3C Recommendation 27 October 2009) http://www.w3.org/TR/owl2-overview/ revisione nel 2012. Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
CIDOC CRM Conceptual Reference Model Maria Teresa Biagetti CIDOC CRM Conceptual Reference Model ICOM-CIDOC. Definition of the CIDOC Conceptual Reference Model. Produced by the ICOM/CIDOC Documentation Standards Group, Continued by the CIDOC CRM Special Interest Group Version 6.2.1 October 2015. Current Main Editors: Patrick Le Boeuf, Martin Doerr, Christian Emil Ore, Stephen Stead. Versione 6.2.1 ottobre 2015: 94 classi e 168 proprietà definisce la semantica che sottostà agli schemi e alle strutture documentali usate nel patrimonio culturale permette lo scambio e l’integrazione delle informazioni tra fonti eterogenee del patrimonio culturale rende possibile l’interoperabilità semantica permette di organizzare la conoscenza nei musei – e l’integrazione della documentazione scientifica in campo archeologico – e si pone come modello per formulare le “queries” da rivolgere a sistemi di risorse integrate è convertibile in formati leggibili dalle macchine come RDF Schema e OWL offre versioni equivalenti codificate in OWL2 (2009) e in RDFS, con le definizioni delle classi e delle proprietà in diverse lingue ( 2012). Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
CIDOC CRM Conceptual Reference Model e Linked open data Nel Web dei dati le ontologie sono impiegate per esprimere le relazioni semanticamente qualificate e tipizzate su cui si fonda il collegamento tra i dati. L’uso delle ontologie permette che i dati siano semanticamente interoperabili. Le ontologie più usate: Bibliographic ontology (descrive le entità e le proprietà usate nelle citazioni bibliografiche), FOAF descrive le persone e le relazioni tra persone o gruppi) Lo schema di metadati Dublin Core Lo standard SKOS Simple Knowledge Organization System (Recommendation di Semantic Web Deployment Working Group (W3C) http://www.w3.org/TR/2009/REC-skos-reference-20090818/) Nella realizzazione di LOD nell’ambito del patrimonio culturale l’ontologia CIDOC-CRM può essere utilizzata per i link di relazione, interlinking. Le relazioni più significative riguardano: Participation; Presence in an Event; Influence; Aboutness; Association. Oggi CIDOC-CRM è utilizzata nel progetto Research Space, realizzato da British Museum e Andrew W. Mellon Foundation per integrare dati eterogenei del patrimonio culturale http://www.researchspace.org/home e creare LOD con relazioni semantiche più ricche attraverso il mapping. Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Caratteristiche dell’ontologia CIDOC CRM Conceptual Reference Model Multiple inheritance: una classe può avere più di una Superclasse Es.: Person è sottoclasse sia di Actor che di Biological object, ed eredita le proprietà di entrambe. Multiple Instantiation: una INSTANCE di una Classe può essere allo stesso tempo INSTANCE di altre Classi. Due categorie per le entità: Endurants: entità che “sono” nel tempo. Perdurants: entità che “divengono” nel tempo. (Categorie usate nell’ontologia fondazionale DOLCE: ISTC CNR (Istituto di Scienze cognitive e tecnologia) di Trento http://www.loa.istc.cnr.it/index_ita.html). Disgiunzione delle Classi: es.: E2 Temporal Entities è disgiunta da E77 Persistent Item. Mónotonic reasoning: la Logica mónotona prevede che i costrutti esistenti in CRM e le deduzioni realizzate rimangano sempre valide e ben formate anche se vengono aggiunti nuovi costrutti usando delle “estensioni” alle classi di CRM. Primitivi: la maggior parte dei concetti (Classi) in CRM sono Primitivi, il cui significato non deve essere dedotto logicamente da altri concetti. Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Roma 21 ottobre 2016 - Biblioteca nazionale centrale Alcune Proprietà di CIDOC-CRM e le relative Entità Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Roma 21 ottobre 2016 - Biblioteca nazionale centrale Gli Eventi (i Processi, i Periodi storici, ecc.) raggruppati nella classe astratta Temporal Entities, sono direttamente connessi allo SPAZIO e al TEMPO. Gli Actors (Persone) sono correlati agli oggetti fisici e agli oggetti concettuali attraverso Temporal Entities. Le instances delle Classi sono identificate attraverso Appellations (nomi o identificativi convenzionali). Fonte dell’immagine: M. Doerr, C.E.Ore, S. Stead, 26° International Conference on Conceptual Modeling, 2007 Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Roma 21 ottobre 2016 - Biblioteca nazionale centrale Le instances delle Classi (tutte le cose che appartengono all’universo di discorso di CRM) possono essere classificate con l'uso di categorie (Types) utilizzando la Classe E55 Type e la Proprietà P2 has type (is type of). Ogni Classe di CRM (eccetto E59 Primitive values) eredita la Proprietà P2 has type (is type of) e ciò permette di classificare le instances di ciascuna classe secondo vari livelli di dettaglio. La Classe E55 Type permette di utilizzare concetti rappresentati dai termini presenti in thesauri specifici per i singoli domini e in ontologie di dominio per caratterizzare le instances delle classi di CRM. Queste possono essere classificate in gerarchie usando la Proprietà P 127. Proprietà P127 has broader term (has narrower term). Vocabolari di termini controllati, thesauri e ontologie di dominio possono essere fonti (via SKOS) dei termini da usare per rappresentare e classificare le instances di tutte le classi che ricadono nell’universo di discorso di CIDOC. Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Roma 21 ottobre 2016 - Biblioteca nazionale centrale Esempio di rappresentazione di un evento cui è legata l’approvazione di un documento. “A photo of an event – the Yalta Conference http://old.cidoccrm.org/crm_core/core_examples/yalta.htm” Foto: conferenza di Yalta, 1945 Documento: Yalta Agreement, 1945 La fotografia è conservata presso l’Archivio Bettmann a New York. Ritrae Churchill, Roosevelt e Stalin. Il documento Yalta Agreement è conservato da USA State Department. Fonte dell’immagine: https://en.wikipedia.org/wiki/Yalta_Conference Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Roma 21 ottobre 2016 - Biblioteca nazionale centrale Esempio realizzato da Patrick Sinclair: http://old.cidoc-crm.org/crm_core/core_examples/yalta.htm Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Esempi di utilizzazione di CIDOC-CRM CLAROS. http://clarosnet.org/XDB/ASP/clarosHome/ BRITISH MUSEUM Collection online http://www.britishmuseum.org/ Progetti coordinati da ICCU volti a facilitare la partecipazione a Europeana: Piattaforma software MINT e standard LIDO – Lightweight Information Describing Objects Fornitura a Europeana dei record di Internetculturale, tramite CulturaItalia http://www.culturaitalia.it/ Terminology Management Platform (TMP) per la mappatura semi-automatica di terminologie multilingue Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale
Grazie per l’attenzione Maria Teresa Biagetti Sapienza Università di Roma Dipartimento di Scienze documentarie, linguistico-filologiche e geografiche mariateresa.biagetti@uniroma1.it https://sites.google.com/a/uniroma1.it/mariateresabiagetti/ http://www.lettere.uniroma1.it/users/mariateresa-biagetti https://uniroma1.academia.edu/MariateresaBiagetti Convegno AIB CILW 2016 Roma 21 ottobre 2016 - Biblioteca nazionale centrale