Ontologie e Thesauri Cos’è un Thesaurus INFORMATICA PER LE DISCIPLINE UMANISTICHE Ontologie e Thesauri
Ontologie Insieme dei termini che, in un particolare ambito o dominio applicativo, denotano in modo univoco una particolare conoscenza e fra i quali non esiste ambiguità in quanto gli stessi sono condivisi ed accettati dall’intera comunità degli utenti dell’ ambito e/o dominio. INFORMATICA PER LE DISCIPLINE UMANISTICHE
È la mappa dei percorsi che portano da un oggetto ad un altro. Ontologie È la mappa dei percorsi che portano da un oggetto ad un altro. Descrive i collegamenti esistenti tra oggetti e/o documenti. Presenta forti somiglianze con un thesaurus rispetto al quale oltre alle relazioni tra i termini viene fornita una ulteriore quantità di conoscenza concettuale. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Ontologie: un esempio Problema: costruzione di una ontologia a supporto dell’archiviazione di documenti. Soluzione: costruzione di una struttura di concetti che descriva l’archiviazione e sia accettata e condivisa nell’ambito di riferimento. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Determinazione del dominio/ambito Determinazione del vocabolario Ontologie: un esempio Determinazione del dominio/ambito Determinazione del vocabolario Verifica della presenza di un thesaurus Determinazione del concetto principale/classe Determinazione degli attributi Eventuale disambiguazione INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus Il Thesaurus è un vocabolario controllato nel quale il controllo semantico si esercita attraverso: l’inserimento del termine in un reticolo sistematico di sovra e sottordinati semantici; l’inserimento del termine in un reticolo di rapporti associativi su base semantica. l’univocità di significato del termine preferenziale è irrealizzabile al di fuori di un’area concettuale specifica. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Vocabolario di un linguaggio di indicizzazione Cos’è un Thesaurus ISO 2788/1986 Vocabolario di un linguaggio di indicizzazione controllato organizzato in maniera formalizzata in modo che le relazioni a priori tra i concetti siano rese esplicite. Finalità: funzioni di controllo della struttura semantica del linguaggio controllato finalizzate al recupero dell’informazione. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Metodologie di sviluppo ISO 2788/96 Deduttivo: costruzione della terminologia partendo da uno schema che è dato dai termini indicanti le categorie generali e le loro specificazioni. Induttivo: rilevazione della terminologia usata nella indicizzazione libera di un campione significativo di documenti nonché nella domanda dell’utenza del servizio di documentazione INFORMATICA PER LE DISCIPLINE UMANISTICHE
Amplia il concetto di Documento definendolo “content object” ANSI/NISO Z39.19-2005 Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies Standard applicabile a thesauri tradizionali in ambito cartaceo e digitale; Amplia il concetto di Documento definendolo “content object” INFORMATICA PER LE DISCIPLINE UMANISTICHE
Non si occupa solo di Thesauri ma dei vocabolari controllati; ANSI/NISO Z39.19-2005 Content object primario: il documento in forma fisica (es: rivista, DVD) o in forma digitale; Content object secondario: metadati che descrivono il content object primario; Non si occupa solo di Thesauri ma dei vocabolari controllati; Segnala alcune soluzioni per l’interoperabilità; INFORMATICA PER LE DISCIPLINE UMANISTICHE
Vocabolario Uso di tecnologie Cos’è un Thesaurus INFORMATICA PER LE DISCIPLINE UMANISTICHE Fini di indicizzazione 2. Aiuto all’utente per individuare i termini per formulare la domanda 3. Fonti di termini per altri vocabolari controllati 4. Vocabolari intermedi per la traduzione da un linguaggio ad un altro.
Simboli delle relazioni di un thesaurus: Inglese standard Variabili formali Nota d’ambito SN Termine preferito USE Termine non preferito UF Top term TT Termine generico BT Termine generico (generico ) BTG Termine generico (partitivo) BTP Termine specifico NT Termine specifico (generico ) NTG Termine specifico (partitivo) NTP Simboli delle relazioni di un thesaurus: Inglese standard INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus INFORMATICA PER LE DISCIPLINE UMANISTICHE
La strutturazione del campo Classificazione tematico disciplinare: un campo viene diviso in sotto-temi che ne rappresentano ciascuno una specificazione. Classificazione per faccette: un campo viene tagliato sulla base di categorie fondamentali dette faccette che possono essere applicate a qualsiasi tema e/o settore. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Classificazione tematico - disciplinare Arti decorative arte del cuoio borsa, bulino, conciatura, cuoio grezzo, sella, sellaio arte del legno cornice, doratura, ebanista, intaglio, legno pregiato arte vetraria artigiano del vetro, cristallo, lampadario, molatura ecc. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Classificazione per faccette Arti decorative: Tipologie - borsa, bulino, conciatura, cuoio grezzo, sella, sellaio - Materiali - cristallo, cuoio grezzo, legno pregiato - Strumenti - bulino, traforo, ecc. - Persone - artigiano del vetro, ebanista, sellaio, ecc. - Tecniche - conciatura, doratura, molatura, ecc. - Prodotti - cornice, borsa, lampadario, ecc. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Limiti della classificazione CLASSIFICAZIONE TEMATICA Raccolta di termini eterogenei all’interno dei sottocampi senza categorizzarli e privi di informazioni semantiche. CLASSIFICAZIONE PER FACCETTE Una suddivisione esclusiva per faccette in un campo complesso fà perdere articolazioni e specificazioni concretamente presenti nell’esperienza dell’utente e quindi importanti. INFORMATICA PER LE DISCIPLINE UMANISTICHE
Le relazioni semantiche Equivalenza Use-UF termini sinonimi ai fini dell’indicizzazione es: educazione linguistica/insegnamento della lingua termini quasi sinonimi trattati come sinonimi es: platino USE oro USE metalli nobili argento USE Metalli nobili UF platino oro argento INFORMATICA PER LE DISCIPLINE UMANISTICHE
Le relazioni semantiche Gerarchiche Genere – specie Rilievo NT Bassorilievo Parte – tutto Corpo Umano NT Testa Esemplificative Illustratore NT Rossi Francesco (NT = narrower term – termine più specifico) INFORMATICA PER LE DISCIPLINE UMANISTICHE
Le relazioni semantiche Note d’ambito Selezionano tra i significati di un termine polisemico quello valido nello specifico contesto. es: TONDINO (Thesaurus archeologia) Motivo decorativo architettonico e non ferro da costruzione (sn scope note – nota d’ambito) INFORMATICA PER LE DISCIPLINE UMANISTICHE
Thesaurus Monolingua e Multilingue Lingua originale delle fonti e finalità di utilizzo del Thesaurus spingono alla creazione del monolingua Internazionalizzazione del Thesaurus fanno optare per la creazione del multilingue INFORMATICA PER LE DISCIPLINE UMANISTICHE
Raccolta e selezione dei termini Loro selezione e normalizzazione Thesaurus Ex Novo Raccolta e selezione dei termini Loro selezione e normalizzazione Costruzione delle relazioni fondamentali Organizzazione delle forme di presentazione Sperimentazione Validazione e pubblicazione INFORMATICA PER LE DISCIPLINE UMANISTICHE