La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Ontologie e Thesauri Cos’è un Thesaurus

Presentazioni simili


Presentazione sul tema: "Ontologie e Thesauri Cos’è un Thesaurus"— Transcript della presentazione:

1 Ontologie e Thesauri Cos’è un Thesaurus
INFORMATICA PER LE DISCIPLINE UMANISTICHE Ontologie e Thesauri

2 Ontologie Insieme dei termini che, in un particolare ambito o dominio applicativo, denotano in modo univoco una particolare conoscenza e fra i quali non esiste ambiguità in quanto gli stessi sono condivisi ed accettati dall’intera comunità degli utenti dell’ ambito e/o dominio. INFORMATICA PER LE DISCIPLINE UMANISTICHE

3 È la mappa dei percorsi che portano da un oggetto ad un altro.
Ontologie È la mappa dei percorsi che portano da un oggetto ad un altro. Descrive i collegamenti esistenti tra oggetti e/o documenti. Presenta forti somiglianze con un thesaurus rispetto al quale oltre alle relazioni tra i termini viene fornita una ulteriore quantità di conoscenza concettuale. INFORMATICA PER LE DISCIPLINE UMANISTICHE

4 Ontologie: un esempio Problema: costruzione di una ontologia a supporto dell’archiviazione di documenti. Soluzione: costruzione di una struttura di concetti che descriva l’archiviazione e sia accettata e condivisa nell’ambito di riferimento. INFORMATICA PER LE DISCIPLINE UMANISTICHE

5 Determinazione del dominio/ambito Determinazione del vocabolario
Ontologie: un esempio Determinazione del dominio/ambito Determinazione del vocabolario Verifica della presenza di un thesaurus Determinazione del concetto principale/classe Determinazione degli attributi Eventuale disambiguazione INFORMATICA PER LE DISCIPLINE UMANISTICHE

6 Cos’è un Thesaurus Il Thesaurus è un vocabolario controllato nel quale il controllo semantico si esercita attraverso: l’inserimento del termine in un reticolo sistematico di sovra e sottordinati semantici; l’inserimento del termine in un reticolo di rapporti associativi su base semantica. l’univocità di significato del termine preferenziale è irrealizzabile al di fuori di un’area concettuale specifica. INFORMATICA PER LE DISCIPLINE UMANISTICHE

7 Vocabolario di un linguaggio di indicizzazione
Cos’è un Thesaurus ISO 2788/1986 Vocabolario di un linguaggio di indicizzazione controllato organizzato in maniera formalizzata in modo che le relazioni a priori tra i concetti siano rese esplicite. Finalità: funzioni di controllo della struttura semantica del linguaggio controllato finalizzate al recupero dell’informazione. INFORMATICA PER LE DISCIPLINE UMANISTICHE

8 Metodologie di sviluppo ISO 2788/96
Deduttivo: costruzione della terminologia partendo da uno schema che è dato dai termini indicanti le categorie generali e le loro specificazioni. Induttivo: rilevazione della terminologia usata nella indicizzazione libera di un campione significativo di documenti nonché nella domanda dell’utenza del servizio di documentazione INFORMATICA PER LE DISCIPLINE UMANISTICHE

9 Amplia il concetto di Documento definendolo “content object”
ANSI/NISO Z Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies Standard applicabile a thesauri tradizionali in ambito cartaceo e digitale; Amplia il concetto di Documento definendolo “content object” INFORMATICA PER LE DISCIPLINE UMANISTICHE

10 Non si occupa solo di Thesauri ma dei vocabolari controllati;
ANSI/NISO Z Content object primario: il documento in forma fisica (es: rivista, DVD) o in forma digitale; Content object secondario: metadati che descrivono il content object primario; Non si occupa solo di Thesauri ma dei vocabolari controllati; Segnala alcune soluzioni per l’interoperabilità; INFORMATICA PER LE DISCIPLINE UMANISTICHE

11 Vocabolario Uso di tecnologie Cos’è un Thesaurus
INFORMATICA PER LE DISCIPLINE UMANISTICHE Fini di indicizzazione 2. Aiuto all’utente per individuare i termini per formulare la domanda 3. Fonti di termini per altri vocabolari controllati 4. Vocabolari intermedi per la traduzione da un linguaggio ad un altro.

12 Simboli delle relazioni di un thesaurus: Inglese standard
Variabili formali Nota d’ambito SN Termine preferito USE Termine non preferito UF Top term TT Termine generico BT Termine generico (generico ) BTG Termine generico (partitivo) BTP Termine specifico NT Termine specifico (generico ) NTG Termine specifico (partitivo) NTP Simboli delle relazioni di un thesaurus: Inglese standard INFORMATICA PER LE DISCIPLINE UMANISTICHE

13 Cos’è un Thesaurus INFORMATICA PER LE DISCIPLINE UMANISTICHE

14 Cos’è un Thesaurus INFORMATICA PER LE DISCIPLINE UMANISTICHE

15 La strutturazione del campo
Classificazione tematico disciplinare: un campo viene diviso in sotto-temi che ne rappresentano ciascuno una specificazione. Classificazione per faccette: un campo viene tagliato sulla base di categorie fondamentali dette faccette che possono essere applicate a qualsiasi tema e/o settore. INFORMATICA PER LE DISCIPLINE UMANISTICHE

16 Classificazione tematico - disciplinare
Arti decorative     arte del cuoio         borsa, bulino, conciatura, cuoio grezzo, sella, sellaio     arte del legno         cornice, doratura, ebanista, intaglio, legno pregiato     arte vetraria         artigiano del vetro, cristallo, lampadario, molatura ecc. INFORMATICA PER LE DISCIPLINE UMANISTICHE

17 Classificazione per faccette
Arti decorative: Tipologie -     borsa, bulino, conciatura, cuoio grezzo, sella, sellaio - Materiali -     cristallo, cuoio grezzo, legno pregiato - Strumenti -     bulino, traforo, ecc. - Persone -     artigiano del vetro, ebanista, sellaio, ecc. - Tecniche -     conciatura, doratura, molatura, ecc. - Prodotti -     cornice, borsa, lampadario, ecc. INFORMATICA PER LE DISCIPLINE UMANISTICHE

18 Limiti della classificazione
CLASSIFICAZIONE TEMATICA Raccolta di termini eterogenei all’interno dei sottocampi senza categorizzarli e privi di informazioni semantiche. CLASSIFICAZIONE PER FACCETTE Una suddivisione esclusiva per faccette in un campo complesso fà perdere articolazioni e specificazioni concretamente presenti nell’esperienza dell’utente e quindi importanti. INFORMATICA PER LE DISCIPLINE UMANISTICHE

19 Le relazioni semantiche
Equivalenza Use-UF termini sinonimi ai fini dell’indicizzazione es: educazione linguistica/insegnamento della lingua termini quasi sinonimi trattati come sinonimi es: platino           USE       oro                USE metalli nobili       argento         USE Metalli nobili     UF      platino                                 oro                                  argento INFORMATICA PER LE DISCIPLINE UMANISTICHE

20 Le relazioni semantiche
Gerarchiche Genere – specie         Rilievo         NT Bassorilievo Parte – tutto         Corpo Umano         NT Testa Esemplificative Illustratore NT Rossi Francesco (NT = narrower term – termine più specifico) INFORMATICA PER LE DISCIPLINE UMANISTICHE

21 Le relazioni semantiche
Note d’ambito Selezionano tra i significati di un termine polisemico quello valido nello specifico contesto. es:     TONDINO (Thesaurus archeologia)            Motivo decorativo architettonico e non ferro da costruzione (sn scope note – nota d’ambito) INFORMATICA PER LE DISCIPLINE UMANISTICHE

22 Thesaurus Monolingua e Multilingue
Lingua originale delle fonti e finalità di utilizzo del Thesaurus spingono alla creazione del monolingua Internazionalizzazione del Thesaurus fanno optare per la creazione del multilingue INFORMATICA PER LE DISCIPLINE UMANISTICHE

23 Raccolta e selezione dei termini Loro selezione e normalizzazione
Thesaurus Ex Novo Raccolta e selezione dei termini Loro selezione e normalizzazione Costruzione delle relazioni fondamentali Organizzazione delle forme di presentazione Sperimentazione Validazione e pubblicazione INFORMATICA PER LE DISCIPLINE UMANISTICHE


Scaricare ppt "Ontologie e Thesauri Cos’è un Thesaurus"

Presentazioni simili


Annunci Google