La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Riproduzione digitale di fonti manoscritte (metadati descrittivi e reperimento delle risorse elettroniche) CORSO DI PERFEZIONAMENTO SAPERI STORICI E NUOVE.

Presentazioni simili


Presentazione sul tema: "Riproduzione digitale di fonti manoscritte (metadati descrittivi e reperimento delle risorse elettroniche) CORSO DI PERFEZIONAMENTO SAPERI STORICI E NUOVE."— Transcript della presentazione:

1 Riproduzione digitale di fonti manoscritte (metadati descrittivi e reperimento delle risorse elettroniche) CORSO DI PERFEZIONAMENTO SAPERI STORICI E NUOVE TECNOLOGIE (Napoli, 6 giugno 2006) Paul Gabriele Weston

2 Argomenti Breve introduzione ai metadati Standard per la codifica Interoperabilità Funzioni dei service provider Conclusioni

3 Cosa sono i metadati? Informazione strutturata sulle risorse termine di nuovo conio utilizzato per indicare informazioni di tipo referenziale applicate a risorse elettroniche, simili per funzione alle notizie create nel tempo per rappresentare risorse tradizionali schede di catalogo, citazioni bibliografiche, registri inventariali, ecc. Descrivono specifici file, singoli oggetti o collezioni complesse Archiviati a parte o facenti parte integrante della risorsa alla quale si riferiscono

4 In particolare, i metadati sono … informazioni elettroniche utilizzabili direttamente dal computer dotate di una struttura e di una semantica definite che descrivono una risorsa

5 I metadati agevolano … lidentificazione delle risorse elettroniche la loro autenticazione la conservazione del contesto di origine la ricerca delle risorse laccesso alle risorse raggiungibili via web la raccolta delle informazioni (metadata harvesting) utili allallestimento di dispositivi di mediazione e di conservazione I metadati costituiscono il valore aggiunto della risorsa elettronica

6 Metadati nativi e aggiuntivi I metadati nativi si trovano in un documento fin dal momento della sua creazione, in quanto vengono creati dallautore del documento o dal software in modo automatico supportano il reperimento della risorsa comprendono il nome del creatore del documento, il titolo, la data I metadati aggiuntivi vengono creati da soggetti terzi per incrementare il valore della risorsa supportano la selezione della risorsa comprendono termini di vocabolario controllato, la descrizione, informazioni sui diritti

7 Metadati differenti per funzioni diverse descrittivi descrizione della risorsa – autore, titolo, soggetto amministrativi gestione e amministrazione della risorsa – versione, fonti degli originali, date di creazione, modifica, ecc. strutturali organizzazione interna della risorsa – identificativi univoci, numeri di pagina, caratteristiche peculiari (indice dei contenuti, indici, ecc.) tecnici conservazione della risorsa nel medio e nel lungo periodo – formati dei file, apparecchiature per il trattamento digitale, formato di compressione, componenti hardware e software relativi ai diritti (rights management) fruizione e controllo della risorsa e dei suoi contenuti – proprietà intellettuale e commerciale, restrizione alluso, ecc.

8 La documentazione del contesto contenuto identifica la natura della risorsa e ne rappresenta il contenuto relazioni evidenzia le relazioni con altri oggetti struttura comprende concetti quali inizio e fine del documento, capitoli, articoli, ecc. ai fini di comunicarne la gerarchia e lorganizzazione dei dati e delle componenti della risorsa

9 I metadati supportano …. la gestione delle risorse digitali linteroperabilità delle risorse digitali la conservazione delle risorse digitali la reperibilità delle risorse digitali la gestione dei diritti lintegrità e lautenticazione la sostenibilità

10 Standard per la codifica informazione globale applicazioni generaliste e specialistiche soggetti promotori e siti istituzionali standard de iure e de facto

11 Standard internazionali il conseguimento della standardizzazione è la conseguenza dellesistenza di accordi e protocolli internazionali pubblicati come standard internazionali

12 Il formato MARC MAchine-Readable Cataloging notizia catalografica che viene automaticamente elaborata dal computer, il quale è in grado di riconoscere lidentità delle diverse componenti della notizia e di trattarle di conseguenza notizia catalografica = record bibliografico = metadati criteri di compilazione determinati dalle normative catalografiche (ISBD, RICA, AACR2, ecc.) permette a ricerca elettronica del catalogo (opac)

13 Il formato MARC nel tempo Personalizzazioni: USMARC, LCMARC, UKMARC, INTERMARC, ecc. Scambio internazionale dei dati: UNIMARC Evoluzioni del formato: da LCMARC a MARC 21 MARCXML (ambiente XML, sviluppato da LC) MODS (semplificazione e razionalizzazione, finalizzato alla realizzazione delle biblioteche digitali)

14 Struttura del record MARC campi (autore, titolo, pubblicazione, ecc.) identificati da un codice numerico di tre cifre (tag) 100 1# $a Guerrini, Mauro [responsabilità principale, persona fisica] alcuni campi sono suddivisi in sottocampi campo [area] della pubblicazione, distribuzione, ecc. (identificato dal codice 260) include i sottocampi [elementi] luogo, nome delleditore, data di pubblicazione) 260 ## $a Milano : $b Editrice Bibliografica, $c 2005

15 Esempio di record MARC #$a $a $c 250##$a 260##$a $b $c 300##$a $b $c 490##$a $v 650#1$a Guerrini, Mauro. Catalogazione / Mauro Guerrini. 1 ed. Roma : Associazione Italiana Biblioteche, c p. : ill. ; 17 cm Enciclopedia tascabile ; 16 Catalogazione bibliografica

16 MARCXML il Network Development and MARC Standards Office della Library of Congress ha sviluppato una struttura utile ad utilizzare dati MARC in ambiente XML la struttura è flessibile ed estensibile per ampliare il numero e la varietà delle applicazioni, ma non vengono meno i caratteri di specificità del MARC lelaborazione ha incluso lo sviluppo di schemi, fogli di stile e dispositivi software, accessibili e scaricabili attraverso il sito

17 record MARCXML

18 Conversione tra schemi di metadati è il risultato di una mappatura, cioè del procedimento con il quale vengono individuate le corrispondenze sintattiche e semantiche tra singoli elementi di due schemi di metadati lambiente XML in funzione del quale è stato sviluppato MARCXML si presta bene alla conversione tra schemi di metadati sono stati sviluppati dei dispositivi software per semplificare le procedure

19 Conversione a Dublin Core

20 Presentazione dei dati presentazione è la visualizzazione e/o la marcatura dei dati MARC in una forma leggibile presentazione HTML …

21 Record visualizzati in HTML

22 XML per la codifica dei metadati eXtensible Markup Language XML serve per attribuire una struttura ai dati esempi di dati strutturati sono i fogli di calcolo, le transazioni fininziarie, I disegni tecnici si definisce con XML un insieme di regole per produrre formati di testo che diano una struttura ai dati XML non è un linguaggio di programmazione e non richiede particolari competenze informatiche XML agevola la produzione e la lettura di dati da parte del computer e assicura che la struttura di tali dati sia non ambigua XML si presenta non dissimile da HTML è comune luso di marcatori (tags, termini racchiusi tra parentesi uncinate) e di attributi in HTML viene specificato il significato di ogni marcatore e attributo e talvolta anche la resa grafica in XML i marcatori servono solo a segmentare i dati, la cui interpretazione è affidata allapplicazione

23 XML per la codifica dei metadati XML consiste di testo, ma non è finalizzato alla lettura i dati sono archiviati in formato testo, per cui possono essere letti mediante un text editor in caso di compilazioni errate, lapplicazione si ferma e genera un messaggio di errore XML è modulare il formato di un nuovo documento può essere prodotto combinando e riutilizzando altri formati per evitare di assegnare lo stesso nome ad elementi o attributi diversi, XML fornisce meccanismi di namespace XML non pone problemi di licenze ed è indipendente da qualunque piattaforma ci si può avvalere del lavoro e dei dispositivi prodotti dalla comunità di utilizzatori XML

24 Tecnologie XML XML comprende una famiglia di tecnologie correlate XLink – modalità standard di aggiungere link ipertestuali ad un file XML XPointer – sintassi per puntare a porzioni di dati interni a un documento XML (il ruolo dellURL nel web) XSL – linguaggio per la produzione di fogli di stile XSLT – linguaggio di trasformazione utile a riorganizzare, aggiungere e rimuovere tag e attributi

25 XML per le biblioteche digitali strutturazione del contenuto per trasferimenti di dati in tempo reale (online delivery) integrazione di informazioni interne ed esterne gestione dei dati bibliografici – creazione, archiviazione, condivisione ed utilizzazione cattura di metadati Occorre trovare il modo per trasferire dati e informazioni in modo efficiente ed efficace. Dati in XML condivisi tra computer ed applicativi differenti rappresentano un passo in direzione dell agevolare questa condivisione

26 Schemi di metadati descrittivi Dublin Core (DC) descrizione semplice di risorse di ogni genere per la prima ricerca Encoded Archival Description (EAD) codifica di strumenti di corredo archivistici Text Encoding Initiative (TEI) marcatura di testi letterari Music Encoding Initiative (MEI) marcatura di documenti musicali Synchronized Multimedia Integration Language (SMIL) sincronizzazione ed integrazione di documenti multimediali

27 Dublin Core elementi semplici da comprendere e adoperare opzionali e ripetibili internazionali e trasversali tra le discipline non qualificato finalizzato ad una sommaria descrizione della risorsa per agevolare la prima ricerca qualificato per descrizioni più ricche che permettano raffinamenti nella ricerca e un loro uso professionale nellambito degli strumenti di mediazione propri delle diverse discipline

28 Applicazioni di Dublin Core oggetti fotografie diapositive

29 Implementazione formato di descrizione di una risorsa informativa mira ad agevolare il reperimento delle risorse elettroniche funge da base per linteroperabilità semantica adottata da numerose comunità utenziali (biblioteche, musei, agenzie governative, organizzazioni commerciali) beneficia dellattiva partecipazione e promozione in oltre 20 Paesi in Nord America, Europa, Asia ed Oceania

30 Dublin Core Metadata Element Set TitleCreator SubjectDescription PublisherContributor DateType FormatIdentifier SourceLanguage ReferenceCoverage Rights

31 Encoded Archival Description (EAD) Basato sullo standard ISAD(G) per la descrizione di complessi archivistici schema di codifica (marcatura, markup) non-proprietario finalizzato alla produzione di strumenti di corredo elettronici mediante limpiego di linguaggi di marcatura (SGML e poi XML) per agevolare la ricerca allinterno dellarchivio e laccessio via web

32 EAD e la struttura degli strumenti di corredo Descrizione dellarchivio Descrizione di serie archivistiche Descrizione di sottoserie archivistiche Descrizione dellunità documentaria LIVELLO ALTO LIVELLO BASSO

33 Principi ispiratori di EAD obiettivo è rendere le risorse archivistiche provenienti da istituzioni diverse accessibili agli utenti del web nomi di elementi ed attributi definiti in modo tale da favorire lo scambio internazionale di dati – linteroperabilità è un formato di struttura, non uno standard per i dati di contenuto

34 Linee guida e migliori pratiche di EAD facilitare il reperimento della risorsa attraverso linteroperabilità normalizzare la creazione di documenti correttamente codificati in EAD allinterno o tra più istituzioni incoraggiare linclusione di specifici elementi sviluppare un insieme di dati essenziali (core data elements)

35 Text Encoding Initiative (TEI) schema per la codifica di testi in fase di creazione di nuovi documenti testuali o per lo scambio di documenti esistenti basato su XML non richiede lutilizzo di specifico software consente la rigorosa partizione del testo agevola il trattamento scientifico dei testi

36 Elementi rappresentano le caratteristiche del testo ai fini di un suo trattamento elettronico (titolo, indici, ecc.) marcatori (tags) per indicare la struttura del testo ed altre caratteristiche di interesse (, ) TEI comprende circa 450 elementi un sottoinsieme è TEI Lite che include circa 150 elementi

37 Struttura TEI TEI header (intestazione, elemento ) element) trascrizione del testo (elemento ) [ TEI Header information ] [ front matter... ] [ body of text... ] [ back matter... ]

38 TEI header lelemento teiHeader non fa parte del documento codificato, ma fornisce informazioni sul documento si comporta come una scheda di catalogo (o il frontespizio) nei confronti di un libro a stampa fornisce i metadati relativi alla versione elettronica del libro è obbligatorio per ogni documento TEI

39 Music Encoding Initiative (MEI) definito specificamente per testi musicali, partiture, annotazioni del musicista, ecc. tiene separati I dati dai metadati può ospitare raccolte, parti, varianti struttura simile a TEI ancora in corso di sviluppo

40 Synchronised Multimedia Integration Language (SMIL) pronunzia "smile" utilizzato per presentazioni multimediali integra e sincronizza audio e video con immagini, testo e altre tipologie documentarie animazionestruttura controllo dei contenutigestione tempi e sincronizzazione struttura di presentazioneeffetti transizione collegamentimanipolazione tempi integrazione di oggetti mediatici

41 Scelta di uno schema di metadati tipologie documentarie oggetto della conversione al digitale finalità del progetto di digitalizzazione – accesso o conservazione utilizzatore potenziale competenze e capacità del personale del progetto infrastruttura tecnica disponibile presso listituzione livello di dettaglio (varia da unistituzione allaltra)

42 Condivisione degli standard e collaborazione partenariato soluzioni comuni condivisione di infrastrutture, specie tecnologiche condivisione di competenze interoperabilità

43 Interoperabilità occorrerebbe garantire che … i sistemi, le procedure e la cultura di unorganizzazione siano gestiti … in modo tale da massimizzare le opportunità di scambio e di riutilizzazione dellinformazione, sia internamente, sia allesterno della struttura Paul Miller. Interoperability: what is it and why should I want it? «Ariadne» Issue 24

44 Diversi livelli di interoperabilità tecnologica semantica nazionale e internazionale

45 Livello tecnologico qual è loggetto dello scambio – elementi dei dati in che modo strutturarli ai fini dello scambio – schemi in che modo effettuare lo scambio – transazioni e messaggi di protocollo, profili

46 Livello semantico utilizzo coerente dei termini di soggetto migliori descrizioni delle risorse reperimento delle risorse più efficace accesso al contenuto intellettuale Le biblioteche digitali si occupano sempre meno di libri e sempre pi ù delle idee e dei concetti espressi nei libri

47 Ricerca full text e vocabolari controllati ricerca full text ampia e non specifica termini fuori contesto risultati erronei indicizzazione automatica Amazoogle vocabolari controllati definizione dei termini precisione nei risultati soggetti correlati comprensione condivisa da persone e computer thesauri multilingua

48 Accesso – ricerca e recupero termini di un vocabolario controllato thesaurus acronimi archivi di authority

49 Thesauri lista di termini interrelati, nellambito di uno specifico dominio disciplinare, provvista di collegamenti semantici predefiniti ed eventualmente anche della definizione dei termini Library of Congress Subject Headings MESH The International Thesaurus of Refugee Terminology

50 Livello nazionale ed internazionale scambio universale dei dati raccolta (harvesting) dei metadati cooperazione internazionale gateway informativi (portali, virtual reference desk)

51 Requisiti attitudini – volontà di condividere, partecipare cambiamenti – nuove procedure, nuove abilità e competenze, nuovi criteri gestionali condivisione degli standard per la codifica dei dati protocolli per la condivisione dei metadati

52 Z39.50 protocollo che consente la ricerca e il recupero di record da più archivi elettronici in contemporanea, mediante ununica interfaccia sul lato utilizzatore protocollo: un insieme di regole che governa lo scambio di informazioni tra dispositivi e computer diversi trova ampia applicazione nella ricerca bibliografica allinterno degli opac e dei metaopac

53 Schema di colloquio tra un opac, un cliente Z e un server Z

54 Perchè è importante? consente la ricerca trasversale su più cataloghi di biblioteca permette allutilizzatore di servirsi di uninterfaccia di ricerca con la quale ha già familiarità favorisce il recupero di dati in forma strutturata rende possibile lattivazione di applicazioni in forma distribuita

55 Limiti di Z39.50 mancanza di semantica condivisa differenze tra i servizi esposti dal client e dal server esempio: il sistema di ricerca locale effettua la ricerca di nomi personali e di enti nel medesimo indice; nel sistema remoto invece la ricerca di un nome di persona viene effettuata soltanto allinterno dellindice di persone più versioni rilasciate con caratteristiche differenti non è compreso allinterno dei browser standard e dei più comuni motori di ricerca

56 Open Archives Initiative Open Archives Initiative sviluppa e promuove dispositivi per linteroperabilità che mirano ad agevolare lefficacia della disseminazione dei contenuti sul web i documenti sono depositati in archivi (repository) ai fini di consentire la condivisione dei metadati, la pubblicazione dei contentui e larchiviazione delle risorse la descrizione dei documenti avviente mediante Dublin Core non qualificato

57 OAI Protocol for Metadata Harvesting OAI-PMH Protocol for Metadata Harvesting si basa su uno Schema W3C XML Lobiettivo è lapertura", favorita attraverso lesposizione e la raccolta dei metadati attraverso un protocollo http semplice e appositamente definito NELSON, M. OAI and OAIS: Whats in a name. D-Lib Magazine, 7(5), May 2001

58 Linee guida per limplementazione

59 Harvesting mediante OAI-PMH Data Providers (open archives, repositories) forniscono libero accesso ai metadati ed, eventualmente ma non necessariamente, anche ai testi (full text) o ad altre risorse Service Providers utilizzano le interfacce OAI dei Data Providers per raccogliere e archiviare metadati le sessioni di ricerca non avvengono direttamente sulla repository del Data Provider i servizi si basano sui dati raccolti mediante harvesting

60 Funzionamento di OAI-PMH Carpenter. L OA-Forum Tutorial. University of Bath, Bath

61 Risorsa che non espone metadati descrittivi Produttore / distributore utenti punto di accesso unico Produttore / distributore Aggregatori di metadati Varie fasce di utenti punti di accesso multipli Risorsa che espone metadati descrittivi sito del produttore motori, portali, aggregatori

62 Data provider repository Data provider database Service provider Archiviazione metadati Service provider Interfaccia di ricerca standard OAI-PMH Z39.50 SRU/SRW harvesting di metadati ricerca risultati (compresi metadati)

63 Data providers metadati Dublin Core convertiti dinamicamente mediante mappatura da un altro schema di metadati a DC oppure archiviati direttamente come DC sono disponibili mappature tra DC, EAD e MARC 21 i dati sono codificati in XML tutti i record vengono contrassegnati da un elemento cronologico (datestamp)

64 Service providers dispongono di dispositivi per lharvesting software per lharvesting automatico web robots, cioè programmi che scandiscono lo spazio web automaticamente (crawlers, spiders) i web robot fanno uso di protocolli HTTP forniscono servizi relativi a tutti i dati raccolti interfaccia di ricerca sistemi di peer-review

65 Architettura gestione dellarchivio selezione delle repository sulle quali effettuare lharvesting lista delle repository immessa manualmente o facendo uso del registro ufficiale richieste HTTP ai data providers uso della sintassi di OAI-PMH harvesting selettivo mediante parametrazione calendario raccolta periodica e programmata dei metadati normalizzazione armonizzazione dei diversi formati di metadati in una struttura omogenea (data, nomi, codici di lingua e paese) mediante mappatura e/o traduzione

66 Servizi a valore aggiunto OAI permette lerogazione di servizi basati sulla raccolta dei metadati, nel quale il valore dei dati può crescere in seguito alla normalizzazione e allarricchimento dei metadati stessi esempi di servizi sono ricerche collegamenti per citazionie peer-review

67 RSS feeds tre diverse denominazioni Really Simple Syndication: distribuzione mediante condivisione a procedura semplice Rich Site Summary: indice ricco delle informazioni presenti su un sito web RDF Site Summary: come il precedente, con riferimento alle sue origini RDF Resource Description Framework usato nella produzione, distribuzione, fruizione di contenuti da: siti di informazione fornitori di contenuti periodici scientifici quotidiani online weblog CMS (Content Management System), sistemi per la gestione di contenuto

68 Definizioni termini derivati dalla pratica e dal linguaggio dei dispositivi di mediazione tradizionali syndication: distribuzione di contenuti attraverso appositi canali, rappresentati da feed Atom o RSS feed, file contenente segmenti di contenuti veicolati allinterno di un canale channel (canale): percorso attraverso il quale linformazione viene veicolata o trasmessa

69 Wikipedia: RSS Wikipedia definisce RSS uno standard de facto, ovvero uno standard che, benché non riconosciuto ufficialmente come ISO è talmente diffuso da essere comunque un elemento di riferimento Oggi RSS è lo standard de facto per l'esportazione di contenuti Web. I principali siti di informazione, i quotidiani online, i fornitori di contenuti, i blog più popolari: tutti sembrano aver adottato il formato RSS. Gli utenti possono oggi accedere a migliaia di feed RSS: alcuni siti (directory) raccolgono i riferimenti agli innumerevoli feed RSS disponibili sul Web.

70 Dialetti RSS RSS 0.92: il più vecchio tra gli standard oggi in uso, evoluzione del formato usato originariamente da Netscape RSS 2.0: rilasciato da UserLand nel 2002, è l'evoluzione del formato 0.92, di cui eredita la semplicità, ma a cui aggiunge il supporto per moduli aggiuntivi RSS 1.0: è il formato ufficiale del W3C, conforme ad RDF, estensibile e modulare

71 Dialetti e uso RSS 2.0 (Really Simple Syndication di Userland) più orientata alle implementazioni XML : servizi di distribuzione di contenuto effimero come notizie o contenuti provenienti dai blog RSS 1.0 (del W3C) adotta e implementa il modello di dati RDF Resource Description Framework più focalizzata su un generico strumento di scambio di metadati strutturati, offre un semplice meccanismo di estensione modulare per accogliere nuovi vocabolari

72 Come funziona basato su XML: semplice, estensibile, flessibile documenti disponibili su un web server e recuperabili da qualsiasi aggregatore RSS preferenze stabilite dagli utenti (personalizzazioni) si usa un programma detto news aggregator per leggere un feed RSS basta un lettore scaricare un software adatto cliccare sullicona RSS sul sito da cui si vogliono ricevere i feed copiare lindirizzo del feed RSS.xml che si apre nellapposita finestra del news aggregator è possibile dirottare le novità pubblicate su un periodico elettronico verso un palmare

73 Applicazioni al mondo delle biblioteche promozione e marketing dei servizi bibliotecari: attività, nuove risorse, eventi, annunci su novità e promozione di nuovi servizi elenchi di nuove acquisizioni della biblioteca / rete elenchi di novità librarie da siti di librerie virtuali come Amazon Table of Contents (ToC) di periodici (CAS: Current Awareness Service) miglioramento dei servizi di reference: aggiunta di nuove risorse su un determinato ambito disciplinare / soggetto

74 Opportunità aggiornamento costante in tempo reale, con cadenze personalizzabili e risparmio di tempo riduzione dello spamming nell in quanto i canali vengono attivati in modalità opt-in recupero di notizie ad intervalli stabiliti da siti di interesse, attraverso luso di aggregatori, che evitano di visionare individualmente centinaia di siti attivazione di forme nuove di marketing e promozione per argomento per settore o per categorie di utenti

75 Conclusioni i metadati aggiungono valore ai dati gli standard di codifica determinano la standardizzazione la standardizzazione facilita linteroperabilità i protocolli consentono lo scambio dei dati


Scaricare ppt "Riproduzione digitale di fonti manoscritte (metadati descrittivi e reperimento delle risorse elettroniche) CORSO DI PERFEZIONAMENTO SAPERI STORICI E NUOVE."

Presentazioni simili


Annunci Google