Collezioni digitali strumenti e modelli di cooperazione Giovanni Bergamin Roma, 7 Giugno 2001 Tra cooperazione e autonomia competizione o collaborazione? nuove strategie per le biblioteche di architettura VII giornate di studio del cnba
Quantità La produzione annuale di “digitale” è sull’ordine del 1,5 miliardi di GB (250 MB per persona vivente sul pianeta) Oltre il 93 dell’informazione attualmente prodotta è “digitale” Fonte: Lyman, Peter - Hal R. Varian, How much information, much-infohttp://sims.berkeley.edu/how- much-info
Qualità La produzione a stampa annuale (Libri, Giornali, Periodici,Documenti interni) rappresenterebbe – se fosse archiviata con modalità digitali – lo 0,003 per cento del totale “la parola stampata è una maniera molto efficiente per veicolare informazione” Fonte: Lyman, Peter - Hal R. Varian, How much information, much-infohttp://sims.berkeley.edu/how- much-info
Risorse (Dati, Metadati) Oggetto “analogico “ pubblicato non pubblicato Oggetto “nato digitale” Oggetto digitalizzato Digitalizzazione Catalogazione (creazione di “metadati” ?) Pubblicazione in rete
Perché digitalizzare. Il valore aggiunto – come si dice ora – della digitalizzazione può essere così sintetizzato: promuovere un nuovo utilizzo da parte degli studiosi mediante la diffusione su larga scala di collezioni locali o uniche; migliorare l’uso dei documenti attraverso tecniche di manipolazione dell’immagine (per esempio per aumentare la leggibilità di testi macchiati, rovinati ecc); creazione di collezioni virtuali attraverso l’integrazione di vari formati o di materiali distribuiti in luoghi diversi. Fonte: Smith,. Abby, Why digitize. Washigton : CLIR, 1999, p. 9-10
Mostre digitali e Biblioteche digitali Il compito delle biblioteche digitali – come quello delle biblioteche convenzionali – è quello di rendere i “libri” accessibili non quello di “scriverli” una certa tendenza a produrre selezioni raffinate di piccoli sottoinsiemi di materiale (da classificare come mostre digitali piuttosto che biblioteche digitali) è stata di ostacolo all’accettazione delle collezioni digitali all’interno del mondo della ricerca accademica liberamente tradotto da: Thaller, Manfred, From the digitized to the digital library, >, Vol. 7, n.2 (Feb. 2001),
Modelli e strumenti economici (Un Business model per i servizi di BD?) [BM 1] Le finalità della istituzione (delle istituzioni associate) e i servizi che si intende erogare Definizione dei prodotti e dei servizi offerti (differenze con le “altre” offerte) Per quale “mercato”: B2B (es. enti di ricerca, editori, scuole ecc.) B2C (cultura, interessi di nicchia ecc.)
Entrate e recupero dei costi [BM 2] Entrate (sponsor, quote degli associati, royalties, pay per view ecc ) Recupero dei costi di gestione (sovvenzione pubblica, recupero parziale/totale dei costi, profitto, premium ecc.)
I costi [BM 3] Beni mobili e immobili (Ammortamento) IT (ALTRO) Compensi al personale per gestione, servizi agli utenti, marketing, relazione con gli editori, formazione, catalogazione ecc.
(quanto costa a immagine?) [BM4] Software Gestione della Collezione Digitale Conservazione Gestione dei Diritti Proprietà Intellettuale Sicurezza Commercio elettronico Servizi (outsourcing, telecomunicazioni, digitalizzazioni, consulenze ecc) Licenze di copyright, materiale di consumo, viaggi, imposte tasse ecc. Fonte BM1-4: Liberamente tratto da un documento ad uso interno preparato da Mel Collier- UN1.8
La valutazione del risultato [BM 5] “occorre sviluppare criteri aperti di valutazione sul reale uso delle risorse digitalizzate” Thaller, Manfred, From the digitized to the digital library, >, Vol. 7, n.2 (Feb. 2001),
Modelli e strumenti tecnologici Reference model for an Open Archival Information System (OAIS) L'OAIS si autodefinisce "un'organizzazione di soggetti e sistemi che hanno accettato la responsabilità della conservazione dell'informazione e del mantenerla disponibile per una comunità determinata"
Entità [OAIS 2] L'OAIS opera in un ambiente formato dall'interazione di quattro entità, definite come: i produttori, i consumatori, il management l'archivio stesso.
Le componenti funzionali dell'OAIS sono definite come: Immissione /Acquisizione dei dati Archiviazione dei dati Gestione dei dati Accesso Amministrazione dell'archivio Pianificazione della conservazione Componenti funzionali [OAIS 3]
L’applicazione BNCF del modello OAIS L’implementazione BNCF ha distinto i seguenti archivi logici: Archivio bibliografico Archivio dei metadati (gli “altri” metadati) Archivio dei dati Documentato in: Gruppo di studio sugli standard e le applicazioni di metadati nei beni culturali promosso da ICCU
1) Archivio bibliografico “al di la di esigenze particolari o di pura sperimentazione l’accesso dell’utente agli oggetti digitali è mediato dall’archivio bibliografico (visto dall’utente come OPAC)” Indicazione di priorità tra catalogazione (il recupero del retrospettivo ecc) e digitalizzazione
2) Archivio dei metadati Le informazioni necessarie a gestire l’acquisizione la conservazione l’accesso l’amministrazione (degli oggetti e delle entità digitali)
Metadati amministrativi, strutturali e gestionali Identificativo Sequenza Nomenclatura Nome del file digitale Checksum MIME Type Apparato di scansione Software di Scansione Parametri di scansione Data di scansione Produttore della scansione Standard progetto Nota pubblica Codice fruibilità Relazione Livello risorsa Localizzazione (URL “locale” del file)
3) Archivio dei dati I file risultanti dal progetto di digitalizzazione. l’archivio dei metadati e l’archivio dei dati digitali sono stato disegnati per ospitare anche le acquisizioni di oggetti digitali nativi Esempio 1 Esempio 2
Strumenti di cooperazione [SC1] Cataloghi collettivi Reali Virtuali Indici
Strumenti di cooperazione [SC2] Il catalogo collettivo reale Molto potente ed efficiente dal punto di vista dell’utente finale Alti costi di gestione Richiede una alta omogeneità di standard (metadati) non sempre possibile per le scelte di convergenza
Strumenti di cooperazione [SC3] Catalogo collettivo virtuale (es. via Z39.50) Poco efficiente per l’utente finale al crescere del numero dei cataloghi Bassi costi di gestione Richiede una alta omogeneità di standard (metadati) non sempre possibile per le scelte di convergenza
Tutto quanto (si) fa digitale, ovvero La convergenza convergenza di codifica: “le lunghe catene di 0 e di 1 dell'informazione digitalizzata”. convergenza tecnologica: computer e reti sono onnipresenti convergenza dei media e dei “generi”: es. un DVD contiene un film ma anche una monografia sul regista (a chi andrà come DL?) convergenza delle “istituzioni della memoria”: musei, archivi e biblioteche
Un Indice? Potrebbe avere molti punti in comune con gli attuali motori di ricerca (Google, Altavista ecc.) che: Non centralizzano fisicamente dati Ma centralizzano fisicamente indici. Con qualche importante differenza: Un Indice del digitale potrebbe costruire i i suoi indici mediante la selezione consapevole di determinati metadati (il minimo comune denominatore tra realtà convergenti) A differenza di un motore di ricerca indicizza tutto quello che riesce a raggiungere.
“This system would act primarily as a directory” -1 La proposta SBN (1985) prevedeva: un database condiviso contenente i record bibliografici della cooperazione; ogni record doveva essere tuttavia del tipo Carta d’Identità con la localizzazione del record bibliografico completo e del relativo posseduto;
“This system would act primarily as a directory” -2 il ruolo del sistema centrale è in maniera primaria quello di assolvere i compiti di directory (di Indice); i vari siti della cooperazione accedono all'Indice principalmente per ottenere informazioni di indirizzamento: p. es. per sapere chi ha la versione più aggiornata del record, chi può erogare il servizio di prestito di un determinato libro, ecc.;
“This system would act primarily as a directory” -2 in ogni caso l'Indice – da solo – non è in grado di erogare informazioni e servizi: per ottenere informazioni o servizi occorre accedere al sito che realmente possiede l’informazione o è in grado di erogare il servizio. Napster? Andrea Lawendel, Napster e gli altri peer-to-peer riducono lo strapotere dei server, >, n.23 (Inv. 2000/2001),
IndiceD -1 In pratica l’indice aggiornato (IndiceD) e consapevole della convergenza dovrebbe contenere: citazione sintetica descrittiva dell’oggetto fonte (dell’oggetto analogico che è stato digitalizzato e reso disponibile anche in forma digitale o dell’oggetto nato e pubblicato in forma digitale) informazioni di indirizzamento (URI) verso la descrizione completa contenuta in un archivio pubblicato verso gli oggetti digitali contenuti in un archivio pubblicato
IndiceD - 2 Citazione sintetica = “quel tanto che basta per instradare” = elementi di citazione (p. es. dc.creator, dc.title) = coordinate (temporali, spaziali, linguistiche, di genere ecc.)
Collezioni digitali strumenti e modelli di cooperazione Giovanni Bergamin