La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

LA CONSERVAZIONE DEGLI OGGETTI DIGITALI:

Presentazioni simili


Presentazione sul tema: "LA CONSERVAZIONE DEGLI OGGETTI DIGITALI:"— Transcript della presentazione:

1 LA CONSERVAZIONE DEGLI OGGETTI DIGITALI:
problematiche, tecniche, standard metadati Corso di archivistica informatica del prof. Federico Valacchi Dipartimento di scienze della formazione, dei beni culturali e del turismo Università degli studi di Macerata Alessandro Alfier, 19 aprile 2017

2 Sommario degli argomenti
la prospettiva (il «contesto» della conservazione) l’oggetto digitale (il «che cosa» della conservazione) l’obiettivo (il «fine» della conservazione)

3 PROSPETTIVA DELLA CONSERVAZIONE
Utenti (socializzazione della conservazione) Istituto di conservazione risorse capacità conoscenze risorse capacità conoscenze Oggetto digitale Oggetto digitale Utenti Utenti Utenti Conservazione top-down (istituto-centrica) Conservazione bottom-up (oggetto-centrica)

4 OGGETTO DIGITALE («digital object»)
informazione creata o usata in FORMATO DIGITALE (sequenza di dati formata da bit «0» e «1») Oggetto digitale «qualunque tipo di conoscenza che possa essere scambiata» (OAIS) che assume una forma di rappresentazione (testo, registrazione sonora, video, fotografia etc.) Informazione

5 oggetto digitale nativo / non nativo

6 OGGETTO DIGITALE bit è un dato binario: può assumere infatti il valore «0» o «1» file una sequenza di bit, con valore «0» «1», considerati come un’entità unica dal punto di vista logico

7 OGGETTO DIGITALE Oggetto digitale File File File Bit Bit Bit Bit Bit
cioè costituita da uno o più FILE correlati OGGETTO DIGITALE: informazione in formato digitale, Oggetto digitale File File File Bit Bit Bit Bit Bit Bit

8 OGGETTO DIGITALE CULTURALE
per finalità di conservazione, consultazione, valorizzazione di beni culturali analogici (oggetti digitali non nativi cioè riproduzioni digitali) OGGETTO DIGITALE: informazione costituita da uno o più file correlati Oggetti digitali Oggetti digitali culturali o per finalità legate all’espressione, diffusione, conservazione di valori culturali del contemporaneo (oggetti digitali nativi)

9 ANALOGICO versus DIGITALE
un orologio a lancette è ANALOGICO perché la posizione di ciascuna di esse può indicare uno qualsiasi degli infiniti punti che formano la circonferenza del quadrante dell'orologio stesso, punti che non sono numerabili in un orologio DIGITALE le cifre che compongono l'ora, i minuti e i secondi indicano tutti gli possibili momenti secondi in cui può essere suddiviso un giorno: dunque tutti i momenti sono esattamente numerabili

10 ANALOGICO versus DIGITALE
ciò che è numerabile, rappresentabile dunque con un insieme discreto di elementi, cioè con un insieme finito, non continuo di elementi ANALOGICO: ciò che non è numerabile, non rappresentabile con un insieme discreto di elementi, ma con un insieme infinito, continuo di elementi

11 ANALOGICO versus DIGITALE
1 1 1 1 Analogico: linea sinusoidale Digitale: linea spezzata

12 LA RIPRODUZIONE DA DIGITALE A DIGITALE
1 1 1 1 1 1 1 1 Quando si effettua la copia digitale di un’informazione digitale, il risultato ottenuto è identico a quello di partenza (nessuna «perdita» di dati)

13 LA RIPRODUZIONE DA ANALOGICO AD ANALOGICO
Quando si effettua la copia analogica di un’informazione analogica, il risultato ottenuto non è mai identico a quello di partenza («perdita» di dati)

14 LA RIPRODUZIONE DA ANALOGICO A DIGITALE
1 1 1 1 Quando si effettua la copia digitale di un’informazione analogica, il risultato ottenuto è «un’approssimazione» dell’informazione di partenza

15 OGGETTO DIGITALE sequenza di bit che necessita di essere «interpretata» per poter veicolare l’informazione (contenuto + forma di rappresentazione) OGGETTO DIGITALE: informazione costituita da uno o più file correlati FILE: sequenza di bit considerati come un’entità unica dal punto di vista logico sequenza di bit fissata con una certa organizzazione fisica su un determinato supporto di memorizzazione formato elettronico

16 Formato elettronico del file
OGGETTO DIGITALE Formato elettronico del file l’insieme di CODICI e REGOLE che, a partire dalla sequenza di bit che costituisce il file, permettono di (RI)PRODURRE, mediante software, l’informazione, nel suo contenuto e nella sua forma di rappresentazione

17 supporti di memorizzazione bit organizzati in file
OGGETTO DIGITALE oggetto digitale supporti di memorizzazione formati elettronici bit organizzati in file Fruizione fortemente mediata degli oggetti digitali ASPETTO CRITICO: la perdita di efficacia anche di una sola delle molteplici risorse di mediazione mette a rischio la fruizione finale («vulnerabilità del digitale») hardware e software

18 OGGETTO DIGITALE La fruizione degli oggetti digitali è minacciata dal rischio dell’OBSOLESCENZA che interessa le risorse di mediazione OBSCOLESCENZA: la perdita di valore di un bene a causa del progresso tecnologico, che porta con sé lo sviluppo di beni sempre più raffinati. La perdita di valore causata dall'obsolescenza è però indipendente dalla funzionalità in sé del bene e quindi può riguardare anche prodotti in perfetto stato di conservazione obsolescenza supporti di memorizzazione obsolescenza formati elettronici OBSOLESCENZA DIGITALE obsolescenza hardware e software

19 Successive release di DOC
OGGETTO DIGITALE L’obsolescenza dei formati elettronici L’obsolescenza dei formati elettronici è un problema così rilevante che si stanno diffondendo i REGISTRI DEI FORMATI: -Library of Congress -Florida Digital Archive -National Archives of UK WORD STAR (dal 1979) DOC (dal 1983) DOCX (dal 2007) LOTUS WORD PRO (dal 1989) Successive release di DOC JPEG XR (dal 2011) JPEG (dal 1992) JPEG 2000 (dal 2000)

20 OGGETTO DIGITALE Web-bibliography sui registri dei formati:
registro dei formati della Library of Congress < registro dei formati del Florida Digital Archive < registro dei formati dei National Archives of UK <

21 Come si affronta l’obsolescenza digitale?
OGGETTO DIGITALE Computer museum: si tengono in vita gli apparati hardware e software obsoleti Come si affronta l’obsolescenza digitale? Emulazione: si utilizza un software di emulazione, che replica su un hardware e software di ultima generazione il funzionamento di un hardware e di un software obsoleti Riversamento: la strategia più usata per far fronte all’obsolescenza digitale (può comportare la perdita di informazioni) Normalizzazione: decisione di utilizzare solo pochi formati, caratterizzati da apertura, sicurezza, portabilità, diffusione (ad esempio l’XML)

22 OGGETTO DIGITALE RIVERSAMENTO interessa i supporti di memorizzazione
RIVERSAMENTO DIRETTO (refreshing): RIVERSAMENTO SOSTITUTIVO interessa i formati elettronici (migration): RIVERSAMENTO

23 RIVERSAMENTO SOSTITUTIVO
OGGETTO DIGITALE RIVERSAMENTO SOSTITUTIVO conversione di formato conversione di formato formato 1 formato 2 formato n. software 1 software 2 software n. hardware 1 hardware 1 hardware n.

24 Obsolescenza dell’oggetto digitale
gli oggetti digitali NON CONSERVANO LA LORO FRUIBILITA’ DA SOLI, ma per garantire la loro fruibilità nel tempo è necessaria una cura continua, una gestione che ha inizio ancor prima della generazione dell’oggetto digitale, con la preliminare scelta dell’idoneo formato elettronico e dell’idoneo supporto di memorizzazione, e che prosegue nel tempo con continue operazioni di riversamento diretto e sostitutivo Obsolescenza dell’oggetto digitale

25 OGGETTO DIGITALE Stabilità:
L’oggetto digitale deve essere gestito per garantire la sua fruibilità nel tempo, cioè per garantire la sua stabilità Stabilità: capacità dell’oggetto digitale di mantenere inalterati nel tempo contenuto e forma di rappresentazione possibilità di recupero della sequenza binaria dai supporti in cui è memorizzata possibilità di interpretare la sequenza binaria in base al formato elettronico integrità della sequenza binaria

26 Integrità della sequenza di bit
OGGETTO DIGITALE Integrità della sequenza di bit Esempi di corruzione della sequenza di bit

27 OBIETTIVO Cosa vuol dire conservare l’oggetto digitale? Significa, prima di tutto, farsi carico della sua stabilità Il conservare l’oggetto digitale si esaurisce nel prendersi carico della sua stabilità? L’oggetto digitale deve essere gestito per garantire la sua fruibilità nel tempo, cioè per garantire la sua stabilità

28 OBIETTIVO Storage (a lungo termine) Conservazione

29 OBIETTIVO Storage Definizione la memorizzazione persistente dei dati,
cioè la loro salvaguardia anche tramite procedure di backup Obiettivo della sequenza di bit garantire l’integrità Soluzioni la semplice memorizzazione su supporti di uso personale (penne USB, DVD etc.) la memorizzazione in data center oppure la memorizzazione in rete tramite cloud storage

30 Conservazione (a lungo termine)
OBIETTIVO l’azione di mantenimento a lungo termine degli oggetti digitali, in una forma corretta (OAIS) Conservazione (a lungo termine) Forma corretta: la conservazione deve garantire che la fruibilità degli oggetti digitali sia protetta da ogni pericolo di alterazione, manipolazione (autenticità) Lungo termine: la conservazione va calibrata su un intervallo di tempo sufficientemente ampio da tenere in considerazione l’impatto prodotto sugli oggetti digitali dai cambiamenti tecnologici (obsolescenza)

31 Conservazione a lungo termine
OBIETTIVO Conservazione a lungo termine Obiettivo tenere sotto controllo la dipendenza degli oggetti digitali dai cambiamenti tecnologici e garantire la loro autenticità Soluzioni repository digitali conformi al modello OAIS (reference model for an Open Archival Information System, ISO 14721:2012)

32 OBIETTIVO Bibliografia su OAIS:
testo originale dello standard nell’ultima versione del 2012: < traduzione italiana dello standard nella prima versione del 2002: OAIS: sistema informativo aperto per l’archiviazione, a cura di G. Michetti, Roma, ICCU, 2007

33 CONSERVAZIONE A LUNGO TERMINE
OBIETTIVO Traducibilità: un determinato hardware e software sono in grado di interpretare la sequenza di bit e di restituire l’oggetto digitale nel suo contenuto e forma di rappresentazione (riversamento diretto e sostitutivo) CONSERVAZIONE A LUNGO TERMINE Autenticità: vi sono sufficienti garanzie che l’oggetto digitale è esattamente ciò che sembra essere e dunque non è stato (involontariamente o con dolo) alterato, manipolato, o addirittura falsificato Integrità della sequenza di bit o vitalità: le sequenze di bit sono integre e leggibili, come sequenze, da un elaboratore dal primo all’ultimo bit STORAGE

34 chi o che cosa «certifica» l’autenticità dell’oggetto digitale?
OBIETTIVO l’oggetto digitale è autentico (affidabile) se è ciò che pretende di essere chi o che cosa «certifica» l’autenticità dell’oggetto digitale?

35 OBIETTIVO Autenticità la dimensioni critica fondamentale
per la conservazione a lungo termine dell’oggetto digitale è rappresentata dal tempo (in misura minore dallo spazio) l’obsolescenza tecnologica dei supporti fisici di memorizzazione e dei formati file obbliga a continui processi di riversamento diretto e sostitutivo Tempo

36 Copia della copia della copia
OBIETTIVO Autenticità la conservazione a lungo termine è costretta, sull’onda dei riversamenti, a produrre nel tempo una serie di «copie» a partire dall’oggetto digitale «originale» nella dimensione digitale viene sostanzialmente meno la distinzione propria della dimensione analogica tra «originale» e «copia» Originale Copia dell’originale Copia della copia Copia della copia della copia ... … …. Tempo

37 Copia autentiche rispetto all’originale?
OBIETTIVO Autenticità Nel processo di generazione delle «copie» dell’oggetto digitale va garantito che ciascuna di esse sia fedele alla precedente e in ultima analisi all’«originale» . Va dunque assicurato che le «copie» prodotte siano autentiche. Infatti solo «copie» autentiche dell’oggetto digitale sono equipollenti al suo «originale», in grado dunque di avere lo stesso valore di testimonianza posseduto dall’originale Il processo di riversamento può essere potenzialmente l’occasione per un’alterazione (voluta o meno) dell’oggetto digitale. In ogni caso il riversamento sostitutivo porta a una modifica dell’integrità della sequenza di bit Originale Copia autentiche rispetto all’originale? Tempo

38 OBIETTIVO Autenticità
la conservazione a lungo termine dell’oggetto digitale equivale alla conservazione della capacità di produrre nel tempo «copie» autentiche rispetto all’oggetto digitale «originale» (progetto INTERPARES) la produzione di «copie» autentiche non può essere garantita da sole risorse tecnologiche, ma deve essere assicurata («certificata») da informazioni associate a ciascuna «copia»

39 OBIETTIVO Autenticità dell’oggetto digitale: l’oggetto digitale è ciò che pretende di essere Integrità Identità metadati tecniche di hash metadati storage

40 Integrità dell’oggetto digitale
OBIETTIVO Autenticità Integrità dell’oggetto digitale metadati tecnica di hash in input può esservi qualsiasi sequenza di bit; dall’hash sum non si può ricostruire l’input; le probabilità che un hash sum corrisponda a 2 diversi input sono scarsamente probabili

41 OBIETTIVO Autenticità
Integrità dell’oggetto digitale tecnica di hash garantisce l’assoluta integrità della sequenza di bit il processo di conservazione a lungo termine impone processi di riversamento sostitutivo, che alterano la sequenza di bit metadati Piena utilità per la conservazione a lungo termine Utilità relativa per la conservazione a lungo termine

42 OBIETTIVO Autenticità Integrità dell’oggetto digitale
l’integrità fisica dell’oggetto digitale (la sequenza di bit) può anche in parte essere compromessa, a seguito del processo di riversamento sostitutivo l’integrità è allora rispettata se, sostanzialmente, l’oggetto digitale risulta completo nei suoi aspetti essenziali quindi l’oggetto digitale è integro se mantiene tutti gli aspetti essenziali del suo contenuto e forma di rappresentazione Integrità dell’oggetto digitale

43 (metadati di contesto)
OBIETTIVO Autenticità Identità dell’oggetto digitale: è costituita dai caratteri distintivi e peculiari di quel dato oggetto digitale, che lo caratterizzano in modo univoco fin dalla sua origine e che lo distinguono da qualsiasi altro oggetto digitale informazioni sulle persone che, a vario titolo, hanno concorso alla sua creazione informazioni sul luogo e data di creazione informazioni sull’evento che ha occasionato la sua creazione, sull’argomento od oggetto documentato informazioni sui collegamenti con altri oggetti (digitali o analogici) Informazioni su … … … … … … ruolo fondamentale svolto dai metadati, cioè da informazioni stabilmente associate all’oggetto digitale (metadati di contesto)

44 OBIETTIVO Autenticità
I metadati sono informazioni strutturare associate stabilmente all’oggetto digitale Come avviene l’associazione tra metadati ed oggetto digitale? metadati memorizzati all’intero di uno specifico file, distinto dai file che costituiscono l’oggetto digitale vero e proprio metadati incorporati all’interno dei file dell’oggetto digitale Problema: l’obsolescenza tecnologica investe i file che formano l’oggetto digitale, ma anche il file con i metadati. Vi è un circolo vizioso senza fine?

45 i metadati relativi all’oggetto digitale
OBIETTIVO Autenticità Il file che contiene i metadati relativi all’oggetto digitale è solitamente in formato XML XML (eXtensible Markup Language) è un formato FILE: - non proprietario, cioè libero - aperto, cioè pubblico - standard - trasparente, cioè non binario Un file XML è meno soggetto di altri all’obsolescenza tecnologica. Quindi il suo contenuto rimarrà correttamente interpretabile anche dopo molto tempo garanzia di stabilità per i metadati associati ai file che costituiscono l’oggetto digitale vero e proprio

46 L’oggetto digitale come pacchetto informativo
OBIETTIVO Metadati memorizzati all’intero di uno file distinto dai file che costituiscono l’oggetto digitale vero e proprio Autenticità SIP DIP AIP L’oggetto digitale come pacchetto informativo (OAIS)

47 Per metadatare gli oggetti digitali esistono molteplici standard
OBIETTIVO Autenticità Per metadatare gli oggetti digitali esistono molteplici standard Vantaggi nel ricorso a uno standard: lo standard aiuta a individuare le informazioni che più utilmente debbono essere metadatate (approccio non improvvisato e soggettivo) lo standard permette di produrre dei metadati che sono conformi a quelli prodotti da altri soggetti, facilitando dunque lo scambio di informazioni e la disseminazione degli oggetti digitali sul web Dublin core MAG METS MODS/MADS Standard di catalogazione e descrizione archivistica: ISBD, REICAT, UNIMARC … ISAD (G), ISAAR (CPF), EAD, EAC … PREMIS

48 OBIETTIVO Autenticità
DUBLIN CORE: standard ISO di carattere molto generale che individua 15 «attributi» (metadati) per la descrizione degli oggetti digitali, in particolare le pagine web. E’ pensato per essere utilizzato nel più ampio insieme possibile di casi, senza particolari caratterizzazioni in senso catalografico o archivistico e con la finalità di facilitare la ricerca, l’identificazione e il recupero degli oggetti digitali. < MAG (Metadati amministrativi e gestionali): standard italiano espresso con una sintassi XML, che ha l’obiettivo di fornire le specifiche per la raccolta e gestione dei metadati e dei relativi oggetti digitali nei rispettivi archivi e per la loro disseminazione. < MODS (Metadata object description schema) / MADS (Metadata authority description schema): standard mantenuti dalla Library of Congress e basati sulla sintassi XML. Di derivazione bibliografica, sono stati elaborati soprattutto per gli oggetti digitali pubblicati sul web. Hanno dunque una natura prevalentemente descrittiva. < e

49 OBIETTIVO Autenticità
METS (Metadata enconding and trasmission standard): standard mantenuto dalla Library of Congress, basato sulla sintassi XML e finalizzato alla codifica di metadati descrittivi, amministrativi e strutturali di un oggetto digitale. Lo standard si presta quindi per la gestione e conservazione degli oggetti digitali, per il loro scambio tra diversi repository, ma anche per la loro trasmissione a un utente finale. PREMIS (Preservation metadata: implementation strategies): standard internazionale, mantenuto dalla Library of Congress. Supporta la sintassi XML. E’ finalizzato alla produzione dei metadati utili a supportare corretti processi per la conservazione e l’usabilità a lungo termine degli oggetti digitali. Per questo lo standard fa sostanzialmente riferimento ai metadati che devono essere prodotti a partire dal momento in cui gli oggetto digitali sono affidati a un sistema di conservazione.


Scaricare ppt "LA CONSERVAZIONE DEGLI OGGETTI DIGITALI:"

Presentazioni simili


Annunci Google