Open Archive di Antonella De Robbio Referente SBA per il diritto d'autore Università degli Studi di Padova
Archivi Aperti Noti come Open Archive, o E-prints server, sono archivi preposti al deposito dei documenti scientifici, in forma elettronica, alla loro gestione e conservazione. Possono essere organizzati a livello istituzionale o a livello disciplinare. I documenti elettronici possono essere depositati direttamente dagli autori attraverso un semplice processo noto come auto-archiviazione. Non va confuso il termine auto-archiviazione (self-archiving) con quello di auto-pubblicazione (self-publishing)
Cosa sono gli e-prints? Gli e-prints sono copie elettroniche di papers accademici. Gli archivi di e-prints consentono agli autori di rendere i propri pre-prints pre- referati, e i propri lavori post-print referati, liberamente disponibili alla comunità internazionale scientifica, disseminandoli su scala mondiale, cosa impossibile per un lavoro su carta
Lauto-archiviazione Molti sono i ricercatori che da alcuni anni archiviano i loro lavori sui server delle loro istituzioni o in server disciplinari, per esempio per la biomedicina, l'astronomia, la chimica,... la matematica, dopo la fisica, è il campo, dove si è fatto l'uso più massiccio di server di pre-print Anche all'interno di una stessa disciplina però, non sempre i comportamenti sono omogenei
Tipologie di Open Archive Numerose sono le esperienze nel mondo e anche le tipologie tecniche –modello accentato –modello distribuito A livello organizzativo le scelte possono essere –server istituzionali (institutional repositories) –server subject-based o disciplinari –esistono inoltre altre soluzioni: gli umbrella server (specie di MetaOA) individual data provider (modello Kepler)
Archivi Aperti e interoperabilità Ciascun documento depositato è corredato da metadati in formato standard che vengono esposti per la raccolta (harvesting) Gli archivi sono detti aperti in quanto possono essere interrogati da un servizio (service provider) che si occupa di indicizzare i metadati raccolti dai vari archivi attraverso la funzione di harvesting Un deposito entro larchitettura OAI Open Archive Initivative è noto come data provider
Big versus Small ArXiv modello accentrato: nasce a Los Alamos National Lab. nel 1991, in origine si riferiva solo a documenti per la comunità HEP. Serve circa utenti di oltre 70 Paesi. Nel 2000 vi sono stati 13 milioni di documenti scaricati. La crescita delle sottomissioni è pari a 3500 nuovi lavori annui, per oltre sottomissioni a fine La centralizzazione di ArXiv è stato un processo che è iniziato a partire dal 1994, prima esistevano piccoli archivi su base disciplinare che funzionavano con lo stesso software
Modello distribuito RePEc, la più grande collezione del mondo di documenti per l'economia ad accesso libero, a modello distribuito collega oltre 200 archivi con oltre articoli e rapporti tecnici di ambito economico disponibili online sorto nel 1999 per opera di Thomas Krichel ciascuno diventa mirror e garantisce laccesso anche ai dati di tutti gli altri archivi
Il modello di pubblicazione scientifica decostruito [termine coniato da J. Smith] I depositi istituzionali possono giocare un ruolo significativo del processo evolutivo della ristrutturazione della comunicazione scientifica Le tradizionali pubblicazioni a stampa integrano in un unico modello 4 componenti
Le 4 componenti essenziali nella comunicazione scientifica [descritte da Roosendaal e Geurts] Registrazione: stabilire la priorità intellettuale di unidea, un concetto, o una scoperta scientifica Certificazione: certificare la qualità della ricerca e/o la validità delle scoperte dichiarate Consapevolezza: assicurare la disseminazione e laccessibilità delle produzioni della ricerca, fornendo un mezzo attraverso il quale i ricercatori possono essere avvertiti delle novità della ricerca Archiviazione: conservare il patrimonio intellettuale per le fruizioni future
Institutional repositories: cosa sono I depositi istituzionali di documenti sono collezioni digitali che raccolgono e conservano la produzione intellettuale delle comunità accademiche (singoli o multi Atenei) possono essere considerati estensione naturale delle responsabilità dellistituzione accademica in qualità di generatori di ricerca primaria sono potenzialmente la componente più importante nellevoluzione della struttura dei nuovi modelli di comunicazione scientifica
Institutional repositories: a cosa servono offrono una risposta strategica ai problemi esistenti nel sistema che regola i periodici scientifici offrono un immediato complemento di qualità al modello di pubblicazione scientifica ad oggi esistente stimolano linnovazione entro una struttura di editoria disaggregata servono come indicatori tangibili della qualità di unistituzione, ne incrementano la visibilità, il prestigio e il valore a livello pubblico
Situazione frammentaria Centinaia di e-server: istituzionali, disciplinari, accentrati, distribuiti, piccoli, grandi, depositi di collezioni,... Papers sparsi sui siti Web Umbrella servers es. MPRESS) MetaMotori OA (service provider) CiteSeer, servizio precedentemente chiamato ResearchIndex, costruito da NEC Research Institute Cooperazione e interoperabilità
Due le aree di intervento Da una parte si trovano iniziative come OAI nata con lo scopo di –sviluppare e promuovere standard per l'interoperabilità tra archivi –essere di supporto ad un'efficiente disseminazione di contenuti; Dall'altra si collocano iniziative come la Budapest Open Access Initiative BOAI o il movimento Free Online Scholarship FOS
Open Archive Initiative OAI è supportata nelle sue iniziative dalla Digital Library Federation e da Coalition for Networked Information e riceve finanziamenti da National Science Fundation fonda le sue radici nel continuo sforzo teso al miglioramento dell'accesso ai documenti entro gli archivi e-print, mette a disposizione strumenti, software e documentazione (protocolli, standard) promuove l'utilizzo di metadati standard
In OAI esistono due categorie di server i data provider, i quali contengono i documenti depositati e che supportano il protocollo OAI esponendo i metadati relativi ai lavori contenuti nel server. Un data provider gestisce uno o più server, per il deposito (Web servers repositories) i service provider, usano i metadati dei data provider come base per la costruzione di servizi a valore aggiunto.
harvesting Open Archives Initiative Protocol for Metadata Harvesting Protocol indispensabile per rendersi visibili ai fini della raccolta è necessario esporre i propri metadati al colloquio entro la comunità internazionale in un formato compatibile metadati per linteroperabilità
Le iniziative di sensibilizzazione Il movimento FOS Free Online Scholarship coordinato da Peter Suber Public Library of Science organizzazione no-profit di scienziati per una letteratura biomedica free-access –lettera aperta agli editori firmata da scienziati di 180 Paesi
Budapest Open Access Initiative BOAI 1. Budapest Open Access Initiative BOAI –nata il 14 febbraio 2002 –conta oggi oltre 2300 firmatari –finanziata dalla Fondazione Soros di OSI Open Society Institute. OSI elargirà un milione di dollari per anno, per tre anni consecutivi, per lo sviluppo di un progetto il quale prevede piani e modelli per l'auto-archiviazione "sostenibile" in oltre 140 Paesi
Budapest Open Access Initiative BOAI 2. si distingue da OAI giacché il suo scopo è di fare pressione sugli autori al fine di ottenere un consenso generalizzato lo scopo primario è quello di promuovere lauto- archiviazione non si occupa di applicazioni software o di aspetti tecnologici, è focalizzata principalmente sui processi di peer- reviews.
I Software disponibili ArXive, Kit NCSTRL (ex-protocollo Dienst): per server disciplinari Eprints software (OAI compatibile): per server istituzionali Kepler software: per server individuali DSpace di MIT. Gestisce anche formati multimediali utili alla didattica CDSware del CERN: funge anche da portale con motore che ricerca entro le collezioni della biblioteca EDT Virginia Tech per le Tesi
Cosa è EPrints ? E un software Open source per costruire, gestire e fornire accesso ad archivi di e-print entro un quadro di Digital Library Nato dallidea del prof. S. Harnad è sviluppato alla Southampton Univ. E un software libero rilasciato con licenza GNU GPL (General Public License), fa uso di numerosi altri software liberi (es. MySQL). E pienamente interoperabile con il protocollo OAI (Open Archives Initiative) per la raccolta dei metadati
Configurazione di EPrints Facile da installare –Script di installazione automatici nella maggior parte dei processi di installazione Requisiti minimi: meno di 500 MB di spazio per lo storage. Indipendenza da altri software di supporto: Apache, MySQL, PERL, Plug- ins for PERL, gcc Facile da usare e da amministrare: basato su Web
Esempi di siti
Kepler framework Strumento per la creazione di personal data provider o archivelets indipendenti dalla piattaforma facilità di utilizzo da parte di singoli ricercatori scarico e auto-installazione semplice e rapida su workstation PC individuali servizio di registrazione automatica a supporto di decine di migliaia di pubblicatori individuali servizio di raccolta di metadati dagli archivelet semplice e poco pesante
Condivisione di dati individuali Il suo nome deriva dal grande teorico Johannes Kepler. Carl Sagan nel suo libro Cosmos racconta di come Keplero lottò per ottenere i dati dal suo collega-maestro Tycho Brahe, il grande osservazionalista. Solo quando Brahe fu sul letto di morte dette laccesso a Kepler a tutti i suoi dati di ricerca.
Keplero: architettura Larchitettura di Keplero supporta due tipi di utenti: –pubblicatori individuali i quali usano gli strumenti dellarchivelet –utenti generali interessati a recuperare i documenti pubblicati Il servizio di registrazione tiene traccia dello status di registrazione dellarchivelet (attivo/non attivo), attraverso un modello istant-messenger, mutuato da Napster, dove nel server centrale viene mantenuta traccia (in cache) dei client attivi struttura molto simile a un broker basato su modello di rete P2P
Figura 1. Architettura di Keplero Copyright 2001 Kurt Maly, Mohammad Zubair, and Xiaoming Liu
Figura 2. Architettura di Keplero e modello di rete Peer-to-Peer Copyright 2001 Kurt Maly, Mohammad Zubair, and Xiaoming Liu
Copyright 2001 Kurt Maly, Mohammad Zubair, and Xiaoming Liu
Keplero: le parti componenti 1. Deposito OAI compatibile 2. Strumento per la pubblicazione/deposito 3. Servizio di registrazione (basato su LDA) 4. Service Provider sono rivolti al pubblicatore individuale, 3. tiene traccia degli archivelets registrati compreso il loro stato di disponibilità, 4. offre un alto livello di servizio come ricerca di un documento pubblicato entro tutti gli archivelet registrati
Keplero: strumenti per la pubblicazione/deposito Il kit publication tools consiste di: –semplice display dellarchivio –strumento per specificare i metadati e per caricare i file entro larchivelet Il file zip auto-installante contiene, oltre al kit publication tools, il client per il processo di registrazione automatica e il client per linterazione con il service provider (strato OAI e server web semplificato)zip auto-installante
Service provider Arc: risultato ricerca
DSpace: nuova soluzione al MIT DSpace è una piattaforma software open source (licenza BSD) OAI compatibile, adatta agli atenei –cattura e descrive opere digitali utilizzando moduli Web per la sottomissione dei lavori –aggrega e recupera i lavori dellistituzione: didattica e ricerca –conserva a lungo termine le opere digitali –crea un sistema elettronico per la disseminazione delle produzioni intellettuali –gestisce utenze diversificate (studenti) con controllo degli accessi –gestisce multimedialità:supporta formati numerosi formati utili al contesto E-learning
Due i canali: le comunità e le collezioni
La trasformazione dellOA il concetto OpenArchive si trasforma: da pre-print diviene e-print, perde il prefisso "pre" a ricomprendere tutti i tipi di documenti il vero OA è un deposito di documenti appartenenti a una determinata comunità ruolo dell'EPrints di Harnad è assai più ampio rispetto al semplice pre-print server
Il vero OA modello che porta dentro il "seme" della parola "disseminazione concetto profondamente diverso da quello della distribuzione disseminazione implica una crescita incrementato a tal punto da evolvere e divenire una forma di comunicazione e immagazzinamento della produzione scientifica nella sua interezza
Nella vita, non ci sono soluzioni. Ci sono forze in movimento: queste necessitano di essere creare e le soluzioni seguono … [In: Volo di notte, Antoine de Saint-Exupéry, Chap. 19]