Progetto tirocini formativi OPAC e ricerche on-line Elementi di archiviazione e catalogazione con tecnologie informatiche e telematiche © Cristina Angeloni
Information retrieval Insieme di tecniche utilizzato per il recupero mirato dell’informazione elettronica Richiamo= documenti pertinenti recuperati nella ricerca documenti pertinenti esistenti nella banca dati interrogata Precisione = documenti pertinenti recuperati nella ricerca documenti (pertinenti o no) recuperati nella ricerca Le strategie di ricerca che aumentano la precisione diminuiscono il richiamo e viceversa
Operatori booleani Sono dette booleane tutte quelle variabili che possono assumere unicamente due valori: VERO o FALSO. Sulle variabili booleane si può agire con degli operatori quali: AND, OR, NOT Nelle ricerche di parole chiave all’interno di un documento si utilizzano anche altri operatori tra cui: ADJ, NEAR, FAR, BEFORE.
Operatori booleani: AND X AND Y è vera quando sia X che Y sono vere, altrimenti è falsa Esempi di ricerca: biblioteche AND Bologna restituirà tutti i documenti che contengono entrambe le parole.
Operatori booleani: OR X OR Y è falsa quando sia X che Y sono false, altrimenti è vera Esempi di ricerca: biblioteche OR Bologna restituirà tutti i documenti che contengono o biblioteche o Bologna o entrambe le parole.
Operatori booleani: NOT NOT X è vera quando X è falsa Esempi di ricerca: biblioteche AND (NOT Bologna) restituirà tutti i documenti che contengono biblioteche e non Bologna. Questa ricerca è utile per recuperare tutti i documenti che parlano di biblioteche tranne che di quelle di Bologna.
Operatori booleani: ADJ X ADJ Y ritorna vero se X e Y si trovano in qualsiasi ordine una adiacente all’altra Esempi di ricerca: Vasco ADJ Rossi restituirà tutti i documenti che contengono sia Vasco Rossi che Rossi Vasco.
Operatori booleani: NEAR X NEAR Y ritorna vero se X e Y si trovano ad una distanza massima di n posizioni Esempi di ricerca: Roma NEAR hotel restituirà tutti i documenti che contengono Roma e ad una distanza massima di 25 parole (se n=25) la parola hotel
Operatori booleani: FAR X FAR Y ritorna vero se X e Y si trovano ad una distanza minima di n posizioni Esempi di ricerca: torta FAR mele restituirà tutti i documenti che contengono torta e mele ad una distanza minima di 25 parole (se n=25). Se il documento contenesse torta di mele non verrebbe restituito
Operatori booleani: BEFORE X BEFORE Y ritorna vero se X e Y si trovano nell’ordine specificato ad una qualsiasi distanza Esempi di ricerca: torta BEFORE mele restituirà tutti i documenti che contengono torta di mele e non quelli che contengono, per esempio, mele per fare la torta.
Caratteri Jolly Sono dei caratteri che servono per rendere più generali e vaste le ricerche. Possono valere qualsiasi carattere, qualsiasi numero di caratteri (es. *) o qualsiasi carattere un carattere (es. ?). gatt* ritornerà gatto, gattopardo, gattomammone, gattoni, .. gatt? ritornerà solo gatto, gatti, gatte.
Diacritici e caratteri accentati Internet è nata in lingua inglese, senza accenti e senza caratteri diacritici I caratteri contenuti nei testi in Internet appartengono al set ASCII (American Standard Code for Information Interchange) che può rappresentare fino a 256 caratteri. Solo l’ASCII ristretto è universale ed è composto da solo 128 caratteri: numeri, lettere maiuscole e minuscole (senza accenti), simboli di punteggiatura, spazio ed alcuni codici di controllo più i seguenti caratteri: ! “ # $ % $ & ? ( ) * + - / < = > ? @ [ \ ] ^ _ { | } ~ Caratteri diacritici sono segni aggiunti ad un carattere dell'alfabeto per modificarne significato o pronuncia ASCII
GLI OPAC Gli OPAC (on-line public access catalog) sono i cataloghi digitali che le biblioteche mettono a disposizione via Internet, di solito gratuitamente Inserire i dati in rete è però un lavoro che richiede molte energie e molto tempo e può capitare che i volumi acquisiti prima che esso venisse introdotto (il pregresso) inizialmente non vi sono compresi.
Vantaggi dei cataloghi automatizzati Possono essere consultati da qualsiasi calcolatore connesso in rete, in tutto il mondo, senza bisogno di recarsi fisicamente nelle rispettive biblioteche Permettono di cercare gli stessi libri in molte biblioteche contemporaneamente. Minor ridondanza di informazioni Ogni parola della descrizione costituisce una chiave di accesso Possibilità di salvare risultati della ricerca Possibilità di accedere a più cataloghi contemporaneamente
COME COLLEGARSI AGLI OPAC Nelle biblioteche dotate di OPAC, ci sono generalmente dei terminali a disposizione del pubblico, già configurati in modo da presentare una videata per l'interrogazione dei cataloghi. Volendo consultare i cataloghi a distanza, attraverso un altro calcolatore connesso a Internet, occorre avviare il software per la navigazione e digitare l'indirizzo (URL) corrispondente. Es. http://opac97.bl.uk/ E’ anche possibile consultarli in modalità telnet, (utilizza un protocollo di trasmissione dei dati molto diffuso prima dello sviluppo del World Wide Web). Gli indirizzi telnet iniziano per "telnet://" oppure per "tn3270://".
OPAC: collettivi integrati Sono i veri cataloghi collettivi, equivalenti di quelli elettronici. Gli archivi di più OPAC vengono riversati in uno solo e le schede che si riferiscono allo stesso documento vengono schiacciate una sull’altra. Sono vantaggiosi per gli utenti che non vengono sepolti da dati doppi e per i bibliotecari che si limitano a segnalare il possesso di un documento evitando di registrarlo ex novo.
OPAC: collettivi cumulati Sono costituiti dall’unione degli archivi di più OPAC, senza effettuare lo schiacciamento delle schede identiche in una sola descrizione bibliografica. Questi archivi hanno un elevato numero di dati molti dei quali ridondanti.
Meta-OPAC Permettono di effettuare ricerche su molti OPAC, indipendenti e separati, contemporaneamente. I risultati della ricerca vengono solitamente suddivisi per OPAC di origine. Le schede doppie non vengono schiacciate Le ricerche effettuate sui singoli OPAC risultano più precise di quelle sul Meta-OPAC.
Multi-OPAC Termine spesso usato come sinonimo di Meta-OPAC Indica la possibilità di interrogare vari OPAC, separati ed indipendenti, uno alla volta e tramite una sola maschera di ricerca. Se il Meta-OPAC permette di selezionare l’OPAC singolo su cui effettuare la ricerca, allora si trasforma in un Multi-OPAC
OPAC: la British Library (BL) http://www.bl.uk/ Nel Regno Unito svolge il ruolo di biblioteca nazionale centrale Le collezioni della BL comprendono 150 milioni di documenti, raccolti in più di 250 anni Possiede vari archivi di cui solo uno gratuito: BLAISE Current serial File Inside GABRIEL OPAC’97
BL: OPAC 97 http://opac97.bl.uk/ OPAC 97 è il servizio più interessante perché fornisce il libero accesso a 7 dei più importanti cataloghi della BL Suggerimenti per le ricerche Il sistema non è “case sensitive” Non riconosce lettere accentate e diacritici I termini digitati, se separati da virgola, vengono considerati uniti da AND, altrimenti trattati come una frase esatta Carattere jolly per n caratteri è “:”, per un carattere “#”
OPAC: la Bodleian Library http://www.bodley.ox.ac.uk/ E’ gestita dall’Università di Oxford e comprende la Central Bodleian e altre 7 biblioteche Si occupa, in particolare, di: letteratura inglese, storia moderna, lingue e letterature classiche, storia antica, teologia, manoscritti, arte, studi latino americani, filosofia, scienze politiche, geografia e cartografia, musica, studi orientali.
OPAC: Bibliothèque nationale de France (BNF) http://www.bnf.fr Possiede due cataloghi elettronici: BN-OPALE che contiene libri e periodici posseduti dalla biblioteca BN-OPALINE per le collezioni specializzate E’ possibile accedere ai due cataloghi via Web all’idirizzo: http://www.bnf.fr/web-bnf/catalog/cat-imp.htm
OPAC: Library of Congress http://lcweb.loc.gov/ E’ a biblioteca più grande del mondo, possiede una struttura con 4100 addetti e 530 migliaia di scaffalature Lo scopo della biblioteca è quello di acquisire tutti i libri e documenti necessari al Congresso degli Stati Uniti e ai funzionari federali, con particolare attenzione a ogni materiale legato alla vita e alla storia del popolo americano. E’ possibile accedere via Telnet utilizzando il sistema LOCIS
LC: Accesso via Web http://lcweb.loc.gov/catalog/ La ricerca con parole chiave è stata sviluppata in due versioni: Simple e Advanced Nel caso della ricerca avanzata si possono utilizzare gli operatori booleani AND, OR, NOT, NEAR(n), ADJACENT e BEFORE Nel caso di ricerche con termini multipli tutte le parole si devono trovare in quello stesso campo Non usare mai singoli apici (es. per genitivo sassone, ma unire la s alla parola precedente)
OPAC: MELVYL http://www.melvyl.ucop.edu/ MELVYL è il catalogo che comprende le biblioteche della California Comprende più di 9 milioni di titoli, corrispondenti ai 14 milioni di pezzi appartenenti alla California State University e a tutte le biblioteche dei 9 Campus del Sistema dell’Università della California. Un sottoinsieme della’archivio generale contiene solo le acquisizioni degli ultimi 10 anni (TEN)
MELVYL: accesso via Web Le ricerche possono essere effettuate, oltre che per autore, titolo e soggetto, sfruttando una “Power Search” che consente la selezione di più campi contemporaneamente e l’uso degli operatori AND, OR, NOT Per iniziare una ricerca è necessario fare clic sul bottone “submit” # è il carattere jolly per il troncamento delle parole Per ricevere i risultati sul proprio PC è possibile utilizzare i bottoni MAIL o DOWNLOAD.
OPAC: HOLLIS http://hplus.harvard.edu/ Hollis (Harvard OnLIne Library Information System) è il sistema bibliotecario dell’Università di Harvard. Comprende circa 90 biblioteche di vui una anche in Italia a Firenze (The Harvard University Center for Italian Renaissance Studies) Contiene 10 singoli archivi di cui l’HU (Union Catalog) contiene 8 milioni di libri periodi e manoscritti, mentre l’OW (Older Widener materials) contiene il materiale catalogato prima del 1976 dalla Widener Library
OPAC: CARL http://ww.carl.org/carlweb CARL (Colorado Alliance of Research Library) è l’OPAC delle Università di Standford, Princeton e Berkeley Garantisce via Web l’accesso a più di 400 cataloghi individuali di biblioteche e a molti altri archivi, molti degli altri servizi offerti sono a pagamento e richiedono una password
OPAC: ORBIS http://webpac.library.yale.edu/ ORBIS è il catalogo on-line delle biblioteche dell’Università di Yale. Contiene diversi cataloghi (ACAD, PSYC, BIOSIS) ma l’unico accessibile liberamente è quello indicato con OPAC Contiene tutto il materiale acquisito a partire dal 1977 e in parte anche precedenti. Si occupa, in particolare, di:letteratura e storia americana, teatro americano, guerra civile americana, l’archeologia, la medicina clinica, la storia economica, i classici latini e greci, le arti grafiche, l’astronomia.
SBN (Servizio Bibliotecario Nazionale) E’ l’OPAC collettivo del Servizio Bibliotecario Nazionale che raccoglie circa 800 biblioteche raggruppate in 34 Poli locali. Il progetto nato nel 1982 è divenuto pienamente operativo solo nel 1992 Aderiscono a SBN biblioteche statali, comunali, universitarie, di accademie e istituzioni pubbliche SBN è liberamente accessibile via Internet sia tramite Telnet che Web.
SBN: organizzazione e servizi Il servizio viene alimentato tramite la catalogazione partecipata: un documento viene catalogato solo dalla prima biblioteca che lo acquisisce, le altre biblioteche si limitano ad aggiungere solo la propria localizzazione. Oltre alla ricerca bibliografica, SBN permette: 1 richieste di prestiti interbibliotecari 2 domande di trasmissione di copie di documenti 3 compilazione di proposte di acquisto di documenti non ancora posseduti da SBN
SBN: come viene gestito Il software è sviluppato e gestito dal Ministero per i Beni Culturali e Ambientali e dalle Regioni Piemonte, Lombardia ed Emilia Romagna L’indice centrale è gestito dal Ministero I Poli sono gestiti dalle Regioni e dalle Università L’accesso via gateway HTTP/Z39.50 è gestito da Finsiel
SBN: le basi dati presenti Libro moderno Libro antico Beni musicali Manoscritti Le basi dati specializzate Discoteca di stato DOBIS Anagrafe delle Biblioteche Italiane Libro moderno: prima ad essere stata costituita, monografie e periodici con data successiva al 1830. 3 milioni di momografie e 110.000 periodici Libro antico Dall'inizio della stampa fino al 1830. 60.000 monografie Beni musicaliDocumenti musicali a stampa e manoscritti. 200.000 in totale di cui 80.000 manoscritti Manoscritti 600 descrizioni di maoscritti Sono predisposte per raccogliere letterautra grigia e spogli (articoli, estratti) appartenneti a qualsiasi disciplina Discoteca di stato 64.000 documenti sonori DOBIS è il pacchetto software di camera, istituto superiore della sanità ed ENEA 1.000.000 di notizie bibliografiche Comprende i dati di quasi 11.000 biblioteche
SBN: ricerche via Web Nella ricerca base le parole utilizzate come termini di ricerca sono considerate sempre compresenti Nella ricerca specializzata, limitata ad un solo archivio, l’utente può scegliere diverse relazioni logiche utilizzando gli operatori: AND, OR, NOT, ADJ IL carattere jolly per effettuare il troncamento è “@” Libro moderno: prima ad essere stata costituita, monografie e periodici con data successiva al 1830. 3 milioni di momografie e 110.000 periodici Libro antico Dall'inizio della stampa fino al 1830. 60.000 monografie Beni musicaliDocumenti musicali a stampa e manoscritti. 200.000 in totale di cui 80.000 manoscritti Manoscritti 600 descrizioni di maoscritti Sono predisposte per raccogliere letterautra grigia e spogli (articoli, estratti) appartenneti a qualsiasi disciplina Discoteca di stato 64.000 documenti sonori DOBIS è il pacchetto software di camera, istituto superiore della sanità ed ENEA 1.000.000 di notizie bibliografiche Comprende i dati di quasi 11.000 biblioteche
ACNP (Archivio Collettivo Nazionale dei Periodici) E’ nato negli anni settanta per iniziativa dell’ISRDS-CNR (Istituto di Studi sulla Ricerca e Documentazione Scientifica del Consiglio Nazionale delle Ricerche) Contiene le descrizioni le descrizioni delle pubblicazioni periodiche italiane e straniere possedute da circa 2.200 biblioteche italiane.
Z39.50 Z39.50 è uno standard nazionale che definisce un protocollo per il recupero di informazioni tra computer. Z39.50 permette ad un utente di un sistema di ricercare e recuperare informazioni da un altro sistema di computer (su cui è implementato Z39.50) senza conoscerne la sintassi di ricerca utilizzata. Rende possibile lo scambio di informazioni bibliografiche anche tra sistemi che operano su differenti piattaforme e utilizzano software fornito da case diverse. Z39.50 è uno standard nazionale Americano originale approvato dal National Information Standards Organization (NISO) nel 1988.
Bibliografia Carlo revelli in collaborazione con Giulia Visintin, Il catalogo, Editrice bibliografica, 1996 Pierantonio Bolognini ed Ismaele pedrini, Manuale del catalogatore, Editrice bibliografica, 1990 Fabio Metitieri, Riccardo Ridi, Ricerche bibliografiche in Internet, Apogeo, 1998. http://www.alice.it http://www.aib.it