Caratteristiche del sistema CDS/ISIS e dell’applicativo TECA 15/11/2018 CDS/ISIS e TECA (DBA, Firenze)
La sue caratteristiche sono: Software di information retrieval Multipiattaforma (Ms-Dos, Linux, Unix, Windows, Macintosh ... ) Specifiche soluzioni per il trattamento di dati testuali (gestione e recupero di informazioni a forte contenuto di testo) Ottimizzazione dello spazio di memoria occupato 15/11/2018
Caratteristiche Linguaggio di ricerca avanzato con uso di operatori booleani, di adiacenza, prossimità (campo, occorrenza, posizione della parola) Gestione di campi ripetibili Gestione di documenti strutturati in campi e sottocampi 15/11/2018
Caratteristiche Linguaggio di formattazione dei dati che permette di personalizzarne la presentazione Funzionalità di data entry, definizione archivi, ordinamento e stampa 15/11/2018
Librerie per la programmazione Librerie elaborate per la programmazione in ambiente locale e su web Utilizzo di linguaggi di programmazione professionali (Visual Basic, Visual C, Delphi, Perl, Php, Java ...) Integrazione delle funzionalità esistenti in WinISIS e ISIS per DOS Sviluppo di interfacce ad hoc 15/11/2018
Formati supportati per lo scambio dei dati File testo con delimitatore (es. csv) File testo con taggatura personalizzabile Formato ISO2709 Formato XML Formato DBF Formato RTF Acquisizione dati da tabelle relazionali 15/11/2018
La distribuzione del software In ogni continente esistono distributori CDS/ISIS Supportate versioni in arabo, coreano, cirillico ... Liste di discussione degli utenti e dei programmatori con attiva partecipazione dell'Unesco 15/11/2018
La distribuzione del software Per l'Italia il distributore nazionale è DBA, Firenze Per gli istituti del Ministero dell'istruzione viene fatta da INDIRE, Firenze Il software, così come prodotto dall'Unesco, viene rilasciato gratuitamente, dietro compilazione di una licenza 15/11/2018
Rete degli sviluppatori Unesco BIREME, Biblioteca regionale de medicina, OMS, San Paolo, Brasile INDIRE, Istituto nazionale di documentazione per l'innovazione e la ricerca educativa, Ministero per l'istruzione, Firenze DBA, Firenze CRIBECU, Scuola normale superiore, Pisa FAO, Roma ……………….. 15/11/2018
La struttura del db CDS/ISIS Un db CDS/ISIS è composto dai file di struttura: nomedb.FDT: campi previsti per l’inserimento ?nomedb.FMT: worksheet per l’inserimento nomedb.PFT: formato di visualizzazione e stampa nomedb.FST: campi previsti per la ricerca 15/11/2018
TECA Teca è un database creato nel 1986 dalla Regione Toscana per la descrizione documentaria. E’ stato utilizzato per registrare milioni di record sia nella versione per DOS che per Windows. Gli archivi sono sempre compatibili tra loro, in tutte le versioni E’ basato sulle strutture degli ISBD (descrizione) e RICA (intestazione) Le aree di informazione sono relative a: Intestazione Descrizione Gestionale Indicizzazione 15/11/2018
TECA Strutture di riferimento: RICA, ISBD e Unimarc Utilizzabile per descrivere tutti i materiali previsti negli standard. Ad esempio: bibliografico, audiovisivo, periodico ... 15/11/2018
TECA La struttura di TECA è modificabile Si possono: modificare, aggiungere, eliminare campi e sottocampi aggiungere link a file esterni (immagini, documenti, siti ...) mettere in relazione archivi diversi navigare in modo ipertestuale tra i record 15/11/2018
TECA Cooperazione tra gli operatori Le modifiche alla struttura di TECA vanno limitate per evitare incongruenze nella fase di raccolta dati I dati possono essere cumulati anche off line (es. produzione di Cd-Rom) utilizzando le funzioni di import/export dei dati 15/11/2018
TECA Vantaggi della cumulazione dei dati off line: Distribuzione anche a realtà che non dispongono agevolmente di connessioni ad Internet Costo limitato dei supporti Semplicità delle procedure 15/11/2018
TECA Svantaggi della cumulazione dei dati off line: Duplicazione delle descrizioni Variazioni di interpretazione Tempi di aggiornamento Tempi di formazione degli amministratori del db 15/11/2018
TECA Manutenzione dei database In locale: File che contengono i dati (*.mst e *.xrf) File che contengono la struttura (*.fdt, *.fst, *.fmt, *.pft) File che contengono gli indici di ricerca (*.ifp, *.cnt, *.l01, *.l02, *.n01, *.n02) 15/11/2018
La struttura di TECA (a sinistra il numero del campo) Aree descrizione (ISBD) 1. Titolo e della responsabilità 2. Edizione 3. Tipologia materiale 4. Pubblicazione/Stampa 5. Descrizione fisica 6. Serie 7. Note 8. ISBN e prezzo 15/11/2018
La struttura di TECA Intestazioni: 9. Principale. Autore persona 10. Principale. Autore collettivo 11. Principale. Titolo uniforme 12. Secondarie. Autori persona 13. Secondarie. Autori collettivi 14. Secondaria. Titoli 15/11/2018
La struttura di TECA Indicizzazione: 15. Soggetti 16. CDD 17. Abstract 31. Indice verbale della CDD 15/11/2018
La struttura di TECA Gestionali (1): 18. Paese di pubblicazione 19. Lingua di pubblicazione 20. Tipologia utente 21. Registro cronologico entrata (inventario, fornitore ...) 22. Collocazione 23. Stato registrazione 24. Catalogatore 25. Data immissione 15/11/2018
La struttura di TECA Livelli bibliografici: 26. Numero agenzia bibliografica 27. Numero agenzia documento livello subordinato 28. Numero agenzia documento livello sovraordinato 29. Numero del volume, tomo, parte ... 15/11/2018
La struttura di TECA Gestionali (2): 30. Tipologia materiale (Unimarc) 940. Note di consistenza 15/11/2018
La struttura di TECA Alcuni campi sono strutturati in sottocampi, analogamente a come le aree ISBD sono strutturate in semiaree Es. ^aLe avventure di Pinocchio^estoria di un burattino^fCarlo Collodi Le avventure di Pinocchio : storia di un burattino / Carlo Collodi 15/11/2018
La struttura di TECA Il codice che precede un sottocampo, e che consente al programma di distinguerlo per la punteggiatura da assegnare, è il simbolo “^” Ciascun sottocampo è identificato da una lettera o da un numero Es. ^cEinaudi Es. ^1Alimentazione^2Aspetti sociali 15/11/2018
La struttura di TECA Campi ripetibili Il campo ripetibile serve per poter aggiungere ulteriori informazioni della medesima tipologia, rendendole autonome le une rispetto alle altre (ricerca, stampa, indici …) Es. nelle intestazioni secondarie ^aFruttero^bCarlo%^aLucentini^bFranco 15/11/2018
La struttura di TECA I campi ripetibili non hanno limite di numero di occorrenze I dati vanno inseriti nell’ordine logico previsto dagli ISBD 15/11/2018
La struttura di TECA Es. Local impacts of nuclear power plants : an international comparison : the British experience and the Piedmontese case = Impatti locali delle centrali elettronucleari : un confronto internazionale : l'esperienza britannica e il caso piemontese / Alex Fubini & Alberico Zeppetella ^aLocal impacts of nuclear power plants^ean international comparison%^ethe British experience and the Piedmontese case%^dImpatti locali delle centrali elettronucleari^eun confronto internazionale%^el'esperienza britannica e il caso piemontese^fAlex Fubini & Alberico Zeppetella 15/11/2018
La struttura di TECA Vantaggi dell’uso dei sottocampi E’ garantita la struttura logica delle aree e delle semiaree I dati sono “puliti” da informazioni tipografiche (punteggiatura) variabili nel tempo e nel contesto. Formati possibili: bibliografie, inventario, scheda, indice …. Si possono indicizzare e ricercare singolarmente (autori, soggetti … ) 15/11/2018
La struttura di TECA L’inserimento di un sottocampo inadeguato viene evidenziato, nella visualizzazione, da una punteggiatura incoerente con la semiarea Sono previsti tutti i sottocampi relativi alle semiaree, l’obbligatorietà dell’inserimento dipende solo dalla presenza/assenza dei dati 15/11/2018
La struttura di TECA La stessa scheda può essere completata in fasi successive con gli elementi di cui si dispone via via Es. prima fase: dati dell’ordinativo seconda fase: dati dell’inventario terza fase: catalogazione descrittiva quarta fase: indicizzazione semantica 15/11/2018
La struttura di TECA Inserimento di caratteri per gestire gli ordinamenti nelle stampe Articoli e altri elementi da escludere nell’ordinamento della stampa si inseriscono tra < … > Es. <Le >avventure di Pinocchio D<‘>Annunzio (ordina come Dannunzio) <Un’>altra vita <S.=Santa >Reparata (stampa S. ma ordina come Santa) 15/11/2018
La struttura di TECA Inserimento di caratteri per l’estrazione di frasi in ricerca Nei campi a carattere descrittivo (es. note, abstract) si possono selezionare frasi significative per la ricerca, scartando così avverbi, preposizioni ed altro, inserendole tra < … > Es. … la distinzione tra <informazione> da un lato e <conoscenza registrata> dall’altro … 15/11/2018
La struttura di TECA Che cosa si può ricercare in TECA L’elenco dei campi e sottocampi su cui effettuare la ricerca e le modalità sono definiti nel file TECA.FST. Se un elemento non vi è indicato non è ricercabile 15/11/2018
La struttura di TECA Principali tecniche di estrazione dei dati nella FST 0: elemento intero 1: sottocampo per sottocampo 2: termini tra <…> 4: parola per parola allo stesso campo/sottocampo si possono applicare contemporaneamente più tecniche 15/11/2018
Linguaggio di ricerca Operatori booleani AND, OR, NOT Operatore di troncamento: a partire dalla stringa $ (es. bibliot$) Identificatori di campo: in campi determinati termine/(n) (es. Ferrara/(1)) Operatori di prossimità: stesso campo, stessa occorrenza (es. avventure (F) burattino) Operatori di adiacenza: come sopra e termini a determinata distanza (es. avventure . . Pinocchio) 15/11/2018