Documentazione giuridica & banche dati 1 Introduzione alla documentazione giuridica e alla ricerca Chiara Giovanna Bernardi bernardi@cirsfid.unibo.it Lezione tenuta nell’ambito del corso di: INFORMATICA E INFORMATICA DI BASE Facoltà di Giurisprudenza - Corso di laurea in Consulenti del Lavoro Titolare del corso: Francesco Tura (tura@cirsfid.unibo.it)
Documentazione giuridica automatica: elementi di riferimento DOCUMENTO Oggetto d’interesse delle discipline che si occupano di documentazione È l’oggetto dell’informazione contenuta nei documenti Può avere vari veicoli di diffusione: carta, CD, DVD, web ecc RICERCATORE Soggetto che cerca una soluzione ad un problema cognitivo Operatori del diritto: studiosi, professionisti, avvocati, giudici ecc Non professionisti: privati cittadini, studenti © CB
Fonti di documentazione giuridica La ricerca inerisce alla seguente tipologia di documentazione: Legislazione: insieme dei più importanti atti e fatti normativi presenti nell’ordinamento Ricercabilità: documenti provenienti dall’area legislativa ed emessi dalle autorità legittimate Giurisprudenza: insieme delle decisioni dei giudici di ogni ordine e grado e delle interpretazioni in esse contenute Ricercabilità: documenti provenienti dalla attività delle corti giudicanti Dottrina: insieme dei principi fondamentali, delle teorie, delle nozioni elaborate dal studiosi o da giudici nell’ambito della scienza del diritto Ricercabilità: documenti provenienti dall’area di studio e di ricerca © CB
Gerarchia delle fonti «atti o i fatti dai quali traggono esistenza le norme giuridiche che l’ordinamento riconosce come proprie» In particolare le fonti di cognizione: « tutti quei testi che contengono le norme giuridiche già formate » © CB
Legislazione: pubblicazione dei testi Elenchi: contengono solo i dati identificativi (tipo, data, numero) Raccolte: contengono dati identificativi e testo integrale Pubblicazioni normative ufficiali Gazzetta ufficiale delle Comunità europee Gazzetta ufficiale della Repubblica italiana Raccolta ufficiale degli atti normativi della Repubblica italiana: Bollettino ufficiale regionale Pubblicazioni normative private Repertori (Foro Italiano, Zanichelli; Rep. della Giurisprudenza Italiana, UTET; Rep. generale annuale di legislazione, bibliografia, giurisprudenza, Giuffrè; Leggi d’Italia, De Agostini) Supplementi a riviste di legislazione (Legislazione vigente, UTET; Rep. generale annuale di legislazione, bibliografia, giurisprudenza, Giuffrè) appendici legislative a voci enciclopediche © CB
Gazzetta Ufficiale della Repubblica Serie generale atti normativi emanati dagli organi statali (leggi costituzionali ed ordinarie, regolamenti parlamentari, decreti legislativi, decreti legge, regolamenti governativi; decreti presidenziali; decreti, delibere e ordinanze ministeriali) Serie speciali (4): 1) Comunità europee: atti delle Comunità europee; 2) Regioni: norme delle regioni e delle province autonome; 3) Corte Costituzionale: sentenze ed ordinanze della Corte Cost. 4) Concorsi ed esami: bandi e circolari governative. © CB
Gazzetta ufficiale Comunità Europee Serie L: Regolamenti CE, CECA, EURATOM, decisioni e raccomandazioni CECA (atti per la cui vigenza è necessaria la pubblicazione) Direttive, convenzioni, decisioni, pareri, protocolli, raccomandazioni, risoluzioni (atti a cui tale condizione non si applica) Serie C: Atti normativi (comunicazioni, atti preparatori e informazioni); Serie S: Bandi per le gare d’appalto. © CB
Dati normativi: formalizzazione Caratteri che contraddistinguono i dati normativi: Natura dell’atto Data Numero Progressivo Titolo (o rubrica) L. 19 Febbraio 2004, n. 40 Norme in materia di procreazione medicalmente assistita L. 9 gennaio 2004, n. 4 Disposizioni per favorire l’accesso dei soggetti disabili agli strumenti informatici D.L. n. 72 del 22 marzo 2004 Interventi per contrastare la diffusione telematica abusiva di materiale audiovisivo, nonché a sostegno delle attività cinematografiche e dello spettacolo © CB
Documentazione giurisprudenziale
Giurisprudenza «insieme degli atti emanati dagli organi giurisdizionali tenuto conto del tipo di giurisdizione criteri di competenza» Unitamente alla dottrina giurisprudenziale: «teorie e commenti elaborati da studiosi circa gli atti emanati dagli organi giurisdizionali e circa gli orientamenti degli stessi» © CB
Giurisdizione e gradi Cassazione T. Militare T. Sup. Acque Cons. Stato civili II Corte App. Trib penali II AssiseApp. Corte app Trib Commis. Trib Trib. Minori Corti. Conti T. Reg. Acque T. A.R. civili I Gdp Trib penali I Assise Trib Militare Acque Amm Civile Penale Cont Trib Minori © CB
Strumenti cartacei giurisprudenziali Repertori Massimari Riviste giuridiche Rassegne Codici commentati © CB
Dati giurisprudenziali: formalizzazione Caratteri che contraddistinguono i dati giurisprudenziali: Organo giudicante Data e numero pronuncia (n. ruolo generale) Tipo d’atto (in mancanza sentenza) Sezione (talvolta) Parti (talvolta) Cass, Sez II, 3 Marzo 2003, n 200 Cons. Stato, Sez I, [ord.] 2 aprile 2002 n.8 Trib., 15 Dic 2004, n 455 Rossi c. Bianchi Nel testo x esteso: Fatto Diritto PQM © CB
Documentazione dottrinale & bibliografica
Dottrina & bibliografia tutta quella in senso stretto: «manuali, trattati, monografie, commentari, enciclopedie, opere collettanee (atti di convegni, studi in onore, annali di facoltà), saggi, note a sentenza, rassegne (di giurisprudenza o legislazione, riviste, recensioni» Bibliografia: «Bibliografie generali e speciali» © CB
Dati dottrinali: formalizzazione Caratteri che contraddistinguono i dati dottrinali e bibliografici Nome autore Titolo Contributo Note tipografiche (titolo anno parte pagina x rivista, luogo data edizione x volume) FINOCCHIARO G. Argomenti di informatica giuridica. Bologna, 1995 Clueb SARTOR G. L'intenzionalità dei sistemi informatici e il diritto. Rivista trimestrale di diritto e procedura civile 2003, fasc. 1 (marzo), pag. 23-51 ROLLERI F. 1992. Il personal computer ed il sistema EASY-FIND, in L'informatica giuridica e il Ced della Corte di cassazione, a cura di O. Fanelli e E. Giannantonio, pag. 431-435, Giuffrè: Milano. (contributo in opera collettanea) © CB
Presupposti per la ricerca Conoscere strumenti di ricerca Possedere un presupposto iniziale x volontà autonoma o indicazione di altri (parola, tema, legge) Inquadrare generalmente l’ambito di ricerca Applicare una metodologia di ricerca © CB
Ambiti e tipologie di ricerca Pre-evoluzione tecnologica: solo supporti cartacei Post-evoluzione tecnologica: cartacei, Banche dati giuridiche, www Cartacea Elettronica © CB
Caratteristiche della ricerca Globale Dinamica Efficace Efficiente Argomento/Materia Utente/Sistema N° doc/sforzo N° doc/tempo © CB
Indici valutativi ricerca elettronica Richiamo attitudine del sistema di ottenere in risposta tutti i documenti pertinenti contenuti all’interno dell’archivio; n° dei documenti recuperati /n° complessivo dei documenti memorizzati Precisione o pertinenza attitudine del sistema a fornire in risposta solo i documenti pertinenti; n° documenti pertinenti in generale / totale dei documenti recuperati tramite la strategia di ricerca utilizzata Effetto silenzio i documenti che non sono stati selezionati dal sistema; algebricamente è n° complessivo dei documenti memorizzati – n° complessivo di documenti selezionati tra cui possono esserci sia documenti potenzialmente utili sia documenti inutili Effetto rumore i documenti non pertinenti che vengono inclusi nella risposta; algebricamente è rappresentato da n° numero complessivo dei documenti selezionati – n° complessivo di documenti selezionati e pertinenti © CB
Documentazione giuridica & banche dati 2 Banche dati dott.ssa Chiara Giovanna Bernardi bernardi@cirfid.unibo.it
Banche dati giuridiche Installabili localmente sul pc dell’utente Raggiungibili per via telematica Consultabili sul www alternativa alla ricerca cartacea © CB
Documentazione in una BD La documentazione è sottoposta ad un preciso procedimento prima di poter essere consultata Nell’interrogazione locale o a distanza di una BD predisposta da un gestore, le regole sono uniformi e tendenti a rimanere costanti nel tempo © CB
BD giuridiche ☺ Costi di acquisto delle opere in CD Aggiornabili più velocemente Consultabili dalla propria postazione Consentono una consultazione incrociata Eliminano il problema dell’ingombro Consentono un risultato più rapido Costi di acquisto delle opere in CD Costi degli abbonamenti online Padronanza delle tecniche di consultazione Differenti tecniche di consultazione Parzialità della copertura temporale © CB
Definizioni = Data base = base di dati = banca dati IN REALTÀ Base di dati (contenuto) + Data base (struttura) = Banca dati © CB
Base di dati Insieme organizzato di informazioni memorizzate su supporti leggibili automaticamente È la collezione documentale È il “contenuto” del modello logico © CB
Banca dati Base di dati + Modello logico (Data base) + DBMS e IRs In pratica è un sistema informatico che comprende: 1. una base di dati e il suo DBMS (che ora comprende anche l’IRs) 2. tutte le componenti hw e sw necessarie per l’accesso ai dati e la loro presentazione D B M S & I R s Un tempo impiegato x la gestione dei soli dati strutturati Un tempo impiegato x la gestione dei soli dati non strutturati (testo) © CB
DBMS/IRs Software di base necessario per costruire una banca dati Serve per: la rappresentazione l’inserimento l’indicizzazione l’organizzazione la gestione l’accesso la presentazione dei dati © CB
IRs: Information Retrieval system È un software deputato a diverse funzioni tra cui: rappresentazione, gestione e ricerca dell’informazione documentale. Tramite la funzione di ricerca l’utente può ad es. reperire documenti contenenti tutte le parole indicizzate dall’organizzatore della banca dati Il linguaggio di interrogazione, tipico di ogni BD, e che occorre conoscere per interrogarla si basa sul sw di IR ed è un componente fondamentale del sw di IR © CB
Accesso ad una banca dati IRs IR IR Base di dati (informazioni) © CB
Principi generali di ricerca Libertà di scelta del dato Ricerca del pluridato Tecnica del mascheramento Interattività dell’interrogazione © CB
Libertà di scelta del dato Ogni dato si sappia o si immagini essere contenuto nel documento che si cerca, può costituire una chiave di ricerca autonoma capace di individuare il documento stesso La ricerca è flessibile L’informazione è aggredibile da più punti Il raggiungimento del risultato è più rapido © CB
Si usano congiunzioni logiche chiamate operatori Ricerca del pluridato È possibile combinare tra loro e più chiavi di accesso per di ottenere più rapidamente il risultato desiderato Si usano congiunzioni logiche chiamate operatori © CB
Tecniche di mascheramento Si possono sostituire termini di ricerca ignoti o parti di essi con segni convenzionali (metacaratteri) ottenendo ugualmente il risultato voluto Si impiegano caratteri di espansione o troncamento Si restringerà poi la ricerca © CB
Interattività della ricerca Il risultato della ricerca è frutto di una continua e costante interazione utente-sistema La selezione dei documenti avviene per approssimazioni successive La ricerca ha un carattere colloquiale © CB
Fasi creative di una BD raccolta selezione classificazione indicizzazione strutturazione classificazione selezione raccolta © CB
Funzione di ricerca dell’IRs Per poter dialogare efficacemente con una banca dati occorre conoscere il suo sw di IR, di cui è componente fondamentale il linguaggio di interrogazione Ogni banca dati ha il suo linguaggio di interrogazione che si basa sul relativo SW di INFORMATION RETRIEVAL Tramite la funzione di ricerca l’utente può cercare documenti contenenti tutte le parole indicizzate dall’organizzatore della banca dati © CB
Modi di indicizzazione → modi di ricerca Nella indicizzazione dei documenti i creatori della BD possono: stabilire di utilizzare tutti i termini che compongono ogni documento come chiavi di ricerca senza effettuare su di essi nessuna operazione linguistica ricerca testuale a testo pieno o full text utilizzare come chiavi di ricerca solo termini che a loro parere sono indicativi del contenuto del documento effettuando operazioni linguistiche estensione della ricerca testuale e ricerca per descrittori © CB
Criteri di ricerca I criteri di ricerca possibili sono i seguenti: Per parole testuali Estensione della ricerca testuale Per descrittori Per estremi © CB
1 Criteri di ricerca: testuale full text Ogni singola parola contenuta nei documenti, può costituire una chiave di accesso Si realizza il principio del pluridato per cui si compongono stringhe usando gli operatori, volendo le parentesi Occorre conoscere ed utilizzare la sintassi booleana e altri operatori di ricerca L’utente si trova di fronte ad uno “schema libero” L’utente può adattare maggiormente l’interrogazione alle sue esigenze © CB
Operatori per la sintassi di ricerca Nella ricerca per parole testuali fondamentale è conoscere i seguenti operatori: Logici o booleani Posizionali Mascheramento e troncamento Esiste una quarta categoria di operatori, i relazionali che sono invece impiegabili nella ricerca per estremi © CB
Operatori logici o booleani AND OR NOT Consentono di realizzare la ricerca del pluridato grazie al collegamento logico tra i termini attraverso simboli o operatori (così come nell’algebra le variabili sono collegate dalle operazioni aritmetiche) © CB
Il campo di selezione si restringe AND Individua tutti i documenti dove i termini indicati sono compresenti Il campo di selezione si restringe © CB
Il campo di selezione si allarga OR Individua tutti i documenti che contengono almeno uno dei termini indicati (è sufficiente la presenza di almeno uno dei termini affinché il documento venga selezionato) Il campo di selezione si allarga © CB
OR Esclusivo: quando si vuole che i documenti compresi nella selezione contengano i dati immessi solo in alternativa: o uno o l’altro (latino aut). Inclusivo: quando si vuole che rimangano compresi nella selezione i documenti che, per caso, dovessero contenere anche in and i dati immessi. (latino vel). Se previsto questo tipo di OR è indicato come “XOR” © CB
Il campo di selezione anche qui si restringe NOT Individua tutti i documenti che contengono il primo termine indicato ma non il secondo Il campo di selezione anche qui si restringe © CB
Operatori Booleani AND NOT OR Inclusivo OR esclusivo © CB
Operatori posizionali ADJ NEAR WITH Sono un perfezionamento dell’operatore AND ma sono più precisi perché indicano al sistema di ricerca di cercare documenti operando sulla adiacenza, sulla prossimità e sulla vicinanza dei termini © CB
ADJ Utilizzato per selezionare i documenti in cui i termini indicati sono adiacenti interesse ADJ legittimo ma anche… illegittimo ADJ interesse © CB
NEAR Utilizzato per selezionare i documenti in cui i termini indicati sono adiacenti e sequenziali entro un numero precisato di posizioni (di default 3) Adempimento NEAR diligente (MAI “diligente adempimento”) © CB
Computer WITH programma Utilizzato per selezionare i documenti in cui i termini indicati sono compresenti nell’ambito dello stesso paragrafo Computer WITH programma © CB
Mascheramento/troncamento Realizzano il principio generale della tecnica di mascheramento consentendo di troncare un termine di ricerca o di mascherare le parti ignote. Simboli impiegabili ? * § $ X L’elaboratore effettua tutte le combinazioni possibili sostituendo il carattere ? con tutte le lettere dell’alfabeto e fornendo in risposta i doc in cui i vari termini possibili sono combinati in OR denaro,danaro,dinaro ecc… Esempio di troncamento: contratt$ L’elaboratore ricerca tutte le parole, (e quindi tutti i documenti che le contengano) che abbiano come radice «contratt» fornendo in risposta i doc in cui i vari termini possibili sono combinati in OR contratto,contratti,contrattuale,contrattazione,contrattare,contrattura ecc… © CB
Operatori relazionali = > Chiedono al sistema di information retrieval di controllare i rapporti tra i dati numerici Anno=2004: tutti i doc del 2004 Anno 2002: dal 2002 compreso in poi Anno < 2002: tutti i doc precedenti il 2002 © CB
2 Estensione ricerca testuale Si effettuano operazioni linguistiche sui termini creando un linguaggio controllato che rappresenterà le possibili chiavi di ricerca Un linguaggio di ricerca così formalizzato esclude le possibili ambiguità tra i termini L’utente è alleggerito nell’approccio poiché non deve ideare una stringa per iniziare la ricerca ma può partire da soluzioni già pronte L’utente è allegerito nell’approccio perché può non usare gli operatori © CB
Ricerca per lemmi Nella mole documentale, le unità lessicali contenute in ogni documento subiscono questo procedimento di riduzione: Tutti i sostantivi al singolare Tutti gli aggettivi al singolare e al grado positivo Tutti i verbi all’infinito Usando come chiave di ricerca un lemma si potrà includere ogni eventuale variazione morfologica della parola dovuta al numero, al grado e al tempo © CB
Ricerca per sintagmi Sintagma: un’espressione costituita da due parole immediatamente susseguenti senza contare le preposizioni e gli articoli interposti Nel linguaggio giuridico sono moltissimi i casi: fatto illecito, danno estetico, banca dati, società cooperativa, errore ostativo, errore motivo, custodia cautelare L’utente dovrebbe formulare una sintassi di questo tipo: fatto near illecito Se le singole parole contenute in ogni documento vengono a priori collegate tra loro e indicizzate in maniera da formare già una sola espressione di senso compiuto esse potranno essere ricercabili come un’unica chiave di ricerca L’utente non usa la sintassi perché c’è già l’abbinamento Es: Jurisdata “risparmio energetico” © CB
3 Ricerca per descrittori La ricerca per descrittori può consistere in Ricerca per thesauri Ricerca per notazioni Ricerca per voci Schemi di classificazione © CB
Indicizzazione: thesauri Il Thesaurus, è un particolare «dizionario» che contiene le parole concettualmente operative e direttamente ricercabili. Redigendo questo dizionario, l’organizzatore della BD scompone le parole in fattori semantici di linguaggio e stabilisce delle connessioni tra parole Con una stessa radice etimologica Concettualmente affini © CB
Esempio: thesauri L’utente potrà interrogare una tantum la BD con un termine senza dover effettuare più interrogazioni, (o usare l’OR) con tutti i termini con la stessa radice e lo stesso significato o con tutti i sinonimi COMPUTER: si otterranno i docs contenenti: “computer” ma anche elaboratore elettronico, pc, macchina © CB
Ricerca per notazioni e voci Con lo schema di classificazione, si trasporta e si applica all'archivio elettronico, la tecnica di ordinamento usata comunemente nelle biblioteche per le raccolte cartacee L’intera mole documentale viene organizzata in base a categorie predefinite e NON flessibili Ogni categoria viene etichettata con una o più cifre (notazioni) o una o più parole significative (voci) Notazioni e voci fungono da descrittori cioè descrivono il contenuto dei documenti e permettono di risalire agli stessi che sono contenuti nei vari insiemi Notazioni e voci sono chiavi d’accesso per l’utente © CB
Notazioni: esempio INFGIUR.1. INFORMATICA GIURIDICA DOCUMENTARIA (S0802) Banche dati dottrinarie (D0487) Banche dati giurisprudenziali (D0488) Banche dati legislative (D0489) Banche dati virtuali (D0490) Diffusione dell’informazione in rete (D1320) Tecniche di indicizzazione (D4573) Tecniche di memorizzazione dei dati (D4574) Tecniche di organizzazione e strutturazione dei documenti (D4575) Tecniche di raccolta e selezione dell’informazione (D4576) Tecniche di reperimento dell’informazione (D4577) Tecniche ipertestuali (D4578) © CB