La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Sistemi per il recupero delle informazioni RIASSUNTO.

Presentazioni simili


Presentazione sul tema: "Sistemi per il recupero delle informazioni RIASSUNTO."— Transcript della presentazione:

1 Sistemi per il recupero delle informazioni RIASSUNTO

2 Sistemi per il recupero delle informazioni DATABASE

3 Accezione generica, metodologica Insieme organizzato di dati utilizzati per il supporto allo svolgimento delle attività di un ente (azienda, ufficio, persona) Accezione specifica, metodologica e tecnologica Insieme di dati gestito da un DBMS Nella nostra accezione i database sono: un supporto digitale in cui i dati sono immagazzinati un software che permetta il recupero dei dati una rete che permetta unaccessibilita` condivisa ai dati DEFINIZIONE. Una base di dati è una raccolta di dati permanenti suddivisi in due categorie: I METADATI I DATI

4

5 COSE UNA BASE DATI I METADATI i metadati, ovvero lo schema della base di dati, sono una raccolta di definizioni che descrivono la struttura di alcuni insiemi dati, le restrizioni sui valori ammissibili dei dati le relazioni esistenti fra gli insiemi. Lo schema va definito prima di creare i dati ed è indipendente dalle applicazioni che usano la base di dati.

6 COSE UNA BASE DATI I DATI i dati, le rappresentazioni dei fatti conformi alle definizioni dello schema, con le seguenti caratteristiche: I dati sono strutturati, cioè hanno un formato predefinito a)sono organizzati in insiemi omogenei, fra i quali sono definite delle relazioni e sono previsti operatori per estrarre elementi da un insieme e per conoscere quelli che, in altri insiemi, sono in relazione con essi. b) sono molti, in assoluto e rispetto ai metadati, e non possono essere gestiti in memoria temporanea; sono memorizzati in una memoria permanente. c) sono permanenti, cioè, una volta creati, continuano ad esistere finché non sono esplicitamente rimossi; d) sono accessibili mediante transazioni; e) sono protetti sia da accesso da parte di utenti non autorizzati, sia da corruzione dovuta a malfunzionamenti hardware e software; f) sono utilizzabili contemporaneamente da utenti diversi.

7 TRANSAZIONI (PER LUTENTE) Esempi: versamento presso uno presso sportello bancario emissione di certificato anagrafico dichiarazione presso lufficio di stato civile prenotazione aerea Due accezioni Per l'utente: programma a disposizione, da eseguire per realizzare una funzione di interesse Per il sistema: sequenza indivisibile di operazioni

8 Si consideri la base di dati degli studenti ed esami superati definiti dagli schemi di relazioni: Studenti(Matricola, Cognome, Città, AnnoNascita) Esami(Materia, Candidato, Voto, Data) Dovrebbe essere chiaro che una base di dati contiene i dati immessi, meno ovvio è il fatto che in una base di dati si memorizzano anche informazioni sui dati definiti, chiamati metadati. Esempi di queste informazioni sono: 1. i nomi delle relazioni definite; 2. il tipo delle ennuple delle relazioni; 3. le chiavi primarie ed esterne definite; 4. i vincoli sui valori ammissibili degli attributi. Queste informazioni sono memorizzate in tabelle predefinte che sono gestite automaticamente dal sistema. ESEMPIO DATI e METADATI

9 Per rappresentare i corsi attivati ed i relativi docenti si può usare uno schema del tipo (Corso, Nome Docente) questo e uno schema invariante nel tempo, mentre le coppie (Informatica Generale, Righi) (Basi di Dati e Sistemi Informativi, Leoni) sono istanze dello schema precedente e possono variare nel tempo

10 Le caratteristiche delle basi di dati sono garantite da un sistema per la gestione di basi di dati (DBMS, Data Base Management System), che ha il controllo dei dati e li rende accessibili agli utenti autorizzati. Un DBMS è un sistema centralizzato o distribuito che offre opportuni linguaggi a)per definire lo schema della base di dati (lo schema va definito prima di creare dati) b)per scegliere le strutture dati per la memorizzazione dei dati, c)per usare la base di dati interattivamente o da programmi d)memorizzare i dati rispettando i vincoli definiti nello schema; Un sistema di gestione di basi di dati è un sistema software in grado di gestire collezioni di dati che siano grandi, condivise e persistenti, assicurando la loro affidabilità e privatezza. Un DBMS deve essere efficiente ed efficace. Esempi di prodotti software disponibili sul mercato: Access, DB2, Oracle, Informix, Sybase, SQLServer DataBase Management System (DBMS)

11 I DATABASE SONO... grandi dimensioni (molto) maggiori della memoria centrale dei sistemi di calcolo utilizzati il limite deve essere solo quello fisico dei dispositivi persistenti hanno un tempo di vita indipendente dalle singole esecuzioni dei programmi che le utilizzano condivisi ogni organizzazione è divisa in settori o comunque svolge diverse attività. Ciascun settore/attività ha un (sotto) sistema informativo (non necessariamente disgiunto) Una base di dati e' una risorsa integrata, condivisa fra applicazioni Conseguenze: Attivita' diverse su dati condivisi: meccanismi di autorizzazione Accessi di più utenti ai dati condivisi:controllo della concorrenza

12 I DBMS GARANTISCONO… PRIVATEZZA Si possono definire meccanismi di autorizzazione l'utente A è autorizzato a leggere tutti i dati e a modificare quelli sul ricevimento l'utente B è autorizzato a leggere X e a modificare Y AFFIDABILITA` (per le basi di dati): resistenza a malfunzionamenti hardware e software una base di dati è una risorsa pregiata e quindi deve essere conservata a lungo termine

13 I DBMS DEVONO ESSERE … EFFICIENTI Cercano di utilizzare al meglio le risorse di spazio di memoria (principale e secondaria) e tempo (di esecuzione e di risposta) I DBMS, con tante funzioni, rischiano l'inefficienza e per questo ci sono grandi investimenti e competizione Lefficienza è anche il risultato della qualità delle applicazioni EFFICACI Cercano di rendere produttive le attività dei loro utilizzatori, offrendo funzionalità articolate, potenti e flessibili: il corso è in buona parte dedicato ad illustrare come i DBMS perseguono l'efficacia

14 Sistemi per base di dati - DBMS Diverse categorie di persone possono interagire con una base di dati tramite un DBMS. Amministratore della base di dati (DBA). responsabile della progettazione, controllo e amministrazione della base di dati. I progettisti e programmatori di applicazioni. realizzano i programmi che accedono e interrogano la base di dati. Gli utenti non programmatori che utilizzano la base di dati per le proprie attività.

15 Sistemi per il recupero delle informazioni MODELLI INFORMATICI DIAGRAMMI E-R

16 MODELLI Linformatica offre metodologie e strumenti per la costruzione di modelli di situazioni reali che ricorrono in ogni campo che richiede unattività di progettazione. Essi permettono di riprodurre le caratteristiche essenziali di fenomeni reali, omettendo dettagli che costituirebbero inutili complicazioni. Per poter gestire un sistema informativo con strumenti informatici dobbiamo realizzare una descrizione della realtà dinteresse per mezzo di simboli Un modello di dati e un insieme di concetti utilizzati per organizzare i dati e descriverne la struttura in modo che essa risulti comprensibile a un elaboratore Ad es per poter gestire una biblioteca è necessario dare al calcolatore una sua descrizione simbolica Una tale descrizione costituisce un modello della realtà

17 MODELLI INFORMATICI Sono modelli simbolici: rappresentazione formale delle idee e conoscenze relative ad un fenomeno Si hanno diverse categorie di modelli informatici che differiscono per i tipi di fatti che si considerano, ossia per i diversi livelli di astrazione a cui si opera modelli concettuali: sono considerati solo i fatti relativi alla realtà senza alcun riferimento agli strumenti informatici che dovranno usare il modello modelli logici: sono considerati anche fatti relativi agli strumenti informatici; il modello è adeguato alle caratteristiche del DBMS, in modo che possa essere da questo interpretato modelli fisici: sono considerate le strutture fisiche usate dal calcolatore per rappresentare i dati

18

19 IL MODELLO Nella costruzione di un modello informatico, prima si definisce il modello, descrivendo conoscenza concreta e conoscenza astratta poi si costruisce la rappresentazione della conoscenza concreta. Per la definizione del modello si possono usare diversi tipi di formalismi, che si differenziano per il modello dei dati che supportano, cioè per meccanismi di astrazione offerti per rappresentare la realtà. Nel seguito si presentano due tipi di modelli dei dati: il - modello a oggetti, usato come esempio di formalismo per la progettazione di una basi di dati - modello relazionale, usato come esempio di formalismo per la realizzazione di una base di dati.

20 ESEMPIO Per costruire un modello informatico per la gestione di informazioni sui libri, prima si devono definire quelle che interessano ai fini dellapplicazione (titolo, autore, editore ecc.). Una volta definite le proprietà interessanti comuni a tutti i possibili libri, si passa a costruire per ogni entità libro della realtà oggetto di studio una rappresentazione nel modello informatico.

21 IL MODELLO DEI DATI A OGGETTO Per rappresentare in maniera naturale e diretta lidea che il progettista si fa del mondo osservato, il modello dei dati a oggetti prevede i seguenti meccanismi dastrazione: oggetto tipo di oggetto classe gerarchie fra classi Verranno dati esempi di utilizzo di questi meccanismi tramite un formalismo grafico che serva a definire lo schema di una base di dati, ovvero la struttura della conoscenza concreta, che chiameremo schema concettuale. Il formalismo grafico viene chiamato diagramma entità-relazione

22 IL MODELLO DEI DATI A OGGETTO questioni terminologiche

23 Un oggetto è unentità software con stato ed identità, che modella unentità delluniverso del discorso.. Lo stato è costituito da un insieme di campi, che - sono valori costanti o variabili associati ad un nome, detto attributo. - possono assumere valori di qualsiasi complessità - modellano le proprietà dellentità Come accade per le proprietà delle entità, un attributo di un oggetto può avere valori di tipo atomico o strutturato, semplice o unione, univoco o multivalore, totale o parziale, costante o modificabile. OGGETTO E TIPO DI OGGETTO

24 CLASSI E ASSOCIAZIONI La classe modella un insieme di oggetti dello stesso tipo del mondo reale è costruita col processo di astrazione detto classificazione: entità diverse vengono unificate per costituire un nuovo concetto. Si astrae dalle differenze fra le entità per evidenziare ciò che le accomuna. tutti gli oggetti di una classe sono caratterizzati dagli stessi attributi. L associazione modella una correlazione fra entità del mondo reale è una corrispondenza tra classi, e stabilisce una correlazione logica fra oggetti appartenenti a classi diverse (o anche alla stessa classe).

25 CONCETTI IMPORTANTI dominio di un attributo: è linsieme dei valori che può assumere lattributo stesso esempio: il dominio dellattributo mese è costituito dallinsieme {gennaio, febbraio, marzo,....,dicembre} oppure dallinsieme {01, 02, 03,....,12} chiave di una classe: è un attributo (o un insieme di attributi) che identifica univocamente gli oggetti di una classe K è chiave della classe C se non esistono due oggetti in C che hanno lo stesso valore di K esempio: lattributo matricola è chiave della classe STUDENTI

26 DIAGRAMMI E-R Nel formalismo grafico che si adotta, una classe si rappresenta con un rettangolo etichettato con il nome della classe. Per gli attributi si usano le seguenti convenzioni: 1. attributi con valori atomici sono rappresentati con ovali collegati alla classe da un arco che termina con una freccia singola, se lattributo è univoco, oppure con una freccia doppia, se lattributo è multivalore; 2. se lattributo ha valori strutturati, lovale si sostituisce con un quadratino dal quale escono archi verso ovali in numero pari ai campi del valore strutturato. 3. se lattributo ha valori unione, si procede come nel caso precedente sostituendo il quadratino con un cerchietto; 4. proprietà che possono avere valori non specificati si rappresentano con un taglio sullarco; 5. gli attributi della chiave primaria si sottolineano.

27 Esempi Una classe con gli attributi. Cognome e la chiave primaria Studenti Una classe

28 ASSOCIAZIONI Unassociazione binaria tra classi si rappresenta con un rombo collegato con degli archi alle classi associate. Il rombo è etichettato con il nome dellassociazione StudentiCorsi segue

29 ASSOCIAZIONI: caratteristiche univocità: ad un oggetto di una classe può essere associato un solo oggetto dellaltra classe totale: ad un oggetto di una classe è sempre associato qualche oggetto dellaltra classe multivalore: ad un oggetto di una classe possono essere associati più oggetti dellaltra classe parziale: ad un oggetto di una classe non è sempre associato qualche oggetto dellaltra classe

30 ASSOCIAZIONI: esempio

31 Afferisce è univoca da Docenti a Dipartimenti: ad un oggetto della classe Docenti è associato un solo oggetto della classe Dipartimenti; si modella il fatto che un docente possa afferire ad un solo dipartimento Afferisce è multivalore da Dipartimenti a Docenti: ad un oggetto della classe Dipartimenti possono essere associati più oggetti della classe Docenti; si modella il fatto che ad un dipartimento possano afferire molti docenti Insegna è totale da Corsi di Laurea a Docenti: ad un oggetto della classe Corsi di Laurea è sempre associato qualche oggetto della classe Docenti; si modella il fatto che in un corso di laurea debbano necessariamente insegnare dei docenti Insegna è parziale da Docenti a Corsi di Laurea: ad un oggetto della classe Docenti non è sempre associato qualche oggetto della classe Corsi di Laurea ; si modella il fatto che un docente potrebbe non insegnare

32 GERARCHIA FRA CLASSI Tra due classi E ed F può essere stabilita una gerarchia E è detta sottoclasse o specializzazione di F F è detta superclasse o generalizzazione di E Proprietà delle gerarchie Vincolo di struttura: se E è sottoclasse di F, E ha tutti gli attributi di F, e partecipa a tutte le associazioni cui partecipa F (ereditarietà). E può avere altri attributi, e partecipare ad altre associazioni Vincolo di insieme: se E è specializzazione di F, ogni oggetto di E è anche un oggetto di F (cioè E è un sottoinsieme di F)

33 GERARCHIA FRA CLASSI: esempio Lo schema a sinistra e piu espressivo di quello di destra

34 DIAGRAMMI E-R: esempio A titolo di esempio, mostriamo, ad un primo livello di dettaglio, la rappresentazione con il formalismo grafico di alcuni fatti riguardanti una biblioteca universitaria: descrizioni bibliografiche, libri, autori, utenti e prestiti. Delle entità interessano le seguenti proprietà: 1. Di una descrizione bibliografica interessano il codice, il titolo dellopera, leditore, lanno di pubblicazione e un insieme di termini usati per la classificazione del contenuto dellopera. 2. Di un libro interessano la collocazione e il numero della copia. 3. Di un autore interessano il nome e cognome, la nazionalità, la data di nascita 4. Di un utente interessano il nome, il cognome, lindirizzo e i recapiti telefonici. 5. Di un prestito interessano la data del prestito e la data di restituzione.

35 DIAGRAMMI E-R: esempio Le associazioni interessanti sono: 1. HaScritto (N:M) tra autori e descrizioni bibliografiche, che collega un autore con le descrizioni bibliografiche delle opere che ha scritto. Ogni autore ha scritto almeno un libro e ogni descrizione bibliografica riguarda almeno un autore; 2. Descrive (N:1) tra descrizioni bibliografiche e libri, che collega una descrizione bibliografica alle copie dei libri presenti in biblioteca. Ogni libro ha una descrizione bibliografica e ogni descrizione bibliografica descrive una o più copie di libri, supporremo inoltre che possa descrivere anche un libro ordinato ma non ancora acquisito dalla biblioteca; 3. HaFatto (N:1) tra utenti e prestiti, che collega gli utenti ai prestiti che ha fatto e che non sono ancora scaduti. Ogni utente della biblioteca può avere nessuno, uno o più prestiti, ma un prestito ha sempre associato lutente che lo ha fatto; 4. Riguarda (1:1) tra prestiti e libri, che collega i prestiti alle copie dei libri interessati. Una copia di un libro può essere coinvolta in al più un prestito e un prestito riguarda una copia di un libro.

36 DIAGRAMMI E-R: esempio

37

38 Sistemi per il recupero delle informazioni COME SI PROCEDE

39 INTRODUZIONE Finora si è visto come definire lo schema concettuale di una base di dati. Nella pratica non è così semplice ed occorre un lungo procedimento di analisi e studio della situazione da modellare per poter produrre una progettazione concettuale della base di dati e poi una sua realizzazione. Per dare unidea di come si procede, si considera una tipica metodologia a più fasi in cui gli aspetti del problema vengono considerati gradualmente per ottenere una realizzazione soddisfacente. Quattro fasi: 1. analisi dei requisiti 2. progettazione concettuale 3. progettazione logica 4. progettazione fisica

40

41 ANALISI DEI REQUISITI Scopo dellanalisi dei requisiti è la definizione dei bisogni informativi del committente. Il progettista deve capire di cosa si parla. Poi si passa ad unanalisi del problema per raccogliere una descrizione dei bisogni informativi e formulare la cosiddetta specifica dei requisiti in linguaggio naturale. Quando il problema è di limitata complessità, e basta interagire con una sola persona, il procedimento può essere relativamente veloce, ma quando il problema è complesso e sono coinvolte persone diverse, il procedimento diventa lungo e comporta un lavoro di unificazione dei concetti coinvolti. Lo scopo dellanalisi dei requisiti è, in altre parole, proprio quello di chiarire la corretta interpretazione dei fatti descritti, riformulando la specifica in modo chiaro.

42 Esempio Si vuole progettare una base di dati per gestire informazioni su musei, le opere conservate, gli artisti che hanno creato tali opere. Di un museo interessano il nome, che lo identifica, la città, lindirizzo e il nome del direttore. Un artista è identificato dal nome; di lui interessano la nazionalità, la data di nascita, la eventuale data di morte. Di unopera, identificata da un codice, interessano, lanno di creazione, il titolo, il nome dei personaggi rappresentati. Unopera può essere un dipinto od una scultura; se è un dipinto interessano il tipo di pittura e le dimensioni; se è una scultura interessano il materiale, laltezza ed il peso.

43 PROGETTAZIONE CONCETTUALE Scopo della progettazione concettuale è di tradurre la specifica dei requisiti in un progetto della struttura concettuale dei dati descritta utilizzando un formalismo grafico. Lo schema concettuale si definisce procedendo con i seguenti passi: 1. identificazione delle classi; 2. descrizione delle associazioni fra le classi; 3. definizione di sottoclassi; 4. definizione delle proprietà degli elementi delle classi.

44 PROGETTAZIONE CONCETTUALE Identificazione delle classi Si produce una lista preliminare delle classi di oggetti che interessa modellare e si assegna ad ognuna di esse un nome appropriato. Questo elenco iniziale ha un grado di completezza e di significatività che dipende dal grado di comprensione del problema e, in generale, sarà soggetto a modifiche mano a mano che si procede.

45 PROGETTAZIONE CONCETTUALE Descrizione delle associazioni fra le classi Si individuano le possibili associazioni fra le classi finora definite e le loro proprietà strutturali. Lanalisi delle associazioni può portare ad eliminare una classe che può essere rappresentata da unassociazione, o ad aggiungere una nuova classe per rappresentare unassociazione.

46 PROGETTAZIONE CONCETTUALE Definizione di sottoclassi Per definire le sottoclassi si esaminano tutte le classi già definite per capire 1.se può essere utile definirne di nuove per caratterizzare particolari sottoinsiemi di alcune classi 2.se esistono classi che sono un sottoinsieme di altre e quindi possono essere ridefinite 3.se esistono oggetti di classi che possono assumere nel tempo stati significativi per lapplicazione

47 PROGETTAZIONE CONCETTUALE Definizione delle proprietà degli elementi delle classi Per ogni tipo di oggetto si elencano le proprietà interessanti, specificando, per ognuna di esse, il nome e il tipo. In questo passo va prestata molta attenzione alla possibilità se convenga introdurre nuove classi, o viceversa eliminarne alcune sostituendole da attributi.

48 Esempio

49 PROGETTAZIONE LOGICA Scopo della terza fase della metodologia, la progettazione logica, è di tradurre lo schema concettuale nello schema logico espresso nel modello dei dati del sistema scelto per la realizzazione della base di dati.

50 Esempio MUSEI (NomeM, Città, Indirizzo, Direttore) ARTISTI (NomeA, Nazionalità, DataN, DataM:optional) OPERE (Codice, Anno, Titolo, NomeM*, NomeA*) PERSONAGGI (Personaggio, Codice*) DIPINTI (Codice*, Tipo, Larghezza, Altezza) SCULTURE (Codice*, Materiale, Altezza, Peso)

51 Progettazione fisica Consiste nel completamento, o modifica, dello schema logico in funzione della organizzazione fisica dei dati ed i meccanismi per operare su di essi. Realizzazione Consiste nel costruire la rappresentazione del fatti specificati nel progetto (schema dei dati, procedure), utilizzando strumenti informatici (linguaggi di programmazione, SGBD)

52

53 Sistemi per il recupero delle informazioni MODELLO RELAZIONALE DEI DATI

54 PROGETTAZIONE Ricordiamo le fasi della progettazione di una Base di Dati Ci occuperemo adesso della progettazione logica

55 PROGETTAZIONE LOGICA La descrizione del modello da realizzare è fatta in funzione delle caratteristiche del DBMS che sarà utilizzato (il modello dei dati, il linguaggio per sviluppare le applicazioni). Il modello dei dati, detto modello logico, è più vicino alla rappresentazione informatica dei dati. Vedremo luso del Modello dei Dati Relazionale. Lo schema risultante è detto schema relazionale, ed è rappresentato con un formalismo testuale. è un modello dei dati compreso dal DBMS si ottiene con una traduzione dello schema E-R

56 ESEMPIO

57 VIENE TRADOTTO NELLO SCHEMA MUSEI (NomeM, Città, Indirizzo, Direttore) ARTISTI (NomeA, Nazionalità, DataN, DataM) OPERE (Codice, Anno, Titolo, NomeM*, NomeA*) PERSONAGGI (Personaggio, Codice*) DIPINTI (Codice*, Tipo, Larghezza, Altezza) SCULTURE (Codice*, Materiale, Altezza, Peso)

58 INTRODUZIONE Il modello relazionale dei dati, proposto nel 1970 ed adottato nei sistemi commerciali a partire dal 1978, si è diffuso rapidamente tanto sui sistemi centrali quanto sugli elaboratori personali. I meccanismi per definire una base di dati con il modello relazionale sono solo due: lennupla la relazione. Si basa sul concetto matematico di relazione. Le relazioni hanno una rappresentazione naturale per mezzo di tabelle

59 Ennupla. È un insieme finito di coppie (Attributo, valore atomico) Relazione. È un insieme finito (eventualmente vuoto) di ennuple con la stessa struttura. I campi di unennupla sono atomici (numeri, stringhe o il valore NULL). Si tenga presente che non si possono rappresentare proprietà strutturate, o multivalore e vedremo più avanti come risolvere questi problemi di rappresentazione. Unennupla si usa per rappresentare entità e la relazione si usa per rappresentare classi di entità. ENNUPLA E RELAZIONE

60 TERMINOLOGIA - I attributo: corrisponde (non sempre) ad un attributo del modello E-R. Diversamente dal modello E-R, gli attributi sono sempre univoci (ad un sol valore) ed atomici (non composti) Lordine degli attributi non è significativo dominio (di un attributo): è linsieme dei valori che può assumere un attributo. chiave primaria di una relazione: un attributo che identifica univocamente le ennuple della relazione. Gli attributi della chiave primaria vengono sottolineati

61 TERMINOLOGIA - II Una relazione si definisce dandole un nome ed elencando fra parentesi tonde il tipo delle sue ennuple. La definizione di una relazione è detta schema della relazione R(A1:T1, A2:T2,..., An:Tn) R è il nome della relazione A1, A2,... sono gli attributi della relazione T1, T2,... sono i tipi degli attributi (interi, reali, booleani, stringhe) Per semplicità omettiamo la specifica dei tipi, per cui lo schema di relazione è R(A1, A2,...,An)

62 RELAZIONE E TABELLA Orario InsegnamentoDocenteAulaOra Analisi matem. ILuigi NeriN18:00 Basi di datiPiero RossiN29:45 ChimicaNicola MoriN19:45 Fisica IMario BruniN111:45 Fisica IIMario BruniN39:45 Sistemi inform.Piero RossiN38:00 ORARIO (Insegnamento, Docente, Aula, Ora) Relazione e tabella sono sinonimi

63 TERMINOLOGIA - III Lo schema della relazione è la descrizione della struttura di una relazione Unistanza di uno schema di relazione è un insieme finito di ennuple. osserviamo che tutte le ennuple di una relazione hanno la stessa struttura Lo schema relazionale è la descrizione della struttura di una base di dati insieme di schemi di relazione insieme di vincoli

64 SCHEMA Orario InsegnamentoDocenteAulaOra Analisi matem. ILuigi NeriN18:00 Basi di datiPiero RossiN29:45 ChimicaNicola MoriN19:45 Fisica IMario BruniN111:45 Fisica IIMario BruniN39:45 Sistemi inform.Piero RossiN38:00 ORARIO (Insegnamento, Docente, Aula, Ora) Le colonne della tabella formano lo schema della relazione

65 ISTANZE Orario InsegnamentoDocenteAulaOra Analisi matem. ILuigi NeriN18:00 Basi di datiPiero RossiN29:45 ChimicaNicola MoriN19:45 Fisica IMario BruniN111:45 Fisica IIMario BruniN39:45 Sistemi inform.Piero RossiN38:00 ORARIO (Insegnamento, Docente, Aula, Ora) I contenuti delle righe della tabella formano le istanze della relazione

66 RELAZIONE: TRE ACCEZIONI Relazione matematica: come nella teoria degli insiemi Relazione secondo il modello relazionale dei dati Relazione (relationship): costrutto del modello Entita-Relazione utilizzato nel modello concettuale per descrivere legami tra entita nel mondo reale (tradotto anche con associazione o correlazione)

67 RELAZIONE MATEMATICA - I D 1, …, D n (n insiemi anche non distinti) prodotto cartesiano D 1 ×…×D n : linsieme di tutte le n-uple (d 1, …, d n ) tali che d 1 D 1, …, d n D n relazione matematica su D 1, …, D n : - un sottoinsieme di D 1 ×…×D n. - D 1, …, D n sono i domini della relazione - n è il grado il numero di elementi della relazione si dice cardinalità

68 ESEMPIO relazione r 1 D 1 × D 2 t. c.: r 1 = {(a,x); (a,z); (b,y)} D 1 ={a,b} D 2 ={x,y,z} prodotto cartesiano D 1 × D 2 = {(a,x); (a,y); (a,z); (b,x); (b,y); (b,z)}

69 RELAZIONE MATEMATICA - II Una relazione matematica è un insieme di n-uple ordinate: (d 1, …, d n ) tali che d 1 D 1, …, d n D n Una relazione è un insieme; quindi: - non c'è ordinamento fra le n-uple (ordinamento verticale) - le n-uple sono distinte - ciascuna n-upla è ordinata: l i-esimo valore proviene dall i-esimo dominio (ordinamento orizzontale)

70 RELAZIONI E TABELLE - I Le relazioni possono essere rappresentate graficamente, in maniera utilmente espressiva, sotto forma di tabelle Esempio (precedente): D1={a,b} D2={x,y,z} a a a b b b x y z x y z prodotto cartesiano D1 × D2 a a b x z y Relazione r 1

71 ESEMPIO D 1 ={x,y} D 2 ={a,b,c} D 3 ={3,5} x x x x x x a a b b c c y y y y y y a a b b c c prodotto cartesiano D1 × D2 × D3 x x x y y y a a c a c c Relazione

72 NON CE ORDINAMENTO VERTICALE x x x y y y a a c a c c x y x y y x a a c c c c x x x y y y a a c a c c Rappresentano la stessa relazione

73 LE RIGHE SONO DISTINTE x x x y y y a a c a c c x x x y y x a a c c c c x x y y y y a a c c c c Relazione valida Relazione non valida

74 CE ORDINAMENTO ORIZZONTALE x x x y y y a a c a c c Rappresentano relazioni diverse x x x y y y a a c a c c x x x y y y a a c a c c

75 ATTRIBUTI - I Juve Lazio Juve Roma Lazio Milan Roma Milan A ciascun dominio si associa un nome (attributo), che ne descrive il "ruolo" RetiCasaRetiFuoriCasaFuori

76 ATTRIBUTI - II Juve Lazio Juve Roma Lazio Milan Roma Milan RetiCasaRetiFuoriCasaFuori Juve Lazio Juve Roma Lazio Milan Roma Milan RetiCasaRetiFuoriCasaFuori Stile americano Stile europeo Lordinamento degli attibuti e irrilevante

77 FORMALISMO - I Corrispondenza Attributi - Domini dom: X D funzione che associa a ogni attributo A X un dominio D Una ennupla su un insieme di attributi X è una funzione che associa a ciascun attributo A X un elemento di dom(A): t[A] denota il valore della ennupla t sull'attributo A Una relazione su X e un insieme di ennuple

78 Notazione per le ennuple: Lennupla rappresentata dalla prima riga t[Fuori] = Lazio t[RetiCasa] = 3 Notazione estesa ad insieme di attributi t[Fuori, RetiCasa] Juve Lazio Juve Roma Lazio Milan Roma Milan RetiCasaRetiFuoriCasaFuori Relazione FORMALISMO - II

79 RELAZIONI E DATABASE Di solito non è sufficiente una sola relazione per organizzare tutti i dati Un database è costituito (in generale) da più relazioni Le ennuple contengono valori comuni per stabilire corrispondenze

80 FORMALISMO - III Schema di relazione: un simbolo R, detto nome della relazione, e un insieme di attributi A 1,..., A n : R(A 1,..., A n ) Schema di base di dati: insieme di schemi di relazione con nomi diversi: R = {R 1 (X 1 ),..., R k (X k )} Istanza di relazione su uno schema R(X): insieme r di ennuple su X Istanza di base di dati su uno schema R= {R 1 (X 1 ),..., R n (X n ) insieme di relazioni r = {r 1,..., r n } (con r i relazione su R i )

81 ESEMPIO Schema di Base di dati: R= {STUDENTI (Matricola, Cognome, Nome, Data di nascita), ESAMI(Studente, Voto, Corso), CORSI(Codice, Titolo, Docente) R= {CORSI(Corso, Docente, Aula), AULE(Nome, Edificio, Piano), CORSISEDI(Corso, Aula, Edificio, Piano)

82 DATABASE Corso AulaDocente Rossi Basi di dati DS3 Bruni Reti N3 Neri Sistemi N3 Bruni Controlli G Corsi NomePianoEdificio OMIDS3Terra PincherleGPrimo OMIN3Terra Aule CorsiSedi Corso Aula Reti N3 SistemiN3 Controlli G PianoEdificio OMITerra PincherlePrimo OMITerra Un database e un insieme di tabelle

83 Il modello relazionale è basato su valori Ovvero: i riferimenti fra dati in relazioni diverse sono rappresentati per mezzo di valori dei domini che compaiono nelle ennuple CARATTERISTICA FONDAMENTALE

84 MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 studenti CodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi corsi StudenteVotoCorso esami VALORI VS PUNTATORI - I

85 23/04/2014 MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 studenti CodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi corsi StudenteVotoCorso voti 26 VALORI VS PUNTATORI - II

86 VANTAGGI indipendenza dalle strutture fisiche che possono cambiare dinamicamente si rappresenta solo ciò che è rilevante dal punto di vista dellapplicazione lutente finale vede gli stessi dati dei programmatori i dati sono portabili piu' facilmente da un sistema ad un altro i puntatori sono direzionali

87 RAPPRESENTAZIONE GRAFICA - I PERSONE(CodFiscale,Nome,Telefono) o più accuratamente PERSONE(CodFiscale:string(16),Nome:string(30), Telefono: optional integer) Lattributo sottolineato è la chiave primaria

88 RAPPRESENTAZIONE GRAFICA - II Una (istanza della) relazione Persone, conforme a tale schema, è ad es. la seguente: E duso visualizzare una relazione come una tabella bidimensionale, con le colonne identificate dagli attributi e le righe contenenti i valori dei campi, nellordine indicato dallintestazione delle colonne. La proprietà di essere chiave è riferita allo schema piuttosto che ad una particolare tabella: una chiave è tale (identifica le righe) in una qualunque istanza di un determinato schema.

89 Impiegati(Matricola :string, Cognome :string, AnnoNascita :integer, Provincia :string) Studenti( Cognome :string, Matricola :string, Provincia :string, AnnoNascita :integer) Docenti( Cognome :string, Matricola :integer, Provincia :string, AnnoNascita :integer) stesso tipo Docenti ha tipo diverso perché Matricola è di tipo intero e non stringa. tipo diverso TIPI Due relazioni hanno lo stesso tipo se hanno uguali il numero degli attributi, gli attributi e il tipo degli attributi con lo stesso nome.

90 CHIAVI ESTERNE Le associazioni tra i dati sono rappresentate attraverso i valori di opportuni campi, chiamati chiavi esterne, che assumono come valori quelli della chiave primaria di unaltra relazione. In altre parole una chiave esterna è un attributo (od un insieme di attributi) di una relazione R che assume i valori della chiave primaria di unaltra relazione S. Serve a rappresentare unassociazione tra R ed S

91 ESEMPIO - I Consideriamo lassociazione SEGUE tra STUDENTI e CDS (Corso di Studi). STUDENTI(Nome:string, Matricola: string, Provincia: string, AnnoNascita:int, SiglaCDS*: string) CDS(SiglaCDS: string, NomeCDS: string, Tipo: string) Il fatto che un corso di studi è associato ad uno studente si modella prevedendo nello schema della relazione STUDENTI un campo che assume come valori la chiave primaria di CDS, cioè SiglaCDS. SiglaCdS* è chiave esterna nella relazione STUDENTI, e serve a rappresentare unassociazione univoca da STUDENTI a CdS

92 ESEMPIO - II

93 ESEMPIO - III Il dominio di SiglaCDS* nella relazione STUDENTI coincide col dominio di SiglaCDS nella relazione CDS Se in una istanza di STUDENTI lattributo SiglaCDS assume il valore XYZ, deve esistere, nella istanza di CDS una ennupla con SiglaCDS = XYZ. Il motivo è ovvio; se una studente è iscritto a XYZ, deve esistere il Corso di Studi XYZ Tale proprietà si chiama Vincolo di integrità referenziale, e deve essere sempre soddisfatto da una chiave esterna:

94 DA MODELLO A OGGETTI A MODELLO RELAZIONALE - I Data una descrizione di una base di dati con i meccanismi di astrazione del modello a oggetti, la sua trasformazione con il modello relazionale è alquanto laboriosa perché bisogna trattare la descrizione delle associazioni la descrizione delle gerarchie di classi le eventuali proprietà strutturate e multivalore e passare ad una loro descrizione con attributi atomici. Inoltre, essendo il modello relazionale meno espressivo del modello a oggetti, in generale si può procedere in più modi nella trasformazione e la scelta fra possibili alternative va fatta cercando di ottimizzare lo spazio di memoria occupata dalla base di dati e le prestazioni delle applicazioni.

95 DA MODELLO A OGGETTI A MODELLO RELAZIONALE - II Nella conversione di uno schema espresso con il modello a oggetti gli obiettivi da perseguire sono: 1. rappresentare le stesse informazioni; 2. minimizzare la ridondanza; 3. agevolare il recupero dei dati in relazione. In generale nella conversione occorre duplicare delle informazioni e non si possono sempre rappresentare direttamente tutti i vincoli imposti dai meccanismi del modello a oggetti. Per garantire la coerenza dei dati duplicati, e il rispetto dei vincoli non esprimibili nel modello relazionale, occorre quindi definire opportunamente le operazioni che modificano la base di dati.

96 DA MODELLO A OGGETTI A MODELLO RELAZIONALE - III La trasformazione di uno schema a oggetti in uno schema relazionale avviene eseguendo i seguenti passi: 1.rappresentazione delle classi 2.rappresentazione delle associazioni uno a uno e uno a molti; 3.rappresentazione delle associazioni molti a molti o non binarie; 4.rappresentazione delle gerarchie di inclusione; 5.rappresentazione degli attributi multivalore; 6. appiattimento gli attributi composti

97 1. Rappresentazione delle classi Una classe C è rappresentata da una relazione R i cui attributi sono quelli di C si traduce in Studenti(Matricola, Nome, AnnoImmatric)

98 2. Rappresentazione delle associazioni uno a uno e uno a molti Come abbiamo già visto nellesempio degli studenti e dei corsi di studi, le associazioni uno a molti si rappresentano aggiungendo agli attributi della relazione rispetto a cui lassociazione è univoca una chiave esterna che riferisce laltra relazione. ESEMPIO: la relazione tra corsi di studi e studenti, essendo univoca rispetto ai corsi di studi, si rappresenta aggiungendo agli studenti una chiave esterna SiglaCDS. Quando lassociazione è uno ad uno la chiave esterna si aggiunge ad una qualunque delle due relazioni, preferendo quella rispetto a cui lassociazione è totale. Se lassociazione ha degli attributi, questi vanno aggiunti alla relazione a cui si aggiunge la chiave esterna.

99 ESEMPIO - I Studenti(Matricola, Nome, AnnoImmatric, Codice*) CorsidiLa(Codice, Nome, Tipo) la chiave esterna Codice* rappresenta lassociazione è_iscritto N.B. È un grave errore fare il contrario. Lo schema: Studenti(Matricola, Nome, AnnoImmatric) CorsidiLa(Codice, Nome, Tipo, Matricola*) rappresenta Corsi di Laurea ai quali può essere iscritto un solo studente!

100 ESEMPIO - II Se lassociazione è 1 a 1, cioè univoca in entrambi i versi, allora sono corrette entrambe le soluzioni. Dipartimenti(Nome, Facoltà, Cod*) Docenti(Cod, Settore) o Dipartimenti(Nome, Facoltà) Docenti(Cod, Settore, Nome*) La prima soluzione è migliore, ma entrambe sono corrette

101 3. Rappresentazione delle associazioni molti a molti o non binarie Unassociazione molti a molti tra due classi si rappresenta aggiungendo allo schema una nuova relazione che contiene due chiavi esterne che riferiscono le due relazioni coinvolte. precisamente: se A è unassociazione multivalore da R ad S e da S ad R, A è rappresentata con uno schema di relazione in cui gli attributi sono le chiavi primarie pkR di R e pkS di S. A (pkR*, pkS*) Se lassociazione ha degli attributi, questi attributi vengono aggiunti alla nuova relazione, e non vanno a far parte della chiave della nuova relazione.

102 ESEMPIO - I Una ennupla di Insegna rappresenta una coppia (Corso_di_Lurea, Docente) di oggetti in associazione. CorsidiLa(Codice,Nome,Facoltà,Tipo) Docenti(CodDoc, Settore) Insegna(Codice*, CodDoc*) Il docente identificato dal CodDoc 1592 insegna ai corsi di laurea identificati dai codici Inf, SBC e Mat, il docente identificato dal CodDoc 3014 insegna al corso di laurea identificato dai codici Inf, ecc...

103 ESEMPIO - II CorsidiLa(Codice,Nome,Facoltà,Tipo) Docenti(CodDoc, Settore) Insegna(Codice*, CodDoc*, NumIns)

104 4. Rappresentazione delle gerarchie fra classi Sia data una classe A con due sottoclassi B e C, tali che i tipi associati alle tre classi abbiano, rispettivamente, attributi (XA), (XA XB) e (XA XC), e sia KA la chiave primaria di A. Nel modello relazionale vi sono almeno tre modi diversi di rappresentare questa situazione: 1. Relazione unica 2. Partizionamento verticale 3. Partizionamento

105 4. Rappresentazione delle gerarchie fra classi Relazione unica Si definisce ununica relazione con attributi (XA XB XC D) che raccoglie tutti gli elementi delle tre classi; gli attributi XB e XC possono assumere il valore nullo, e lattributo D serve a indicare la classe a cui appartiene lelemento. ESEMPIO: Consideriamo la classe Persone con attributi CF, Nome e Tel e due sottoclassi: Studenti, con attributi Matricola e Facoltà, e Lavoratori, con attributi Attività e Reddito Secondo la relazione unica definiremo ununica relazione Persone con tutti gli attributi Persone(CF, Nome, Tel, Matricola, Facoltà, Attività e Reddito)

106 ESEMPIO Un solo schema di relazione, che contiene tutti gli attributi Con questa soluzione viene ignorata la gerarchia: si perdono le sottoclassi

107 4. Rappresentazione delle gerarchie fra classi Partizionamento verticale Si definiscono tre relazioni RA(XA), RB(KA*, XB), RC(KA*, XC), dove RA contiene tutti gli elementi della classe A, anche se stanno in qualche sottoclasse, mentre RB ed RC contengono solo quegli attributi, degli elementi di B e di C, che non sono in XA (attributi propri delle sottoclassi), ed una chiave esterna KA* che permette di ritrovare in RA il valore degli altri attributi. ESEMPIO si definiscono le relazioni Persone, con attributi CodFisc, Nome e Tel, Studenti con attributi CodFisc, Matricola e Facoltà e la relazione Lavoratoricon attributi CodFisc, Attività e Reddito. La relazione Persone contiene il codice fiscale il nome ed il telefono di tutte le persone, mentre le altre due relazioni contengono gli attributi propri delle sottoclassi, nonché il codice fiscale, che permette di risalire al nome; Persone(CodFisc, Nome, Telefono) Lavoratori(CodFisc*, Attività, Reddito) Studenti(CodFisc*, Matricola, Facoltà)

108 ESEMPIO Persone(CodFisc, Nome, Telefono) Lavoratori(CodFisc*, Attività, Reddito) Studenti(CodFisc*, Matricola, Facoltà)

109 4. Rappresentazione delle gerarchie fra classi Partizionamento orizzontale Si definiscono tre relazioni RA(XA), RB(XA,XB), RC(XA, XC), dove RA contiene solo gli elementi della classe A che non stanno in nessuna delle sottoclassi, mentre RB ed RC contengono tutti gli elementi di B e di C NOTA: se le sottoclassi costituiscono una copertura, la relazione RA(XA) non viene definita perché sarebbe sempre vuota. ESEMPIO: trattandosi di sottoclassi che non soddisfano il vincolo di copertura si definiscono le relazioni Persone con attributi CodFisc, Nome, Telefono, Studenti con attributi CodFisc, Nome, Telefono, Matricola e Facoltà e la relazione Lavoratori con attributi CodFisc, Nome, Telefono, Attività e Reddito. La relazione Persone contiene le informazioni delle persone che non sono né studenti né lavoratori, la relazione Studenti contiene le informazioni degli studenti e la relazione Lavoratori contiene le informazioni dei lavoratori. Persone(CodFisc, Nome, Telefono) Lavoratori(CodFisc*, Attività, Reddito, Nome, Telefono) Studenti(CodFisc*, Matricola, Facoltà, Nome, Telefono)

110 ESEMPIO Tre schemi indipendenti, uno per ogni classe, contenenti tutti gli attributi di ciascuna classe Anche con questa soluzione viene ignorata la gerarchia: si perde la superclasse Si osservi che con nessuna delle tre soluzioni è in generale possibile esprimere i vincoli strutturali della gerarchia, vale a dire i vincoli di disgiunzione e di totalità

111 5. Rappresentazione delle proprietà multivalore Una proprietà multivalore di una classe C si rappresenta eliminando il corrispondente attributo da C e creando una relazione con due attributi: una chiave esterna che fa riferimento alla chiave primaria di C ed un attributo che corrisponde allattributo multivalore da trasformare. Un oggetto con chiave primaria K ed in cui lattributo assume valore A 1,..., A n si rappresenta poi inserendo nella nuova relazione n coppie (K, A 1 ),..., (K,A n ). ESEMPIO: si immagini che un utente abbia attributi Codice, Cognome e Telefoni, con Telefoni multivalore. Applicando la trasformazione, si ottengono le due seguenti relazioni: Utenti(Codice, Cognome) TelefoniUtenti(Codice*, Telefono)

112 ESEMPIO Film(CodFilm,Titolo,Regista,Anno) Attori(CodFilm*, Attore)

113 6. Appiattimento degli attributi composti Se un attributo A di uno schema di relazione è di tipo strutturato con campi Ai, si sostituisce A con gli attributi A i. Se A faceva parte della chiave primaria dello schema di relazione, si sostituisce A con gli attributi Ai nella chiave, e poi si verifica che non esista un sottoinsieme degli attributi della nuova chiave primaria che è esso stesso una chiave. Sullo schema relazionale ottenuto si ripetono questa trasformazione e la precedente finché esistono schemi di relazioni con proprietà composte e proprietà multivalore. ESEMPIO: se gli Utenti hanno un attributo strutturato Indirizzo con attributi Via, CAP e Città, applicando la trasformazione alla relazione Utenti(Codice, Cognome, Indirizzo) si ottiene lo schema di relazione Utenti(Codice, Cognome, Via, CAP, Città)

114 Riassumendo Le regole di traduzione Entità: diventano tabelle ed i loro identificatori chiavi primarie Associazioni 1-1: se obbligatorie si procede come per le 1-N scegliendo il lato in cui includere gli attributi e la chiave esterna; se una opzionale si includono gli attributi e la chiave esterna sul latoobbligatorio; se entrambe opzionali si costruisce una tabella autonoma come per il caso N-N. Associazioni1-N:gli attributi dellassociazione e la chiave primaria della tabella relativa allentità dal lato N sono inclusi nella tabella relativa allentità dal lato1. Associazioni N-N: diventano tabelle con chiave primaria formata dallunione delle chiavi delle entità coinvolte

115 Confronto tra modello E-R e modello Relazionale Nonostante una evidente analogia tra Classe e Relazione Oggetto e Ennupla Attributo(E-R) e Attributo(Rel) sussiste in realtà una significativa differenza tra i concetti nei due modelli Non sempre una relazione rappresenta una classe: può rappresentare una associazione o un attributo multivalore Non sempre un ennupla rappresenta un oggetto: può rappresentare una coppia di oggetti in associazione o un possibile valore di un attributo multivalore Non sempre un attributo Rel rappresenta un attributo E-R: può rappresentare un oggetto di unaltra classe (chiave esterna)

116 Informazione incompleta ll modello relazionale impone ai dati una struttura rigida: - le informazioni sono rappresentate per mezzo di ennuple - solo alcuni formati di ennuple sono ammessi: quelli che corrispondono agli schemi di relazione I dati disponibili possono non corrispondere al formato previsto FranklinRooseveltDelano NomeCognomeSecondoNome WinstonChurchill CharlesDe Gaulle JosipStalin Es: PERSONE(Nome, SecondoNome, Cognome)

117 Informazione incompleta: soluzioni? Non conviene (anche se spesso si fa) usare valori del dominio (0, stringa nulla, 99,...): - potrebbero non esistere valori non utilizzati - in fase di utilizzo (nei programmi) sarebbe necessario ogni volta tener conto del significato di questi valori Tecnica rudimentale ma efficace: - valore nullo: denota lassenza di un valore del dominio (e non è un valore del dominio) - si possono (e debbono) imporre restrizioni sulla presenza di valori nulli

118 Matricola Cognome NomeData di nascita 6554RossiMario05/12/1978 NULLRossiMaria01/02/ VerdiLuisa12/11/1979 studenti CodiceTitoloDocente 01AnalisiMario 02ChimicaNULL ChimicaVerdi corsi StudenteVotoCorso NULL30NULL esami Troppi valori nulli

119 Tipi di valore nullo (almeno) tre casi differenti valore sconosciuto valore inesistente valore senza informazione CittaIndirizzoPrefettura RomaVia Quattro Novembre GenovaNULL OvadaNULL Prato

120 Vincoli, schemi e istanze I vincoli corrispondono a proprietà del mondo reale modellato dalla base di dati interessano a livello di schema (con riferimento cioè a tutte le istanze) Ad uno schema associamo un insieme di vincoli e consideriamo corrette (valide, ammissibili) le istanze che soddisfano tutti i vincoli Un'istanza può soddisfare altri vincoli

121 La Conoscenza Astratta nel modello Relazionale Nel modello relazionale si possono esprimere i seguenti vincoli: Vincolo di chiave Vincolo di chiave esterna Tipo di un attributo Attributo obbligatorio Vincoli strutturali delle associazioni (non completamente)

122 La Conoscenza Astratta nel modello Relazionale Rispetto al modello E-R, non è possibile rappresentare i vincoli delle gerarchie, mentre è possibile, solo in parte, rappresentare i vincoli strutturali delle associazioni Questo schema E-R si traduce nello schema relazionale S(h, a, k*) T(k, b) che rappresenta lunivocità e la totalità di R da S a T, ma non consente di esprimere la sua totalità da T ad S.

123 Una base di dati "scorretta" StudenteVotoLodeCorso e lode e lode Esami Matricola Cognome Rossi Neri Bianchi Nome Mario Piero Luca Studenti e lode

124 Vincolo di integrità Proprietà che deve essere soddisfatta dalle istanze che rappresentano informazioni corrette per lapplicazione Un vincolo è una funzione booleana (un predicato): associa ad ogni istanza il valore vero o falso Perchè? descrizione più accurata della realtà contributo alla qualità dei dati utili nella progettazione (vedremo) usati dai DBMS nella esecuzione delle interrogazioni

125 Tipi di vincoli Vincoli intrarelazionali: coinvolgono una singola relazione del database. Esempi - vincoli di ennupla - vincoli di chiave - vincoli su valore Vincoli interrelazionali: coinvolgono diverse relazioni del database. Esempio: vincoli di integrità referenziale

126 Vincoli di ennupla Esprimono condizioni sui valori di ciascuna ennupla, indipendentemente dalle altre ennuple Caso particolare: vincoli di dominio: coinvolgono un solo attributo Una possibile sintassi: espressione booleana di atomi che confrontano valori di attributo o espressioni aritmetiche su di essi (Voto 18) AND (Voto 30) (Voto = 30) OR NOT (Lode = "e lode")

127 Vincoli di ennupla, esempio Impiegato Rossi Neri Bruni Stipendi Lordo Netto Ritenute Lordo = (Ritenute + Netto)

128 Importanza delle chiavi Chiave: insieme di attributi che identificano univocamente le ennuple di una relazione Lesistenza delle chiavi garantisce laccessibilità a ciascun dato della base di dati Le chiavi permettono di correlare i dati in relazioni diverse: il modello relazionale è basato su valori In presenza di valori nulli, i valori della chiave non permettono di identificare le ennuple di realizzare facilmente i riferimenti da altre relazioni

129 Chiave primaria Chiave su cui non sono ammessi nulli Notazione: sottolineatura Matricola Nome Piero Mario Mario Cognome Neri Rossi NeriMario Corso Ing Mecc Ing Inf Ing Civile NULL Nascita 86765MarioNULL Ing Inf 5/12/78 10/7/79 NULL 3/11/76 5/12/78

130 {Cognome, Nome, Nascita} è unaltra chiave: Matricola Nome Piero Mario Cognome Neri Mario Rossi Piero Corso Ing Inf Ing Mecc Ing Inf Ing Mecc Nascita 5/12/78 10/7/79 3/11/76 5/12/78 Mario Rossi 5/12/78 Rossi Mario 3/11/76 Mario Un'altra chiave

131 Informazioni in relazioni diverse sono correlate attraverso valori comuni in particolare, valori delle chiavi (primarie) le correlazioni debbono essere "coerenti" Integrità referenziale

132 23/04/2014 Esempio Infrazioni Codice Data 1/2/95 4/3/95 5/4/96 5/2/98 Vigile ProvNumero MI TO PR 39548K E Matricola Vigili Cognome Rossi Neri Nome Luca Piero Mario MoriGino7543 Auto ProvNumero MI TO PR 39548K E Cognome Rossi Neri Nome Mario Luca

133 Matricola Vigili Cognome Rossi Neri Nome Luca Piero Mario MoriGino7543 Infrazioni Codice Data 1/2/95 4/3/95 5/4/96 5/2/98 Vigile ProvNumero MI TO PR 39548K E

134 Un vincolo di integrità referenziale (foreign key) fra gli attributi X di una relazione R 1 e unaltra relazione R 2 impone ai valori su X in R 1 di comparire come valori della chiave primaria di R 2 ES: vincoli di integrità referenziale fra: lattributo Vigile della relazione INFRAZIONI e la relazione VIGILI Vincolo di integrità referenziale

135 Infrazioni Codice Data 1/2/95 4/3/95 5/4/96 5/2/98 Vigile ProvNumero MI TO PR 39548K E Auto ProvNumero MI TO PR E39548 F Cognome Rossi Neri Nome Mario Luca TOE39548 TO E39548 Violazione di vincolo di integrità referenziale

136 Integrità referenziale e valori nulli Impiegati Matricola Cognome Rossi Neri Verdi Progetto IDEA XYZ NULL Progetti Codice IDEA BOH XYZ Inizio 01/ / /2001 Durata Costo BianchiIDEA

137 Azioni compensative Esempio: Viene eliminata una ennupla causando una violazione Comportamento standard: Rifiuto dell'operazione Azioni compensative: Eliminazione in cascata Introduzione di valori nulli

138 Eliminazione in cascata Impiegati Matricola Cognome Rossi Neri Verdi Progetto IDEA XYZ NULL 73032BianchiIDEA Progetti Codice IDEA BOH XYZ Inizio 01/ / /2001 Durata Costo XYZ07/ XYZ07/ XYZ07/ NeriXYZ

139 Introduzione di valori nulli Impiegati Matricola Cognome Rossi Neri Verdi Progetto IDEA XYZ NULL 73032BianchiIDEA Progetti Codice IDEA BOH XYZ Inizio 01/ / /2001 Durata Costo XYZ07/ XYZ07/ XYZ07/ NULL

140 ESEMPI ESERCIZI

141 Esempio: Noleggio DVD Un negozio noleggia film in DVD il negozio dispone di un catalogo dei film; ogni film è identificato dal codice DVD nel catalogo sono specificati il titolo del film, il regista, gli attori principali, la loro nazionalità ed il personaggio interpretato nel film, lanno di produzione ciascun film è indicizzato da un insieme di termini (una lista di parole che descrivono sinteticamente il contenuto del film) I film possono essere anche in lingua originale (diversa dallitaliano); in tal caso nel catalogo è detto di che lingua si tratta, e se il film è sottotitolato. di ogni film presente nel catalogo il negozio dispone di uno o più DVD, ciascuno identificato dalla sua collocazione; se un DVD è noleggiato, interessa sapere il cliente che lha noleggiato e la data del noleggio. i clienti sono identificati da un codice; di essi interessa inoltre cognome, nome, indirizzo, telefono.

142 Come si procede? Si individuano le classi le associazioni gli attributi le chiavi le gerarchie

143 Individuare le classi Le entità presenti nella realtà e che sono interessanti nel modello sono i film, i dvd, gli attori, i clienti; le classi individuate sono: gli attori costituiscono una classe in quanto interessano delle loro proprietà (nazionalità,…), mentre del regista interessa solo il nome, e quindi va considerato un attributo i dvd costituiscono una classe; sono concettualmente distinti dai film, e interessa sapere a chi sono noleggiati, ed in quale data FilmAttoriDVDClienti

144 Individuare le associazioni Film Attori DVD Clienti contiene N:1 recita N:MèNoleggiato: 1:N è parziale su film: ad un film possono non essere associati attori contiene è unassociazione N:1 perché un dvd rappresenta solo un film, mentre ad un film possono essere associati più dvd

145 Individuare attributi e chiavi Film Attori DVD Clienti nome nazionalità collocazione data noleggio codice DVD titolo regista anno lingua sottotitoli/no-sottotitoli termini codice cliente cognome nome telefono indirizzo(città, via)

146 Schema relazionale FILM( codiceDVD, titolo, regista, anno, lingua, sottotitoli) rappresenta la classe FILM; lattributo Termini non è rappresentato perchè è multivalore. Attori( nome, nazionalità) rappresenta la classe Attori Recita( codiceDVD*, nome* ) rappresenta lassociazione N:M recita DVD( collocazione, dataNoleggio, codiceDVD*, codiceCliente*) rappresenta la classe DVD e le associazioni contiene e èNoleggiato Clienti( codiceCliente, cognome, nome, telefono, città, via)

147 Individuare le gerarchie Film Attori DVD Clienti contiene N:1 recita N:MèNoleggiato: 1:N Film In Lingua DVD noleggiati

148 Individuare attributi e chiavi Film Attori DVD Clienti nome nazionalità collocazione codice DVD titolo regista anno termini codice cliente cognome nome telefono indirizzo(città, via) Film In Lingua lingua sottotitoli/no-sottotitoli DVD noleggiati data noleggio

149 Esempio Un impiegato ha codice,cognome ed uno stipendio;può partecipare ad un progetto definito da un budget e da un nome;limpiegato può dirigere un solo dipartimento definito da un nome e dal telefono ma può afferire in date differenti a più dipartimenti; il dipartimento ha una sede composta da un indirizzo e da una città

150

151 Esercizio La segreteria di un corso di laurea deve gestire alcune informazioni relative allorario delle lezioni. informazioni: aule, corsi, lezioni le aule sono identificate da un codice, di ogni aula interessa il numero dei posti, ledificio in cui è situata, se ha o non ha proiettore alcune aule sono dotate di calcolatori, in questo caso interessa sapere il numero dei pc i corsi sono identificati da un codice; di ogni corso interessa il nome e il docente le lezioni sono caratterizzate da unora dinizio, unora di fine, un giorno della settimana, il semestre ogni lezione è tenuta in unaula e si riferisce ad un corso


Scaricare ppt "Sistemi per il recupero delle informazioni RIASSUNTO."

Presentazioni simili


Annunci Google