La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Informazione incompleta Le tuple che compongono la base di dati devono essere omogenee. Quindi ad ogni attributo deve essere associato un valore in ogni.

Presentazioni simili


Presentazione sul tema: "Informazione incompleta Le tuple che compongono la base di dati devono essere omogenee. Quindi ad ogni attributo deve essere associato un valore in ogni."— Transcript della presentazione:

1 Informazione incompleta Le tuple che compongono la base di dati devono essere omogenee. Quindi ad ogni attributo deve essere associato un valore in ogni tupla. Non sempre questo è possibile. Es. Persone ( Cognome, Nome, Indirizzo, Telefono ) Potrebbe esserci una persona che non ha telefono, o di cui non conosciamo lindirizzo. Oppure: FranklinRooseveltDelano NomeCognomeSecondoNome WinstonChurchill CharlesDe Gaulle JosipStalin

2 Informazione incompleta: soluzioni? non conviene (anche se spesso si fa) usare valori del dominio (0, stringa nulla, 99,...): –potrebbero non esistere valori non utilizzati –valori non utilizzati potrebbero diventare significativi –in fase di utilizzo (nei programmi) sarebbe necessario ogni volta tener conto del significato di questi valori

3 Informazione incompleta Nel modello relazionale è definito un valore convenzionale, detto valore nullo, che indica la non disponibilità dellinformazione. Il valore nullo può rappresentare 3 tipi di informazione: – sconosciuta – inesistente – indeterminata (nei DBMS disponibili si considera in genere questo caso)

4 Vincoli di Integrità Non tutte le combinazioni possibili di valori dei domini su cui è definita una relazione sono accettabili. Alcuni attributi possono assumere valori in un certo range Alcuni attributi devono essere diversi in ogni tupla della stessa relazione Es. valori dellattributo Matricola in una relazione del tipo Studenti( Matricola, Cognome, Nome, DataNascita )

5 Vincoli di Integrità Alcuni valori possono essere incompatibili con altri allinterno della stessa relazione Es. data la relazione Esami( Matricola, Voto, Lode, CodCorso ) –una stessa coppia Matricola,Corso può apparire una sola volta –Il valore Vero per lattributo Lode è corretto solo se Voto=30 Alcuni valori possono essere incompatibili con i valori di unaltra relazione Es. Data la relazione Esami e la relazione Corsi( CodCorso, Titolo, Docente ) ogni valore di CodCorso in Esami deve essere un valore esistente di CodCorso in Corsi

6 Vincoli di Integrità Sono condizioni, sotto forma di predicati logici, che sono inserite nella base di dati per garantirne la consistenza. Ogni istanza della base di dati deve soddisfare i vincoli di integrità (il predicato deve assumere valore vero ). Una istanza che soddisfi tutti i vincoli è detta corretta (o lecita o ammissibile)

7 Vincoli di Integrità Possono essere di vario tipo: Intrarelazionale se coinvolge attributi della stessa relazione – Vincoli di tupla possono essere valutati su ciascuna tupla indipendentemente dalle altre Vincoli di dominio sono definiti su singoli valori Interrelazionale se coinvolge più relazioni

8 Vincoli di tupla Possono essere definiti attraverso operatori booleani Es. ( Voto >= 18 ) AND ( Voto <= 30 ) ( NOT ( lode=Vero )) OR ( Voto=30 ) oppure, data la relazione Pagamenti( Data, Importo, Ritenute, Netto ) Netto = Importo - Ritenute

9 Identificazione delle tuple –non ci sono due tuple con lo stesso valore sullattributo Matricola –non ci sono due tuple uguali su tutti e tre gli attributi Cognome, Nome e Data di Nascita Matricola Nome Mario Piero Mario Mario Cognome Rossi Neri Rossi Piero Corso Ing Inf Ing Mecc Ing Inf Ing Mecc Nascita 5/12/78 10/7/79 3/11/76 5/12/78

10 Chiavi Una chiave è un insieme minimale di attributi utilizzato per identificare univocamente le tuple di una relazione. Formalmente: Un insieme di attributi K è superchiave per una relazione r se r non contiene due tuple t 1 e t 2 tali che t 1 [K] = t 2 [K] Un insieme di attributi K è chiave per r se è superchiave minimale, cioè se non esiste unaltra superchiave K che sia sottoinsieme di K

11 Una chiave Matricola è una chiave: –è superchiave –contiene un solo attributo e quindi è minimale Matricola Nome Mario Piero Mario Mario Cognome Rossi Neri Rossi Piero Corso Ing Inf Ing Mecc Ing Inf Ing Mecc Nascita 5/12/78 10/7/79 3/11/76 5/12/78

12 Chiavi Una chiave è tale se soddisfa la definizione per tutte le possibili tuple appartenenti alla relazione, e non solo per quelle che effettivamente appaiono come istanze della relazione stessa. Quindi la chiave è legata allo schema della relazione. Ogni relazione, per definizione, possiede una chiave. Infatti linsieme X su cui è definita è sicuramente superchiave.

13 Chiavi La presenza di valori nulli in una chiave può creare può vanificare la proprietà di unicità delle tuple identificate da una certa chiave. Si impone quindi che almeno una chiave non contenga valori nulli. Tale chiave è detta chiave primaria. Di solito la chiave primaria è sottolineata nello schema di una relazione. Es. Studenti( Matricola, Cognome, Nome, Nascita, Corso )

14 Vincoli di Integrità Referenziale In alcuni casi (corrispondenze fra relazioni) è necessario che i valori degli attributi di una relazione R 1 si possano trovare anche in attributi corrispondenti di R 2. Un vincolo di integrità referenziale (o foreign key) fra un insieme di attributi X di R 1 e unaltra relazione R 2 è soddisfatto se i valori su X di ciascuna tupla di R 1 compaiono come valori della chiave (primaria) di R 2. Non tutti i DBMS consentono di definire una chiave come primaria, in presenza di più chiavi. Quindi sarà necessario esprimere il vincolo specificando per esteso gli attributi delluna e dellaltra relazione collegati da tale vincolo.

15 Algebra Relazionale Linguaggio procedurale, in cui le operazioni vengono descritte descrivendo la procedura per ottenere la soluzione. Operatori: unione intersezione differenza derivati dalla teoria degli insiemi ridenominazione selezione proiezione specifici dellalgebra relazionale join che può assumere diverse forme (naturale, theta-join, prodotto cartesiano)

16 Operatori derivati dagli insiemi Le relazioni sono insiemi e quindi è naturale estendere ad esse le operazioni relative. Tuttavia le relazioni sono insiemi di tuple omogenee, e quindi ha senso definire ed applicare tali operatori solo a tuple definite sugli stessi attributi. Es. lunione fra due relazioni su tuple non omogenee non è una relazione.

17 Operatori derivati dagli insiemi Unione Lunione fra due relazioni r 1 e r 2 definite sullo stesso insieme di attributi X è indicata con r 1 r 2 ed è una relazione su X contenente le tuple che appartengono a r 1 o r 2 oppure ad entrambe. Intersezione Lintersezione fra due relazioni r 1 e r 2 definite sullo stesso insieme di attributi X è indicata con r 1 r 2 ed è una relazione su X contenente le tuple che appartengono sia a r 1 che a r 2. Differenza La differenza fra due relazioni r 1 e r 2 definite sullo stesso insieme di attributi X è indicata con r 1 - r 2 ed è una relazione su X contenente le tuple che appartengono a r 1 e non a r 2.

18 Laureati Matricola Età Nome Neri Verdi Rossi Quadri Matricola Età Nome Neri Verdi Neri Laureati Quadri MatricolaEtàNome Neri Verdi Neri Rossi Neri Verdi Rossi Neri Verdi Neri Neri Verdi Neri Rossi Unione

19 Laureati Matricola Età Nome Neri Verdi Rossi Quadri Matricola Età Nome Neri Verdi Neri Laureati Quadri MatricolaEtàNome Neri Verdi Neri Verdi Neri Verdi Neri Verdi Intersezione

20 Laureati MatricolaEtàNome Neri Verdi Rossi Quadri Matricola Età Nome Neri Verdi Neri Laureati – Quadri MatricolaEtàNome Neri Verdi Rossi Neri Verdi Rossi Differenza

21 Ridenominazione E un operatore che consente di modificare i nome di un attributo per poterlo associare ad un altro attributo in una operazione algebrica. Si indica con nuovonome vecchionome ( Relazione ) Es. date le relazioni Paternità( Padre, Figlio ) e Maternità( Madre, Figlio ) è possibile ottenere Genitore Padre( Paternità ) Genitore Madre ( Maternità )

22 REN Genitore Padre (Paternità) REN Genitore Madre (Maternità) GenitoreFiglio AdamoCaino AbramoIsacco AdamoAbele GenitoreFiglio EvaSet SaraIsacco EvaAbele GenitoreFiglio AdamoCaino AbramoIsacco AdamoAbeleEvaSet SaraIsacco EvaAbele REN Genitore Padre (Paternità) REN Genitore Madre (Maternità)

23 Selezione e Proiezione Le operazioni di selezione e di proiezione si applicano ad una relazione e ne restituiscono una porzione. Possono essere considerate ortogonali o complementari, in quanto una opera sulle righe e laltra sulle colonne. La selezione produce un insieme di tuple, su tutti gli attributi. La proiezione produce un risultato definito su un insieme di attributi, cui contribuiscono tutte le tuple.

24 Selezione La selezione produce una nuova relazione definita sugli stessi attributi, contenente solamente le tuple di una relazione che soddisfano una specifica condizione di selezione. Si indica con F ( r ) dove: F è una condizione da verificare r è la relazione a cui la selezione è applicata Quindi, F ( r ) produce una relazione sugli stessi attributi di r contenente le tuple su cui F è vera.

25 Selezione, sintassi e semantica sintassi SEL Condizione (Operando) –Condizione: espressione booleana (come quelle dei vincoli di ennupla) semantica –il risultato contiene le tuple dell'operando che soddisfano la condizione

26 Selezione F è una formula preposizionale su X, cioè una formula ottenuta combinando con i simboli (and) (or) (not) espressioni del tipo A B o A c dove : è un operatore di confronto (,,,, ) A e B sono attributi di X su cui i confronto abbia senso c è una costante tale che il confronto con A sia definito E definito un valore di verità di F su una tupla t: A B è vera se e solo se t[A] t[B] è vero A c è vera se t[A] c è vera F 1 F 2, F 1 F 2, F hanno lusuale significato

27 Impiegati CognomeFilialeStipendioMatricola NeriMilano RossiRoma NeriNapoli Milano CognomeFilialeStipendioMatricola NeriMilano RossiRoma NeriNapoli Milano Impiegati ( che guadagnano piu di 50 ) Milano NeriNapoli SEL Stipendio > 50 (Impiegati)

28 Selezione con valori nulli CognomeFilialeEtàMatricola NeriMilano RossiRoma BruniMilano NULL 9553 Impiegati SEL Età>30 (Persone) SEL Età 30 (Persone) Persone Perché? Perché le selezioni vengono valutate separatamente! Ma anche SEL Età>30 Età 30 (Persone) Persone Perché? Perché anche le condizioni atomiche vengono valutate separatamente!

29 Selezione con valori nulli Per riferirsi ai valori nulli esistono forme apposite di condizioni: IS NULL IS NOT NULL SEL Età>30 (Persone) SEL Età 30 (Persone) SEL Età IS NULL (Persone) = SEL Età>30 Età 30 Età IS NULL (Persone) = Persone

30 Proiezione Dati una relazione r(X) e un sottoinsieme Y di X la proiezione di r su Y si indica con Y ( r ) ed è linsieme di tuple su Y ottenute dalle tuple di r considerando solo i valori su Y. Y ( r ) = { t[Y] | t r } Una proiezione ha un numero di tuple minore o uguale rispetto alla relazione r cui è applicata. Il numero di tuple è uguale se e solo se Y è superchiave per r.

31 Proiezione operatore monadico produce un risultato che –ha parte degli attributi dell'operando –contiene tuple cui contribuiscono tutte le tuple dell'operando sintassi PROJ ListaAttributi (Operando) semantica il risultato contiene le tuple ottenute da tutte le tuple dell'operando ristrette agli attributi nella lista

32 CognomeFilialeStipendioMatricola NeriMilano NeriNapoli RossiRoma RossiRoma – visualizzare matricola e cognome di tutti gli impiegati PROJ Matricola, Cognome (Impiegati) CognomeFilialeStipendioMatricola NeriMilano NeriNapoli RossiRoma RossiRoma PROJ Cognome, Filiale (Impiegati)

33 Join E loperatore più caratteristico, che evidenzia la proprietà del modello relazionale di essere basato su valori. Loperatore di join (naturale) correla dati in relazioni diverse, producendo una relazione definita sullunione degli insiemi di attributi degli operandi, le cui tuple sono ottenute combinando le tuple degli operandi con valori uguali su attributi comuni.

34 Join Il join naturale r 1 r 2 di r 1 (X 1 ) e r 2 (X 2 ) è una relazione definita su X 1 X 2 ( che si può scrivere X 1 X 2 ) : r 1 r 2 = { t su X 1 X 2 | t[X 1 ] r 1 e t[X 2 ] r 2 } Il grado della relazione ottenuta è minore o uguale al grado della somma dei gradi delle due relazioni in quanto gli attributi omonimi compaiono una sola volta. Se X 1 X 2 è vuoto il join naturale equivale al prodotto cartesiano fra le relazioni. Se X 1 =X 2 il join naturale equivale allintersezione fra le relazioni

35 Join Se ciascuna tupla di ciascuno degli operandi contribuisce ad almeno una tupla del risultato il join si dice completo. Se per alcune tuple non è verificata la corrispondenza e non contribuiscono al risultato, le tuple si dicono dangling. Ai due estremi si pongono il join vuoto in cui nessuna tupla degli operandi è combinabile, e quello in cui ciascuna delle tuple di un operando è combinabile con tutte le tuple dellaltro. In questo caso la cardinalità della relazione risultante è pari al prodotto della cardinalità degli operandi

36 Join Proprietà se il join di r 1 e r 2 è completo allora contiene un numero di tuple pari almeno al massimo fra |r 1 |e |r 2 | se X 1 X 2 contiene una chiave per r 2, allora il join di r 1 (X 1 ) e r 2 (X 2 ) contiene al più |r 1 | tuple. r 1 r 2 = r 1 r 2 il join è commutativo (r 1 r 2 ) r 3 = r 1 (r 2 r 3 ) il join è associativo Quindi sequenze di join possono essere scritte senza parentesi

37 Join Se si devono correlare attributi con nome diverso è possibile fare il theta-join, definito come un prodotto cartesiano seguito da una selezione r 1 F r 2 = F (r 1 r 2 ) Se F è una relazione di uguaglianza, con un attributo della pima relazione e uno della seconda, allora siamo in presenza di un equi-join. Sono importanti formalmente: il join naturale è basato sui nomi degli attributi equi-join e theta-join sono basati sui valori


Scaricare ppt "Informazione incompleta Le tuple che compongono la base di dati devono essere omogenee. Quindi ad ogni attributo deve essere associato un valore in ogni."

Presentazioni simili


Annunci Google