La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Basi di Dati prof. A. Longheu 6 – Progettazione Logica Cap. 7 Basi di dati Atzeni – Ceri – Paraboschi - Torlone.

Presentazioni simili


Presentazione sul tema: "Basi di Dati prof. A. Longheu 6 – Progettazione Logica Cap. 7 Basi di dati Atzeni – Ceri – Paraboschi - Torlone."— Transcript della presentazione:

1

2 Basi di Dati prof. A. Longheu 6 – Progettazione Logica Cap. 7 Basi di dati Atzeni – Ceri – Paraboschi - Torlone

3 Progettazione Logica Obiettivo della Progettazione Logica e quello di costruire uno schema logico,in un determinato modello (ad es. relazionale), che descriva in maniera corretta ed efficiente tutte le informazioni contenute nello schema E-R prodotto dalla progettazione concettuale. Non si tratta di una semplice traduzione Nel seguito, il termine entità è lo stesso del modello e-r, il termine associazione è la relazione del modello e-r, per non confonderla con la relazione del modello relazionale (che è una semplice tabella).

4 La progettazione logica si articola in due fasi: Ristrutturazione dello schema E-R: e una fase indipendente dal modello logico e si basa su criteri di ottimizzazione dello schema e di successiva semplificazione. Traduzione verso il Modello Logico: fa riferimento ad un modello logico (ad es. relazionale) e puo includere ulteriore ottimizzazione che si basa sul modello logico stesso (es. normalizzazione). Progettazione Logica

5 Progettazione Logica

6 Ristrutturazione - 1 Linput ed output della fase di ristrutturazione dello schema E-R sono: Input: Schema Concettuale E-R iniziale, Carico Applicativo previsto (in termini di dimensione dei dati e caratteristica delle operazioni) Output : Schema E-R ristrutturato che rappresenta i dati e tiene conto degli aspetti realizzativi

7 Linput della ristrutturazione è lo schema E-R, ricavato dalla fase di progettazione concettuale, ed il carico applicativo. Per determinare il carico applicativo vengono definiti degli indici di prestazione per la valutazione di schemi E-R. Tali indici sono due: Costo di unoperazione: in termini di numero di occorrenze di entita ed associazioni che mediamente vanno visitate per rispondere a quella operazione sulla base di dati Occupazione di memoria: viene valutata in termini dello spazio di memoria (misurato in byte) necessario per memorizzare i dati del sistema. Ristrutturazione – 2 Determinazione Carico Applicativo

8 Per studiare questi indici abbiamo bisogno di conoscere: Volume dei dati: a) numero (medio) di occorrenze di ogni entita ed associazione b) dimensioni di ciascun attributo Caratteristiche delle operazioni: a) tipo di operazione (interattiva o batch) b) frequenza (esecuzioni/tempo) c) dati coinvolti (entita e o associazioni) Ristrutturazione – 3 Determinazione Carico Applicativo

9 Esempio:ditta con sedi in citta diverse Ristrutturazione – 4 Determinazione Carico Applicativo

10 Operazione 1: assegna un impiegato ad un progetto Operazione 2: trova i dati di un impiegato, del dipartimento nel quale lavora e dei progetti in cui e coinvolto Operazione 3: trova i dati di tutti gli impiegati di un certo dipartimento Operazione 4: per ogni sede, trova i dipartimenti con il cognome del direttore e lelenco degli impiegati. Ristrutturazione – 5 Determinazione Carico Applicativo Operazioni dellesempio

11 Ristrutturazione – 6 Determinazione Carico Applicativo

12 Avendo a disposizione il volume dei dati (tabella dei volumi) e le caratteristiche delle operazioni (tabella delle operazioni), e possibile calcolare gli indici di prestazione. Partendo dalla stima dei costi di ogni operazione, tale indice si determina contando il numero di accessi alle occorrenze di entita e relazioni necessario per eseguire loperazione. Prendiamo per esempio loperazione 2 e facciamo riferimento allo schema di operazione Ristrutturazione – 7 Determinazione Carico Applicativo

13 Ristrutturazione – 8 Determinazione Carico Applicativo Lo schema di operazione in figura mostra (tramite delle frecce) le entità e le relazioni effettivamente coinvolte nellesecuzione delloperazione (trova i dati di un impiegato, del dipartimento nel quale lavora e dei progetti in cui e coinvolto)

14 Dobbiamo accedere ad unoccorrenza di Impiegato e di Afferenza e quindi di Dipartimento. Successivamente, per avere i dati dei progetti a cui lavora, dobbiamo accedere (in media) a tre occorrenze di Partecipazione e quindi a tre entita Progetto. Tutto viene riassunto nella tavola degli accessi, che costituisce una stima del costo Ristrutturazione – 9 Determinazione Carico Applicativo

15 Ristrutturazione – 10 Determinazione Carico Applicativo

16 Ristrutturazione – 11 Determinazione Carico Applicativo Per valutare il secondo indice, loccupazione di memoria, è sufficiente utilizzare la tabella dei volumi da cui prelevare il numero di occorrenze, aggiungere la dimensione della singola occorrenza ed ottenere quindi loccupazione di memoria di tutte le entità e relazioni.

17 Ristrutturazione – 12 Una volta determinato il carico applicativo, ed avendo dalla progettazione concettuale lo schema E-R, tutti gli input della ristrutturazione sono noti. Si passa quindi alla ristrutturazione vera e propria, per determinare lo schema ristrutturato (output) La ristrutturazione consta di quattro fasi: analisi delle ridondanze, eliminazione delle generalizzazioni, partizionamento/accorpamento di entità ed associazioni, e scelta degli identificatori principali (chiavi)

18 Ristrutturazione – 13

19 Analisi delle Ridondanze: si decide se eliminare o no eventuali ridondanze. Eliminazione delle Generalizzazioni: tutte le generalizzazioni vengono analizzate e sostituite da altro. Partizionamento/Accorpamento di entita ed associazioni: si decide se partizionare concetti in piu parti o viceversa accorpare. Scelta degli identificatori primari: si sceglie un identificatore per quelle entita che ne hanno piu di uno Ristrutturazione – 14

20 Una Ridondanza in uno schema E-R è la presenza di un attributo che può essere ricavato da altri. In particolare, (vedi esempi nelle tabelle seguenti): Attributi derivabili da altri attributi della stessa entita (importo lordo nella tabella fattura) Attributi derivabili da attributi di altre entita(o associazioni) (Acquisto: Importo totale da Prezzo ) Attributi derivabili da operazioni di conteggio (Citta: Numero abitanti contando il numero di Residenza ) Associazioni derivabili dalla composizione di altre associazioni in presenza di cicli. (Docenza da Frequenza ed Insegnamento). Tuttavia i cicli non necessariamente generano ridondanze (Tesi al posto di Docenza). Ristrutturazione – 15 Analisi delle ridondanze

21 Ristrutturazione – 16 Analisi delle ridondanze

22 Vantaggi nellavere e mantenere un dato derivabile: riduce gli accessi per calcolare il dato derivato. Svantaggi : occupazione di memoria e necessita di effettuare operazioni aggiuntive per mantenere il dato aggiornato Decisione: mantenere o eliminare? Basta confrontare i costi di esecuzione delle operazioni sulloggetto Ristrutturazione – 17 Analisi delle ridondanze

23 Consideriamo lesempio Citta-Persona per lanagrafica di una regione. Operazione 1: memorizza una persona nuova con la relativa citta. Operazione 2: stampa tutti i dati di una citta(incluso il numero di abitanti). Valutiamo gli indici di prestazione per lattributo Numero Abitanti Ristrutturazione – 18 Analisi delle ridondanze

24 Si effettua una prima valutazione in presenza della ridondanza: Assumendo che il numero di abitanti richieda 4 byte il dato richiede 4*200 = 800 byte. Loperazione 1 richiede un accesso in scrittura a Persona uno in scrittura a Residenza ed uno in lettura ed uno in scrittura (per incrementare il numero di abitanti) a Citta ripetuto 500 volte si hanno 1500 accessi in scrittura e 500 in lettura. Loperazione 2 richiede un solo accesso in lettura a Citta 2 volte al giorno. Supponendo che la scrittura ha un costo doppio rispetto ad una lettura si hanno 3500 accessi al giorno in presenza della ridondanza. Ristrutturazione – 19 Analisi delle ridondanze

25 Si effettua una seconda valutazione in assenza della ridondanza: Per loperazione 1,un accesso in scrittura a Persona ed uno in scrittura a Residenza per un totale di 1000 accessi in scrittura al giorno.Per loperazione 2 abbiamo bisogno di un acceso in lettura a Citta(possiamo trascurare) e 5000 accessi in lettura a Residenza in media (persone/citta) per un totale di accessi in lettura al giorno. Il totale e di accessi in lettura al giorno. Quindi 8500 in piu rispetto al caso di ridondanza contro meno di un solo Kbyte di memoria in piu. Daltra parte se loperazione 2 fosse stata richiesta solo 1 volta ogni 4 settimane avremmo avuto 3500*24=84000 accessi ogni 4 settimane con ridondanza contro in assenza. Ristrutturazione – 20 Analisi delle ridondanze

26 Il modello relazionale non permette di rappresentare gerarchie quindi conviene trasformarle in altri concetti. Ristrutturazione – 21 Eliminazione delle generalizzazioni

27 La prima soluzione prevede laccorpamento dei figli nel padre: le entita figlie vengono eliminate e le loro proprieta (attributi, associazioni, generalizzazioni) vengono aggiunte al padre, che deve avere in più un attributo (TIPO) per distinguere le entità figlie. Ristrutturazione – 22 Eliminazione delle generalizzazioni

28 La seconda soluzione prevede laccorpamento del padre nei figli: lentita padre viene eliminata e per ereditarieta i suoi attributi, identificatori e relazioni vanno ai figli. Ristrutturazione – 23 Eliminazione delle generalizzazioni

29 La terza soluzione prevede la sostituzione: la generalizzazione si trasforma in associazioni uno ad uno che legano padre e figli Ristrutturazione – 24 Eliminazione delle generalizzazioni

30 I principi generali sono: gli accessi si riducono separando attributi di uno stesso concetto che vengono acceduti da operazioni diverse gli accessi si riducono raggruppando attributi di concetti diversi che vengono acceduti dalle medesime operazioni Ristrutturazione – 25 Partizionamento/accorpamento

31 Ristrutturazione – 26 Partizionamento/accorpamento Esempio di partizionamento:

32 Nellesempio precedente vengono create due entita e gli attributi vengono divisi: partizionamento verticale Se invece si suddivide in due entita con gli stessi attributi (ad esempio Analista e Venditore) con operazioni distinte sulle due si ha il partizionamento orizzontale Ristrutturazione – 27 Partizionamento/accorpamento

33 Un caso particolare di partizionamento è quello necessario per leliminazione di attributi multivalore, generalmente non supportati dal modello relazionale Ristrutturazione – 28 Partizionamento/accorpamento

34 Ristrutturazione – 29 Partizionamento/accorpamento Esempio di partizionamento di associazione:

35 Ristrutturazione – 30 Partizionamento/accorpamento Esempio di accorpamento:

36 Laccorpamento e giustificato se le operazioni piu frequenti su Persona richiedono sempre i dati relativi allappartamento e quindi vogliamo risparmiare gli accessi alla relazione che li lega. Normalmente gli accorpamenti si fanno su relazioni uno ad uno, raramente su uno a molti mai su molti a molti. Ristrutturazione – 31 Partizionamento/accorpamento

37 Gli identificatori con valori nulli non possono essere principali (non garantiscono laccesso a tutti i record). Un identificatore semplice (pochi attributi) e da preferire (indici piccoli fanno risparmiare memoria e facilitano la programmazione). Un identificatore interno e preferibile ad uno esterno (stesso motivo del precedente) Un identificatore usato da molte operazioni per accedere alle occorrenze di unentita e da preferire (in quanto ottimizza il maggior numero di operazioni) Ristrutturazione – 32 Scelta degli identificatori

38 Nel caso di associazione molti a molti, la traduzione segue le regole: Ogni entita coinvolta si traduce in una relazione (tabella) con lo stesso nome dellentità, avente i suoi stessi attributi e per chiave il suo identificatore. La relazione si traduce in una relazione (tabella) con lo stesso nome avente gli stessi attributi e come chiave linsieme di tutti gli identificatori delle entita coinvolte. Traduzione – 1 Associazione molti a molti (m-n)

39 Esempio: Impiegato(Matricola,Cognome,Stipendio) Progetto(Codice,Nome,Budget) Partecipazione(Matricola,Codice,Data inizio) Traduzione – 2 Associazione molti a molti (m-n)

40 Nellesempio, esistono vincoli referenziali fra Matricola,Codice di Partecipazione e gli omonimi di Impiegato e Progetto. Per rendere piu comprensibile lo schema si possono rinominare gli attributi di partecipazione con Partecipazione(Impiegato, Progetto, Data inizio) Traduzione – 3 Associazione molti a molti (m-n)

41 In caso di relazioni ricorsive, la ridenominazione può essere indispensabile, come mostrato nellesempio: Prodotto(Codice,Nome,Costo) Composizione(Composto,Componente,Quantita) Esiste un vincolo referenziale tra Composto,Componente e lattributo Codice di Prodotto. Traduzione – 4 Associazione molti a molti (m-n)

42 Esempio di associazione molti a molti con più di due entità coinvolte (le regole sono le stesse): Fornitore(PartitaIVA,NomeDitta) Prodotto(Codice,Genere), Dipartimento(Nome,Telefono) Fornitura(Fornitore,Prodotto,Dipartimento,Quantita) Traduzione – 5 Associazione molti a molti (m-n)

43 Traduzione – 6 Associazione uno a molti (1-n) Nel caso di associazione uno a molti, la traduzione segue le regole: Lentita partecipante con cardinalità (1,1) si traduce in una relazione (tabella) con lo stesso nome dellentità, avente i suoi stessi attributi, per chiave il suo identificatore e che ingloba anche la chiave della entità che partecipa con cardinalità (1,n) (tale attributo diventa quindi una chiave esterna), più tutti gli eventuali attributi della associazione (che non avrà quindi una tabella distinta come nel caso m-n). Lentita partecipante con cardinalità (1,n) si traduce in una relazione (tabella) con lo stesso nome dellentità, avente i suoi stessi attributi, per chiave il suo identificatore

44 Traduzione – 7 Associazione uno a molti (1-n) Giocatore(Cognome,DataNascita,Ruolo,NomeSquadra,Ingaggio) Squadra(Nome,Citta,ColoriSociali) Vincolo di integrita referenziale tra Nomesquadra di Giocatore e Nome di Squadra.

45 Esempio di entità con identificatore esterno (la regola ed il risultato sono ancora gli stessi): Studente(Matricola,NomeUniversita,Cognome,AnnoIscrizione) Universita(Nome,Citta,Indirizzo) Vincolo referenziale fra NomeUniversita e Nome. Traduzione – 8 Associazione uno a molti (1-n)

46 Traduzione – 9 Associazione uno a uno (1-1) Nel caso di associazione uno a uno con partecipazione obbligatoria per entrambe le entità (non (0,1) ma (1,1)), la traduzione segue le regole: Una delle entita si traduce in una relazione (tabella) con lo stesso nome dellentità, avente i suoi stessi attributi, per chiave il suo identificatore e che ingloba anche la chiave della altra entità (tale attributo diventa quindi una chiave esterna), più tutti gli eventuali attributi della associazione (come nel caso 1-n, lassociazione non avrà una tabella distinta). Lentita restante si traduce in una relazione (tabella) con lo stesso nome dellentità, avente i suoi stessi attributi, per chiave il suo identificatore

47 In base alle regole, sono possibili due soluzioni: Direttore(Codice,Cognome,Stipendio,DipartimentoDiretto,InizioDirezione) Dipartimento(Nome,Telefono,Sede) oppure Direttore(Codice,Cognome,Stipendio) Dipartimento(Nome,Telefono, Sede, Direttore, InizioDirezione) Esiste in teoria lopzione di fondere tutto in ununica tabella; tale opzione viene però scartata perché se in sede di progettazione concettuale era stato deciso di avere due entità legate da una relazione, diventa inopportuno tornare indietro in sede di progettazione logica. Traduzione – 10 Associazione uno a uno (1-1)

48 Qualora una delle entità partecipi alla associazione con cardinalità (0,1) ossia è unentità con partecipazione opzionale, delle due soluzioni si preferisce quella in cui la associazione viene inglobata dallaltra entità (quella che partecipa con cardinalità (1,1)), questo per evitare i valori nulli che figurerebbero negli attributi relativi allassociazione qualora venissero inglobati nellentità che partecipa con cardinalità (0,1): Impiegato(Codice,Cognome,Stipendio) Dipartimento(Nome,Telefono,Sede, Direttore,InizioDirezione) Traduzione – 11 Associazione uno a uno (1-1)

49 Traduzione – 12 Associazione uno a uno (1-1) Per entrambe le entità con partecipazione opzionale, lassociazione può essere tradotta in una tabella distinta (come per il caso m-n): Impiegato(Codice,Cognome,Stipendio) Dipartimento(Nome,Telefono,Sede) Direzione(Direttore,Dipartimento,DataInizioDirezione) Questo sempre per evitare valori nulli negli attributi relativi allassociazione. Lo svantaggio è avere una tabella in più, quindi questa soluzione conviene solo se le entità partecipano poco allassociazione, in tal caso infatti sarebbero molti i valori nulli e quindi è meglio avere una tabella distinta per lassociazione, altrimenti lassociazione può essere inglobata sullentità che partecipa di più (per ridurre il numero dei valori nulli).

50 Traduzione – 13 Schema Riassuntivo delle traduzioni

51 Traduzione – 14 Schema Riassuntivo delle traduzioni

52 Il risultato della progettazione logica è linsieme di schema logico (elenco tabelle), vincoli di integrità (che si accompagnano alle tabelle), e della documentazione. I vincoli di integrità possono essere rappresentati in maniera grafica: Traduzione – 15

53 Esempio di progettazione logica - 1

54 Elenco delle operazioni: Operazione 1 :inserisci un nuovo partecipante con dati. Operazione 2 :assegna partecipante a corso. Operazione 3 :inserisci docente con dati e corsi che puo insegnare. Operazione 4 :assegna un docente abilitato ad unedizione di corso. Operazione 5 :stampa informazioni su edizioni correnti di un corso con titolo,orari lezioni e numero partecipanti. Operazione 6 :stampa tutti i corsi offerti con informazioni sui docenti che possono insegnarli. Operazione 7 :per ogni docente trova i partecipanti a tutti i corsi da lui insegnati. Operazione 8 :effettua una statistica su tutti i partecipanti ad un corso con tutte le informazioni su di essi, sulledizione alla quale hanno partecipato e la relativa votazione. Esempio di progettazione logica - 2

55 Ristrutturazione: Analisi delle Ridondanze Eliminazione delle gerarchie Partizionamento/Accorpamento Scelta degli identificatori Traduzione verso il Relazionale Esempio di progettazione logica - 3

56 Esempio di progettazione logica - 4

57 Esempio di progettazione logica - 5

58 Analisi delle ridondanze: Numero di Partecipanti in Edizione Corso puo essere derivato dallassociazione Partecipazione Attuale. Questo richiede 4* = bytes Le operazioni che coinvolgono Numero di Partecipanti sono 2,5 e 8 (trascurabile perchenon frequente e batch) Esempio di progettazione logica - 6

59 Analisi delle ridondanze: Con Ridondanza: per loperazione 2 si hanno 2*50 = 100 accessi in lettura ed altrettanti in scrittura (che valgono doppio) al giorno, mentre per la 5, 19*10 = 190 in lettura al giorno per un totale di 490 accessi in lettura. Senza Ridondanza: per loperazione 2 si hanno 50 accessi in lettura ed altrettanti in scrittura al giorno, mentre per la 5, 29*10 = 290 in lettura al giorno per un totale di 440 accessi in lettura. Quindi si elimina la ridondanza. Esempio di progettazione logica – 7

60 Eliminazione delle gerarchie: Docenti: le operazioni che li riguardano (3,6 e 7) non fanno riferimento al fatto che sia Collaboratore o Dipendente quindi si accorpano i figli nel padre Partecipanti: le operazioni che li riguardano (1, 8) non fanno distinzioni tra professionisti e dipendenti (pubblici o privati). Tuttavia dalla tavola dei volumi risulta che la maggior parte dei partecipanti sono dipendenti privati e che gli altri due tipi hanno attributi propri. Quindi per risparmiare memoria e opportuno: 1) Eliminare Dipendente Privato aggiungendo un attributo Privato a Partecipante 2) Lasciare le due entita Dipendente Pubblico e Professionista aggiungendo due associazioni uno-ad-uno con Partecipante. Cosi si evita di avere attributi nulli su Partecipante. Esempio di progettazione logica - 8

61 Partizionamento/Accorpamento: Edizione di Corso: loperazione 5 riguarda solo le edizioni attuali;Docenza Attuale e Partecipazione Attuale fanno riferimento solo a queste edizioni. Quindi si potrebbe pensare di partizionare orizzontalmente in edizioni attuali e passate.Tuttavia le associazioni Composizione e Tipologia andrebbero duplicate e le operazioni 7 ed 8 che non fanno distinzione fra le varie edizioni risulterebbero piu costose (raddoppio delle entita).Quindi non partizioniamo. Docenza Passata e Docenza Attuale, Partecipazione Passata e Partecipazione Attuale: le operazioni 7 ed 8 non fanno differenza. Inoltre non e necessario, quando termina unedizione di corso, trasferire le occorrenze di unassociazione (attuale) allaltra (passata). Per laccorpamento delle partecipazioni ce solo linconveniente che Votazione si applica solo alle passate e provoca valori nulli. Tuttavia la tabella dei volumi ci dice che sprechiamo solo 4*500 bytes = 2Kbytes. Decidiamo di accorpare le due relazioni. Esempio di progettazione logica - 9

62 Scelta degli identificatori: Solo Partecipante ha due identificatori:codice fiscale e codice interno. Scegliamo il secondo perche richiede solo 3 byte(deve distinguere 5000 elementi) invece che 16. Osserviamo (pragmaticamente) che Edizione Corso e identificata da Data Inizio e dallentita Corso. Questo pesante identificatore deve essere usato per realizzare due associazioni (Partecipazione e Docenza) con molte occorrenze. Tuttavia ogni corso ha un codice e che in media il numero di sue edizioni e 5. Quindi basta aggiungere una cifra al codice di un corso per avere anche ledizione. Quindi definiamo un nuovo identificatore per Edizione Corso che sostituisce quello esterno. Eliminiamo infine lattributo multivalore Telefono dallentita Docente introducendo unopportuna relazione (Interesse) Esempio di progettazione logica - 10

63 Esempio di progettazione logica - 11

64 Schema logico (elenco tabelle): Edizione(Codice,DataInizio,DataFine,CodCorso) Lezione (Ora,Aula,Giorno,CodEdCorso) Docente(CF,Cognome,Eta,CittaNascita,Tipo) Telefono (Numero,CFDocente) Corso(Codice,Nome) Docenza (CodEdCorso,CFDocente) Abilitazione (CodCorso,CFDocente) Partecipante (Codice,CF,Cognome,Eta,CittaNascita,Sesso,Societa) Societa(Nome,Telefono,Indirizzo) Dipendenza (CodPartecipante,NomeSocieta) Professionisti (CodPartecipante,Area,Titolo) DipPubblici (CodPartecipante,Livello,Posizione) Esempio di progettazione logica – 12


Scaricare ppt "Basi di Dati prof. A. Longheu 6 – Progettazione Logica Cap. 7 Basi di dati Atzeni – Ceri – Paraboschi - Torlone."

Presentazioni simili


Annunci Google