Introduzione ai database relazionali

Slides:



Advertisements
Presentazioni simili
Modulo 5 DataBase ACCESS.
Advertisements

La modellizzazione dei dati
Informatica II – Basi di Dati (08/09) – Parte 1
Corso di Laurea in Biotecnologie Informatica (Basi di Dati)
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
Valutazione d’Istituto A.S. 2008/2009
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
Progettazione concettuale
Normalizzazione Forme Normali.
Una Introduzione alle Basi di Dati
Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw-Hill,
Archivio Cé necessità di immagazzinare in modo permanente grandi quantità di dati. Esempio: anagrafe dei cittadini di un comune.
L’uso dei database in azienda
1 I SISTEMI INFORMATIVI Luso dei DATABASE in azienda Giovedì, 22 aprile 2004Alessandro Capodaglio.
La Normalizzazione. 27 January, slide 2 Le nuove tecnologie Software Tabelle, unicità e chiavi Ciascuna riga di una tabella deve esere unica Ci.
Canale A. Prof.Ciapetti AA2003/04
Corso di Informatica (Basi di Dati)
Basi di dati. Vantaggi degli archivi digitali Risparmio di spazio: sono facilmente trasferibili e duplicabili Risparmio di tempo: si può accedere ai dati.
Basi di dati Università Degli Studi Parthenope di Napoli
Cos’è un problema?.
Gli italiani e il marketing di relazione: promozioni, direct marketing, digital marketing UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER ASSOCOMUNICAZIONE.
Progettazione di una base di dati
Normalizzazione Le forme normali certificano che la base di dati soddisfa criteri di qualità che mirano ad evitare le ridondanze e i conseguenti effetti.
Introduzione alle basi di dati
CHARGE PUMP Principio di Funzionamento
Implementare un modello di dati
Q UESTIONI ETICHE E BIOETICHE DELLA DIFESA DELLA VITA NELL AGIRE SANITARIO 1 Casa di Cura Villa San Giuseppe Ascoli Piceno 12 e 13 dicembre 2011.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
TECNOLOGIE DELLINFORMAZIONE E DELLA COMUNICAZIONE PER LE AZIENDE Materiale di supporto alla didattica.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
Il modello ER Proposto da Peter Chen nel 1976 rappresenta uno standard per la progettazione concettuale (in particolare per le basi di dati) Ha una rappresentazione.
Progettare un database
Dottorato di ricerca Nuove Tecnologie e Informazione Territorio – Ambiente Nozioni fondamentali di Basi di Dati Seminario interno.
Introduzione a Oracle 9i
LE BASI DI DATI E IL LINGUAGGIO SQL.
Un trucchetto di Moltiplicazione per il calcolo mentale
Sistemi di Elaborazione delle Informazioni Mod.I.
GLI OBIETTIVI DELLA RICERCA
La Normalizzazione. 2 May, slide 2 Le nuove tecnologie Software Normalizzazione Normalizzazione è il processo di semplificazione di un data base.
Introduzione alle basi di dati
Esempi risolti mediante immagini (e con excel)
Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw-Hill,
DATABASE Introduzione
MODELLO E/R.
DB- Sistemi Informativi
NO WASTE Progetto continuità scuola primaria scuola secondaria Salorno a.s. 2013_
ITCG “V. De Franchis” - PON FSE Modulo G/1 l’informatica”
Modulo 5 DataBase ACCESS. Informazioni e Dati INFORMAZIONI vengono scambiate con linguaggio scritto o parlato DATI rappresentazione di informazioni in.
Modulo 5 - Database. Contenuti della lezione 5.1.1Concetti Fondamentali 5.1.2Organizzazione di un Database 5.1.3Relazioni 5.2.1Lavorare con i database.
Modellazione dei Dati Fabio Scanu a.s. 2012/2013.
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
I DBMS BASI DI DATI (DATABASE) Insieme organizzato di dati utilizzati
Informatica Introduzione alle basi di dati Lezione 2 Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
Basi di dati Maria Laura Alessandroni
Microsoft Access Chiavi, struttura delle tabelle.
Progettazione di una base di dati Ciclo di vita di un sistema informativo Studio di fattibilità definisce le varie alternative possibili, i relativi costi.
Basi di dati e Relazioni Uno schema di relazione R(X) è costituito da un simbolo (nome della relazione) R e da una serie di attributi X={A 1, A 2, …, A.
Eprogram informatica V anno.
Cloud informatica V anno.
MODELLO E/R.
NORMALIZZAZIONE ESERCIZI. INTRODUZIONE La modellazione E-R ci ha consentito di descrivere schemi relazionali Lo strumento base per la modellizzazione.
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
Le basi di dati.
1. CASO BIBLIOTECA ANALISI DEI REQUISITI Si vuole automatizzare la gestione prestiti dei libri di una biblioteca personale. La progettazione deve tener.
Normalizzazione. Introduzione Nell’organizzazione tradizionale degli archivi, si verificano alcuni problemi, quali: Ridondanza dei dati (gli stessi dati.
1 “ Le Basi di Dati ”. 2 Parte 5: Tabelle –Creazione di una tabella –Indici e chiavi primarie –Relazioni e integrità referenziale Basi di Dati Struttura.
Il modello relazionale. Modello Relazionale 2 Dal modello concettuale a quello logico Una volta stabilita la rappresentazione concettuale della realtà.
Modulo 5 – Database ACCESS LICEO SCIENTIFICO “ B. RESCIGNO COMPUTER SCUOLA PIANO INTEGRATO 2008/09 ESPERTO prof.ssa Rita Montella.
I DONEITÀ DI C ONOSCENZE E C OMPETENZE I NFORMATICHE ( A – D ) Un database è un insieme di record (registrazioni) e di file (archivi) organizzati per uno.
Transcript della presentazione:

Introduzione ai database relazionali

COS’E’ UN SISTEMA INFORMATIVO? Un sistema informativo organizza e gestisce tutte le informazioni necessarie per eseguire gli scopi di una organizzazione

SISTEMA INFORMATICO SISTEMA INFORMATIVO SISTEMA INFORMATICO Quando viene automatizzato tramite strumenti elettronici diventa un SISTEMA INFORMATICO

Dati e informazioni Un sistema informativo/informatico presenta 2 nozioni fondamentali che è bene distinguere: il concetto di dato e di informazione

Dato ed informazione Dato: valore in sé (un numero, una data, una frase) Informazione: conoscenza dei fatti, significato del dato, associazione tra uno o più dati.

Dato ed informazione I dati da soli potrebbero non avere alcun significato, e generalmente non forniscono informazione I dati assumono un significato quando vengono interpretati in un contesto e/o correlati in maniera opportuna

Sicuramente rappresenta un giorno, ma di per sé non significa nulla. ESEMPIO: UN DATO 08/05/2013 Che informazione ci da? Sicuramente rappresenta un giorno, ma di per sé non significa nulla. Ma associando a tale dato un contesto che gli dà significato questo diventa una informazione

ESEMPIO: UNA INFORMAZIONE Data inizio lezioni studenti 12/09/2013 Il dato diventa una informazione

ESEMPIO: UN DATO MANZONI ALESSANDRO Che informazione ci da?

CONTESTO: ASSOCIAZIONE DI 2 DATI MANZONI ALESSANDRO I PROMESSI SPOSI Il dato messo in un certo contesto assume un certo significato

CONTESTO: Manzoni Alessandro Residente in Piazza Europa 26, 10110 Torino Lo stesso dato in un contesto diverso assume un significato diverso

FORMALMENTE Significato Dato: Cosa rappresenta il dato memorizzato un valore registrato su un supporto di memoria INFORMAZIONE Associazione tra dato e suo significato

I DATI E LE LORO CORRELAZIONI FORNISCONO INFORMAZIONI Informazione 2 Dato8 Dato7 Informazione 1 Dato1 Dato2 Dato3

Cos’è una BASE DI DATI (DATABASE)? E’ una raccolta organizzata di informazioni. Una collezione di dati opportunemente raggruppati ed organizzati in modo da poter rappresentare le informazioni di interesse

Cos’è una BASE DI DATI (DATABASE)? E’ un modello del mondo reale (una rappresentazione informatica della realtà di interesse) E’ un modello del mondo reale che permette l’utilizzo dei dati a utenti diversi con applicazioni diverse e di convertirli in informazioni utilizzabili

DATABASE - DBMS La sigla DBMS (Data Base Management System) indica il software utilizzato per la gestione di un database I programmi per la realizzazione di database (come ACCESS) esistono per permettere la catalogazione, la modifica e la facile estrazione delle informazioni

OBIETTIVI DI UN DATABASE Consistenza: i dati in essa contenuti devono essere significativi ed essere effettivamente utilizzabili nelle applicazioni dell'azienda Sicurezza: impedire che il data base venga danneggiato da interventi accidentali o non autorizzati Integrità: garantire che le operazioni effettuate sul data base da utenti autorizzati non provochino una perdita di consistenza ai dati

DATABASE DISTRIBUITI Gli archivi che compongono una base di dati possono risiedere sulle memorie di massa di computer diversi, facenti parte di una rete aziendale, i cui nodi possono essere anche fisicamente lontani Quando si verifica questo siamo di fronte ad un database distribuito In tal caso gli archivi sono integrati da un punto di vista logico

DATABASE DISTRIBUITI - VANTAGGI è possibile gestire archivi di dimensioni limitate laddove vengono creati facilitano il lavoro di manutenzione si può effettuare maggior controllo sulla sicurezza si può garantire comunque la disponibilità dei dati aggiornati a tutti gli utenti del sistema informativo aziendale, qualunque sia la loro posizione geografica o il computer da essi usato per l’attività di elaborazione

ORGANIZZAZIONE DEI DATI L’organizzazione dei dati è un aspetto di fondamentale importanza. Aver organizzato i dati in maniera corretta evita di doverli riorganizzare successivamente con grave dispendio di risorse. Un database ben strutturato consente di avere una organizzazione INTEGRATA dei dati.

ESEMPIO DI APPROCCIO TRADIZIONALE NON INTEGRATO Un'azienda utilizza in uffici diversi due diversi archivi A e B A) Informazioni sui dipendenti che lavorano nei reparti di un’azienda Matricola# Nome Età Reparto Badget …. B) Informazioni sui dipendenti per i diversi progetti Dipendente# Nome Progetto# Nome Progetto Tempo % …. Ognuno dei due modelli soddisfa le esigenze specifiche. Ma cosa succede se vogliamo sapere quali sono i reparti che hanno dipendenti che lavorano al progetto X ?

ESEMPIO DI APPROCCIO TRADIZIONALE NON INTEGRATO Matricola# Nome Età Reparto Badget …. B Dipendente# Nome Progetto# Nome Progetto Tempo % …. Difetti nella gestione non integrata: Sinonimi: gli stessi dati hanno codici differenti (Matricola# in A e Dipendente# in B) Lo stesso nome per dati differenti: Nome in A per dipendente e Nome in B per Dipendente Ridondanza dei dati: Reparto e Budget del reparto ripetuto per ogni dipendente; Progetto# e Nome Progetto ripetuti per ogni dipendente Rischio di anomalie negli aggiornamenti: una modifica effettuata sui valori dei dati in un archivio, ma non nell’altro, provoca inconsistenza dei dati

Difetti nella organizzazione non integrata dei dati Ridondanza dei dati, cioè gli stessi dati compaiono in maniera duplicata (inefficienza) La ridondanza può portare all’incongruenza, nel caso in cui un dato venga aggiornato in un archivio e non in un altro, oppure siano presenti valori diversi per lo stesso dato L’incongruenza porta all’inconsistenza dei dati, cioè i dati aziendali non sono più affidabili, perché non si sa in modo certo quale dei diversi valori sia quello corretto Tutto ciò deriva dal fatto che i dati sono organizzati in archivi diversi, in modo non integrato tra loro

VANTAGGI DI UNA CORRETTA LOGICA NEI DATABASE Indipendenza delle applicazioni dalla struttura fisica dei dati Indipendenza delle applicazioni dalla struttura logica dei dati Utilizzo da parte di più utenti con applicazioni diverse Facilità di accesso Eliminazione della ridondanza Eliminazione della inconsistenza Integrità dei dati Sicurezza dei dati

VANTAGGI DEI DATABASE Il vero vantaggio di un database sono le operazioni sui dati organizzati manipolazione o trattamento dei dati, cioè la possibilità di inserire, modificare e cancellare i dati interrogazione, cioè la possibilità di ritrovare i dati, richiesti da un’applicazione, in modo semplice e veloce

Come costruire un database REALTA’ (Problema reale) DATABASE LOGICO Entità (tabelle) Associazioni (interconnessioni tra le tabelle) ANALISI REALIZZAZIONE FISICA DEL DATABASE (Access: tabelle, relazioni, query, maschere, report, ecc.) IMPLEMENTAZIONE

Passi da seguire per la costruzione di DBMS DATABASE LOGICO MODELLO LOGICO CONCETTUALE Si rappresenta la realtà dei dati e le associazioni tra essi attraverso uno schema Si definisce l’organizzazione, la composizione ed il formato dei dati negli archivi elettronici REALTA’ Progettazione MODELLO FISICO Realizzazione fisica del DBMS (ad es. in Access) Implementazione

Il livello concettuale: il metodo relazionale modello entità/associazioni Il modello entità/associazioni (in inglese E/R = Entity/Relationship), introdotto nel 1976 da Peter P. Chen, permette di costruire un modello concettuale dei dati indipendente dalle applicazioni Gli elementi di un modello E/R sono: Entità e attributi Associazioni

MODELLO RELAZIONALE I dati vengono catalogati in tabelle dette Entità Le Entità vengono correlate tramite Associazioni (Relazioni) Le proprietà di entità e associazioni vengono descritte tramite gli Attributi

ENTITA’ Cos’è? Cioè un oggetto che E’ una qualsiasi cosa che può essere distintamente identificata Cioè un oggetto che Ha una propria individualità (sia distinguibile concettualmente da altri oggetti) Abbia per noi rilevanza

ENTITA’ – istanze (individui) L’entità è un oggetto (concreto o astratto) utile per descrivere la realtà che si vuole rappresentare Ad esempio una persona, un modello di automobile, un movimento contabile, una prova sostenuta da uno studente, possono essere considerate entità Infatti gli studenti sono classificabili nel tipo entità Studente, i diversi modelli di automobile sono classificabili nel tipo entità Automobile Ciascuno studente rappresenta un’istanza (un individuo) del tipo entità Studente, ciascuna automobile rappresenta un’istanza (un individuo) del tipo entità Automobile

ASSOCIAZIONE (Relazione) Cos’è? L’associazione (in inglese relationship) è un legame che stabilisce un’interazione tra le entità Per esempio tra l’entità Persona e l’entità Automobile esiste un’associazione che può essere descritta nel linguaggio naturale secondo due versi: una persona possiede una o più automobili e un’automobile è posseduta da una persona Quindi si può dire che tra l’entità Persona e l’entità Automobile esiste l’associazione Possiede; tra l’entità Automobile e l’entità Persona esiste l’associazione Posseduta da.

ATTRIBUTI Cos’è? Un attributo è una proprietà di una entità o di una associazione Rimanendo all’esempio precedente delle autovetture, per l’entità automobile possiamo avere i seguenti attributi: Modello, Produttore, Cilindrata, PrezzoListino. Notare che Modello e Produttore potrebbero essere individuate come Entità e non come attributi e ciò dipenderà esclusivamente da ciò che si deve fare, cioè dalla nostra analisi della realtà.

ATTRIBUTI Le caratteristiche di ogni attributo sono: Il formato cioè il tipo di valori che può assumere; per esempio: il tipo carattere, numerico o data/ora La dimensione cioè la quantità massima di caratteri o cifre che possono essere inseriti L'opzionalità cioè la possibilità di non essere sempre valorizzato: l’attributo è obbligatorio se deve avere valore non nullo, facoltativo se sono accettabili valori nulli

ATTRIBUTI Valore Nullo: Il valore nullo, in inglese Null, (da non confondere con la stringa di caratteri blank o con un numero di valore zero) rappresenta un’informazione mancante, inapplicabile o sconosciuta Dominio: I diversi valori assunti dagli attributi determinano le diverse istanze dell’entità. L'insieme dei possibili valori assunti da un attributo si chiama dominio dell'attributo Chiave: Si indica con il termine chiave o chiave primaria (primary key) l'insieme di uno o più attributi che consentono di distinguere un’istanza dall'altra: esempi di chiavi sono il codice di un prodotto o la matricola di un dipendente

MODELLO LOGICO Entità Associazione / Relazione Attributi (campi) Tipi di dato Chiave primaria Associazione / Relazione 1 a 1 1 a N N a M

Rappresentazione grafica. Schema E/R La rappresentazione classica ERD = Entity-Relationship Diagram Entità: si rappresenta con un rettangolo contenente all'interno il nome dell'entità Associazione: è rappresentata da una linea, che unisce le due entità interessate Versi dell’associazione: la descrizione compare a fianco della linea e dell’entità di partenza del verso si compone degli STUDENTE CLASSE Fa parte della

Rappresentazione grafica. Schema E/R La rappresentazione classica ERD = Entity-Relationship Diagram Attributi Individuazione della chiave STUDENTE Codice studente Cognome Nome . . . .

ESEMPIO: REALTA’: SCUOLA Istruzione superiore Vogliamo catalogare le anagrafiche di una scuola QUALI POTREBBERO ESSERE LE NOSTRE ENTITA’?

ENTITA’ STUDENTI INSEGNANTI CLASSI

ATTRIBUTI Sono le caratteristiche di una entità che desideriamo conservare, catalogare. Sono le proprietà che caratterizzano una entità o anche una associazione

ESEMPIO SCUOLA STUDENTI INSEGNANTI CLASSI Cognome Cognome Nome Nome Indirizzo Cap Città Provincia Telefono Data nascita Luogo nascita …. INSEGNANTI Cognome Nome Indirizzo Cap Città Provincia Telefono Materia CLASSI Nome classe Aula

TABELLE  ENTITA’ Una entità è per noi una tabella dove le righe sono le istanze, gli individui (i record) dell’entità e le colonne sono gli Attributi ENTITA’ Attributo (campo) Nome Cognome Data nascita Luogo Nascita Mario Rossi 02/04/1975 Milano Francesca Verdi 24/11/1974 Prato Alberto Bianchi 14/12/1974 Roma … Record

TIPO DI DATO Ogni attributo deve avere un tipo di dato definito. Ovvero ogni colonna della tabella deve avere valori dello stesso tipo NOME DESCRIZIONE ACCESS Byte Intero da 0 a 255 Numerico  Byte Smallint Intero da -32.768 a 32.768 Numerico  Intero Integer Intero da -2.147.483.648 a 2.147.483.647 Numerico  Intero lungo Numerico  Contatore Float Numero reale Numerico  Precisione singola Numerico  Precisione doppia Numerico  Valuta Datetime Data/ora Data/Ora Char Testo fino a 255 caratteri Testo Memo Testo esteso fino a più di 64.000 caratteri Boolean True e false Si/No

CHIAVE PRIMARIA Una chiave primaria è la colonna (o l’insieme di più colonne) che definisce un individuo (una riga) di una entità (tabella) in modo univoco.

CHIAVE PRIMARIA Alcune entità (poche) hanno una chiave primaria naturale altre hanno bisogno di una chiave artificiale (il “codice”) Addirittura per catalogare una persona si ha bisogno del “Codice Fiscale” che non è nient’altro che un attributo artificiale UNIVOCO che garantisce che la persona sia individuata in maniera univoca

Procedendo con l’analisi Una volta individuate entità, attributi, chiavi primarie si deve procedere con l’individuare le ASSOCIAZIONI (RELAZIONI) che intercorrono tra le varie entità.

ASSOCIAZIONI Un’associazione tra le entità può essere: obbligatoria quando il legame tra le entità deve essere sempre presente opzionale quando può essere presente

ASSOCIAZIONI Il grado del verso dell'associazione indica quante istanze dell'entità di arrivo si associano all'istanza dell'entità di partenza. Il grado può essere: 1 a 1 Biunivoca 1 a N Uno a molti N a M Molti a molti

ASSOCIAZIONE 1 a 1 Associazione 1:1 (uno a uno) o biunivoca Ogni istanza (ogni individuo) della prima entità si deve associare ad una sola istanza (ad un solo individuo) della seconda entità e viceversa.

ASSOCIAZIONE 1 a 1 Ad un elemento di una entità corrisponde uno ed un solo elemento della seconda entità Anagrafica Codice persona Nome Cognome Indirizzo Cap Città Provincia Telefono Cellulare Email Nascita Codice persona Data nascita Luogo nascita Provincia Nome padre Cognome padre Nome madre Cognome madre 1 1

ASSOCIAZIONE 1 a N Associazione 1:N (uno a molti) o semplice Ogni istanza (individuo) della prima entità si può associare a una o più istanze (individui) della seconda entità, mentre ogni istanza della seconda entità si deve associare ad una sola istanza della prima.

ASSOCIAZIONE 1 a N Supponiamo di voler catalogare gli impiegati della nostra azienda con eventuali figli a carico. Nella nostra analisi dobbiamo individuare le entità per questa realtà. L’entità che individuiamo immediatamente è la tabella “Impiegati”. Impiegati Codice impiegato Nome Cognome …….

Impiegati + figli a carico L’entità impiegato in formato tabellare Codice impiegato Nome Cognome Come fare a catalogare i figli a carico?

Soluzione ERRATA Codice impiegato Nome Cognome … Figlio 1 Figlio 2 Figlio 3 Cosa succede se un impiegato ha più figli di quanto previsto? Quanto è abbastanza? 3? 5? 20? Anche se prevediamo 20 figli, nel caso della media 1/2/3 figli tutti gli altri campi rimarranno vuoti: abbiamo spreco di spazio Come fare per esempio a trovare tutti i figli di nome Michele? Su quale campo cercare? Figlio 1? Figlio 2? …. Figlio 20? Come fare se in un futuro vogliamo aggiungere ulteriori informazioni riguardanti i figli?

Soluzione IMPIEGATI FIGLI A CARICO C’è un errore di analisi: i figli a carico vanno visti come Entità separata e non come attributi dell’entità impiegati. IMPIEGATI 1 N FIGLI A CARICO La relazione che esiste tra gli impiegati ed i figli a carico è di tipo 1 a N 1 impiegato può avere N Figli a carico 1 IMPIEGATO  N FIGLI 1 figlio a carico può avere un solo padre che è impiegato e che lo tiene a carico 1 FIGLIO A CARICO  1 IMPIEGATO

ASSOCIAZIONE N a M Associazione N:M (molti a molti) o complessa Ogni istanza (individuo) della prima entità si può associare a una o più istanze (individui) della seconda entità e viceversa

ASSOCIAZIONE N a M Entità: Libri e Autori N M LIBRI AUTORI Codice libro Titolo Sottotitolo Descrizione Anno pubblicazione Codice casa editrice AUTORI Codice autore Nome Cognome Email N M 1 Autore  N Libri (Un Autore può scrivere più libri) 1 Libro  N Autori (Un libro può anche essere scritto da più autori)

ASSOCIAZIONE N a M Entità: Studenti universitari ed esami sostenuti N Matricola Nome Cognome …… ESAMI Codice esame Nome ….. 1 Studente  N Esami (Uno Studente può avere sostenuto più esami) 1 Esame  N Studenti (Un esame può essere stato effettuato da più studenti)

CHIAVI, ATTRIBUTI E RELAZIONI Come si realizza una associazione 1 a 1 ? 1 1 Tabella 1 Tabella 2 La chiave primaria della Tabella 1 è uguale alla chiave primaria della tabella 2

Esempio Relazione 1 a 1 (con l’asterisco indichiamo i campi che sono in chiave primaria) Anagrafica Codice persona * Cognome Nome Indirizzo Cap Città Provincia Telefono Cellulare Email Nascita Codice persona * Data nascita Luogo nascita Provincia Nome padre Cognome padre Nome madre Cognome madre 1 1

Esempio Relazione 1 a 1 Le chiavi primarie delle due tabelle sono uguali Cod. persona Cognome Nome Indirizzo 1242 Rossi Franco Via Leopardi … 1318 Verdi Alberto Largo Umberto … 1 Cod. persona Data Nascita Luogo Nascita 1242 23/07/1961 Milano 1318 12/10/1980 Roma 1

Relazione 1 a N Come si realizza una associazione 1 a N? 1 N Tabella 1 ESISTONO 2 MODI La chiave primaria della tabella 1 (padre) è contenuta nella chiave primaria della tabella 2 (figlia) La chiave primaria della tabella 1 (padre) è un attributo della tabella 2 (figlia)

1 a N (Padre – Figlio) La chiave primaria della tabella 2 (figlia) contiene la chiave primaria della tabella 1 (padre) IMPIEGATI Codice impiegato * Cognome Nome ….. FIGLI A CARICO Codice impiegato * Codice figlio * Nome Cognome …. 1 N

1 a N (Lookup) La chiave primaria della tabella 1 (padre) è un attributo della tabella 2 (figlia) CASE EDITRICI Codice casa editrice * Ragione sociale Indirizzo Cap Città Telefono Fax Provincia URL Email 1 LIBRI Codice libro * Titolo Sottotitolo Descrizione Anno pubblicazione Codice casa editrice N

Relazione N a M Come si realizza una associazione N a M? N M Tabella 1 Tramite una tabella aggiuntiva e 2 relazioni 1 a N

Relazione N a M N M AUTORI Codice autore * Nome Cognome Email ….. LIBRI Codice libro * Titolo Sottotitolo Descrizione Anno pubblicazione Codice casa editrice N M

Relazione N a M La relazione N ad M viene spezzata tramite 2 relazioni 1 a N AUTORI Codice autore * Nome Cognome Email ….. 1 1 LIBRI Codice libro * Titolo Sottotitolo Descrizione Anno pubblicazione Codice casa editrice N N LIBRI AUTORI Codice libro * Codice autore *

NORMALIZZAZIONE Una volta creata una prima bozza di uno schema logico relazionale, è necessario effettuare una serie di verifiche sulla correttezza del procedimento svolto. Queste potranno portare a modificare la struttura dello schema al fine di renderlo corretto ed evitare il verificarsi, nella gestione dei dati, di errori difficilmente ovviabili a posteriori. Tale processo è detto normalizzazione ed è effettuabile mediante procedimenti di tipo algebrico matematico, basati sul concetto di dipendenza funzionale. Vediamone in maniera informale le regole principali.

NORMALIZZAZIONE È un processo con il quale le tabelle vengono trasformate in altre tabelle in modo che ognuna di esse corrisponda a un singolo oggetto della realtà rappresentata Le regole della normalizzazione sono definite per evitare inconsistenza dei dati e anomalie nelle operazioni di aggiornamento

NORMALIZZAZIONE Uno schema logico concettuale può definirsi “corretto” se rispetta: Prima forma normale Seconda forma normale Terza forma normale

DEFINIZIONI Chiave (chiave primaria): l'insieme di uno o più attributi che identificano in modo univoco una n-upla (riga della tabella) Attributo non-chiave: un campo che non fa parte della chiave primaria Dipendenza funzionale tra attributi: il valore di un attributo A1 determina un singolo valore dell'attributo A2 (in simboli A1 è A2) Dipendenza transitiva: un attributo A2 dipende da A1 e l'attributo A3 dipende da A2; allora A3 dipende transitivamente da A1 se A1  A2 e A2 A3 allora A1  A3 in modo transitivo

Prima forma normale 1FN Requisiti della Prima forma normale tutte le righe della tabella contengono lo stesso numero di colonne gli attributi rappresentano informazioni elementari i valori che compaiono in una colonna appartengono allo stesso dominio ogni riga è diversa da tutte le altre l’ordine con il quale le righe compaiono nella tabella è irrilevante In particolare gli attributi devono essere informazioni non ulteriormente scomponibili, cioè non devono avere sottoattributi, né essere gruppi di attributi ripetuti.

Prima forma normale 1FN La prima forma normale stabilisce che in una tabella non possono esistere colonne definite per contenere una molteplicità di valori. Una tabella quindi non può contenere una struttura vettoriale (array), al contrario di quanto consentito in linguaggi di programmazione come il Pascal, il C. Le tabelle che contengano una colonna non rispondente a questa condizione vanno trasformate, creando per ciascuna riga della tabella di partenza tante righe quanti sono i valori multipli presenti nella colonna considerata

Esempio 1FN IMPIEGATI Cod. impiegato Cognome Nome Data nascita Figli a carico 001242 Rossi Franco 09/11/1961 Marco Giuseppe Sandra 001318 Verdi Alberto 24/04/1963 Sonia Claudio Una tabella di questo genere NON è in Prima forma normale in quanto l’attributo figli a carico contiene più valori.

Esempio 1FN Con un processo di normalizzazione la tabella deve essere trasformata in 2 tabelle Cod. impiegato Cognome Nome Data nascita 001242 Rossi Franco 09/11/1961 001318 Verdi Alberto 24/04/1963 1 Cod. impiegato Cod. Figlio Nome 001242 01 Marco 02 Giuseppe 03 Sandra 001318 Sonia Claudio N

Seconda forma normale 2FN Requisiti della Seconda forma normale E’ in prima forma normale tutti i suoi attributi non-chiave dipendono dall’intera chiave, cioè non possiede attributi che dipendono soltanto da una parte della chiave La seconda forma normale elimina la dipendenza parziale degli attributi dalla chiave. Esempio: La Tabella T1(A1,A2,A3,A4,A5) con (A1, A2)  A3 A1  A4 A2  A5 non è in 2FN, e può essere normalizzata in 2FN con le tabelle: T2(A1,A2,A3) T3(A1,A4) T4(A2,A5)

Seconda forma normale 2FN La seconda forma normale riguarda quindi le tabelle in cui la chiave primaria sia composta da più attributi e stabilisce che, in questo caso, tutte le colonne corrispondenti agli altri attributi dipendano dall’intera chiave primaria. ESEMPIO: Inventario CodArticolo CodMagazzino DescArticolo Quantità IndirizzoMagazzino Chiave primaria: Codarticolo + CodMagazzino

Esempio 2FN Inventario Chiave primaria CodArticolo + CodMagazzino CodArticolo CodMagazzino DescArticolo Quantità IndirizzoMagazzino Chiave primaria CodArticolo + CodMagazzino Dipendenze funzionali (CodArticolo, CodMagazzino)  Quantità CodMagazzino  IndirizzoMagazzino CodArticolo  DescArticolo Si ha dipendenza parziale dalla chiave: NON E’ in 2FN

Esempio 2FN Inventario CodArticolo CodMagazzino DescArticolo Quantità IndirizzoMagazzino Problemi indirizzo del magazzino ripetuto per ogni prodotto (ridondanza) Descrizione dell’articolo ripetuto per ogni magazzino (ridondanza) se cambia l’indirizzo magazzino, occorre modificare molte righe con errori nell’aggiornamento si avrebbero indirizzi diversi per lo stesso magazzino o descrizioni diverse per lo stesso articolo(inconsistenza) se non ci sono prodotti in un magazzino, non si può conoscere il suo indirizzo o la descrizione dell’articolo se l’articolo non è presente in nessun magazzino, non si può conoscere la sua descrizione esatta

Esempio 2FN Inventario Magazzino Articolo Inventario CodArticolo CodMagazzino DescArticolo Quantità IndirizzoMagazzino Soluzione: mettere in 2FN Articolo Magazzino CodArticolo DescArticolo CodMagazzino IndirizzoMagazzino 1 1 N N Inventario CodArticolo CodMagazzino Quantità

Terza forma normale 3FN Requisiti della Terza forma normale E’ in Seconda forma normale tutti gli attributi non-chiave dipendono direttamente dalla chiave, cioè non possiede attributi che dipendono da altri attributi che non sono in chiave La terza forma normale elimina la dipendenza transitiva degli attributi dalla chiave. Esempio: La Tabella T1(A1,A2,A3,A4) con A2  A4 non è in 3FN, e può essere normalizzata in 3FN con le tabelle: T2(A1,A2,A3) T3(A2,A4)

Terza forma normale 3FN La terza forma normale stabilisce che non esistano dipendenze tra le colonne di una tabella se non basate sulla chiave primaria. ESEMPIO: Impiegati CodImpiegato Nome Reparto TelefonoReparto Chiave primaria CodImpiagato Dipendenze funzionali CodImpiegato  Reparto Reparto  TelefonoReparto

Esempio 3FN Impiegato Impiegato Reparto CodImpiegato Nome Reparto TelefonoReparto Problemi telefono del Reparto ripetuto per ogni Impiegato di quel Reparto (ridondanza) se il telefono cambia, occorre modificare molte righe con errori di aggiornamento, si avrebbero telefoni differenti se un Reparto non ha impiegati, non si può conoscere il suo telefono Soluzione: mettere in 3FN Impiegato Reparto CodImpiegato Nome Reparto Reparto TelefonoReparto

RIASSUMENDO Con la normalizzazione: la tabella iniziale viene scomposta in più tabelle complessivamente forniscono le stesse informazioni di partenza mantengono le dipendenze tra gli attributi in ciascuna di esse ogni attributo dipende direttamente dalla chiave vengono evitati problemi di ridondanza e di inconsistenza dei dati non ci deve essere perdita complessiva delle informazioni

RIASSUMENDO Prima forma normale possiede i requisiti fondamentali del modello relazionale, in particolare ogni attributo è elementare, non ci sono righe uguali, non ci sono attributi di gruppo o ripetuti Seconda forma normale è in prima forma normale e non ci sono attributi non-chiave che dipendono parzialmente dalla chiave Terza forma normale è in seconda forma normale e non ci sono attributi non-chiave che dipendono transitivamente dalla chiave

Integrità referenziale Per integrità referenziale si intende l’insieme di regole che garantiscono l’integrità dei dati di un modello relazionale rendendo valide le associazioni tra le tabelle ed eliminando gli eventuali errori di inserimento, cancellazione o modifica di dati collegati tra loro.

Integrità referenziale Per ogni valore non nullo della chiave esterna, deve esistere un valore corrispondente della chiave primaria nella tabella associata Tabella 1 Chiave1 ChiaveE2 Tabella 2 Chiave2 Ogni valore di ChiaveE2 della Tabella 1 deve avere un valore presente nella Chiave2 della tabella 2 oppure il valore di ChiaveE2 deve essere nullo

Effetti integrità referenziale Non è possibile immettere un valore nella chiave esterna di una tabella associata, se tale valore non esiste tra le chiavi della tabella primaria Esempio: Se esiste una integrità referenziale (Foreign key) tra l’ordine ed il cliente: un ordine non può essere assegnato ad un cliente che non esiste nella tabella dei clienti. Non è possibile eliminare una riga dalla tabella primaria, se esistono righe legate ad essa attraverso la chiave esterna nella tabella correlata Esempio: Non è possibile eliminare un cliente dalla tabella dei clienti se ci sono ordini assegnati a quel cliente nella tabella degli ordini.

Effetti integrità referenziale Non si può modificare il valore assegnato ad una chiave nella tabella primaria, se essa compare in qualche riga della tabella correlata Esempio: Non è possibile modificare il valore alla chiave di un cliente se si sono ordini per quel cliente già registrati nella tabella degli ordini.