Linguaggi per basi di dati Linguaggi di definizione dei dati Utilizzati per definire gli schemi e le autorizzazioni per laccesso Linguaggi di manipolazione dei dati Utilizzati per l’interrogazione e l’aggiornamento dei contenuti della base di dati Alcuni linguaggi specializzati (es. SQL) presentano le caratteristiche di entrambi i tipi di linguaggio.
Accesso alla base di dati Linguaggi testuali interattivi Comandi inclusi in estensioni di linguaggi tradizionali Comandi inclusi in linguaggi di sviluppo ad hoc Interfacce grafiche amichevoli
SQL, un linguaggio interattivo SELECT Corso, Aula, Piano FROM Aule, Corsi WHERE Nome = Aula AND Piano="Terra" Corso Aula Reti N3 Sistemi N3 Piano Terra
SQL immerso in linguaggio ad alto livello write('nome della citta''?'); readln(citta); EXEC SQL DECLARE P CURSOR FOR SELECT NOME, REDDITO FROM PERSONE WHERE CITTA = :citta ; EXEC SQL OPEN P ; EXEC SQL FETCH P INTO :nome, :reddito ; while SQLCODE = 0 do begin write('nome della persona:', nome, 'aumento?'); readln(aumento); EXEC SQL UPDATE PERSONE SET REDDITO = REDDITO + :aumento WHERE CURRENT OF P EXEC SQL FETCH P INTO :nome, :reddito end; EXEC SQL CLOSE CURSOR P
Interazione non testuale (in Access)Access
Utenti e progettisti Amministratore della base di dati responsabile della progettazione controllo e manutenzione della base di dati Progettisti e programmatori realizzano i programmi che accedono alla base di dati Utenti utenti finali accedono alla base di dati frequentemente e attraverso procedure predefinite utenti casuali interrogano o aggiornano la base di dati con procedure e modalità variabili utilizzando i linguaggi forniti dal DBMS
Vantaggi dei DBMS Disponibilità dei dati a tutta una comunità Modello unificato e preciso della realtà di interesse Controllo centralizzato dei dati Condivisione Indipendenza dei dati
Svantaggi dei DBMS Prodotti costosi, complessi, che richiedono investimenti in hardware, software, personale. Forniscono un numero elevato di servizi, in modo integrato e difficilmente scorporabile se le esigenze dell’utente sono inferiori alle caratteristiche offerte
Modello Relazionale Proposto agli inizi degli anni ‘70 da Codd Finalizzato alla realizzazione dell’indipendenza dei dati Unisce concetti derivati dalla teoria degli insiemi (relazioni) con una rappresentazione dei dati di tipo tabellare Attualmente è il modello più utilizzato
Modello relazionale Teorizzato per separare il più possibile il livello logico dal livello fisico della descrizione dei dati Rigoroso modello matematico permette un elevato grado di astrazione Rappresentazione semplice ed intuitiva Le relazioni ed i risultati delle operazioni su di esse sono facilmente rappresentabili ed interpretabili dagli utenti.
Relazione: tre accezioni relazione matematica: come nella teoria degli insiemi relazione (dall’inglese relationship) che rappresenta una classe di fatti, nel modello Entity-Relationship; tradotto anche con associazione o correlazione relazione secondo il modello relazionale dei dati
Relazioni - Prodotto Cartesiano Dati due insiemi D 1 e D 2 si definisce Prodotto Cartesiano di D 1 e D 2, e si indica con D 1 X D 2, l’insieme delle coppie ordinate (v 1, v 2 ) tali che v 1 sia un elemento di D 1 e v 2 sia un elemento di D 2. Es. Dati gli insiemi A = { cubo, cono } e B={ rosso, verde, blu } il loro prodotto cartesiano è {( cubo,rosso ),( cono,rosso ),( cubo,verde ), ( cono,verde ),( cubo,blu ),( cono,blu )}
Relazioni Una relazione matematica su due insiemi D 1 e D 2 è un sottoinsieme di D 1 X D 2. NOTA: a livello formale gli insiemi possono essere infiniti, a livello pratico non possiamo però considerare relazioni infinite. Es. dati gli insiemi visti, una possibile relazione è {( cubo,rosso ),( cono,rosso ),( cubo,blu )} o, in forma tabellare,
Relazioni Le definizioni viste per 2 insiemi possono essere generalizzate a n insiemi. Ogni riga della tabella sarà allora una n-pla ordinata di elementi. n è detto grado del prodotto cartesiano e quindi della relazione. Il numero di elementi della relazione è detto cardinalità della relazione. Un insieme può apparire più volte in una relazione. Es. La relazione Risultati Partite di Calcio è un sottoinsieme del prodotto cartesiano Stringa x Stringa x Intero x Intero
Relazioni Osservazioni Non esiste ordinamento fra le n-ple Non possono esistere 2 righe uguali Ogni n-pla è internamente ordinata: l’ i-esimo valore proviene dall’ i-esimo dominio (la struttura e’ posizionale) Quindi se si scambiano due righe, la relazione non cambia se si scambiano 2 colonne può cambiare o perdere consistenza
Relazioni La rigidezza dell’ordinamento delle relazioni matematiche spesso non è pratica. In informatica si tende ad utilizzare rappresentazioni non posizionali dei dati, utilizzando l’ordinamento solo quando ha utilità pratica (es. parametri di funzioni, elementi di vettori, matrici). Si utilizzano i tipi strutturati (record) nei casi in cui si debbano raccogliere dati di natura differente in una stessa entità logica. Una relazione è un insieme di record omogenei, cioè definiti sugli stessi campi. Come ogni campo di un record è associato ad un nome, così si associa ad ogni colonna della relazione un attributo.
Relazioni Esempio di relazione con attributi Ogni attributo ha un suo dominio su cui è definito. Ogni riga è detta convenzionalmente tupla (n-pla). Quindi una tupla è un insieme di valori, uno per attributo, ordinati secondo lo schema della relazione e definiti ciascuno su un proprio dominio. Una relazione è una serie di tuple definite sul dominio della relazione (insieme ordinato dei domini dei singoli attributi).
Relazioni Notazione Se t è una tupla definita sul dominio X della relazione e A è uno dei domini di X t[A] (o t.A) è il valore di t relativo al dominio A Es. (relazione Partite) se t è la prima tupla della relazione t.Casa = Parma
Basi di dati e Relazioni Consideriamo il seguente schema di basi di dati: Studenti ( Matricola, Cognome, Nome, DataNascita ) Corsi ( Codice, Titolo, Docente ) Esami ( Studente, Voto, Corso ) Studenti contiene dati su un insieme di studenti Corsi contiene dati su un insieme di corsi Esami contiene dati su un insieme di esami e fa riferimento alle altre due attraverso i numeri di matricola e il nome del corso. Quindi Matricola e Studente, come anche Corso e Titolo, sono definiti sullo stesso dominio e possono assumere gli stessi valori.
MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 studentiCodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi corsi StudenteVotoCorso esami
MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 studentiCodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi corsi StudenteVotoCorso esami 26
Basi di dati e Relazioni Il modello relazionale è basato su valori. I riferimenti fra dati in relazioni diverse avvengono attraverso i valori dei domini corrispondenti che appaiono nelle tuple. Gli altri modelli (gerarchico, reticolare) utilizzano puntatori per le corrispondenze e sono detti basati su record e puntatori.
Basi di dati e Relazioni Vantaggi dell’approccio per valori Si inseriscono nella base di dati solo valori significativi per l’applicazione (i puntatori sono dati aggiuntivi relativi alla sola implementazione). Il trasferimento dei dati da un ambiente ad un altro è più semplice (i puntatori hanno validità solo locale) la rappresentazione logica dei dati non fa riferimento a quella fisica e quindi si ottiene l’indipendenza dei dati
Basi di dati e Relazioni Uno schema di relazione R(X) è costituito da un simbolo (nome della relazione) R e da una serie di attributi X={A 1, A 2, …, A n } Corsi ( Codice, NomeCorso, Docente ) Uno schema di base di dati è un insieme di schemi di relazione con nomi diversi R = {R 1 (X 1 ), R 2 (X 2 ), …, R n (X n )} Una relazione su uno schema R(X) è un insieme r di tuple su X. Una base di dati su uno schema R = {R 1 (X 1 ), R 2 (X 2 ), …, R n (X n )} è un insieme di relazioni r = {r 1, r 2, …, r n } dove ogni r i è una relazione sullo schema R i (X i )