Basi di dati I Prof.ssa Rosalba Giugno Prof. Alfredo Pulvirenti SQL :Structured Query Language: SELECT (III) SQL (Slide tratte in parte da da Atzeni, Ceri, Paraboschi, Torlonee, Basi di dati McGraw-Hill, 2002)
Giugno-Pulvirenti AA NomeEtà Persone Reddito Andrea27 Maria55 Anna50 Filippo26 Luigi50 Franco60 Olga30 Sergio85 Luisa75 Aldo Madre Maternità Figlio Luisa Anna Maria Luisa Maria Olga Filippo Andrea Aldo Luigi Padre Paternità Figlio Luigi Franco Sergio Olga Filippo Andrea Aldo Franco
Giugno-Pulvirenti AA Attributi: sintassi estesa Attributi ::= * | Espr [[AS] NuovoNome] {, Espr [[AS] NuovoNome] } Espr ::= [Ide.]Attributo | Costante | “(“ Espr “)” | [-] Espr [ Espr] | (SUM | COUNT |AVG | MAX | MIN) “(“ [DISTINCT] [Ide.] Attributo “)” | COUNT “(“ * “)” ::= ( + | - | * | / )
Giugno-Pulvirenti AA Esempio SELECT AVG(Voto) AS Media Rossi FROM Esami, Studenti WHERE Nome = ‘Paolo Rossi’ AND Esami.Matricola = Studenti.Matricola Media dei voti di Paolo Rossi
Giugno-Pulvirenti AA Operatori aggregati Nelle espressioni della target list possiamo avere anche espressioni che calcolano valori a partire da insiemi di ennuple SQL-2 prevede 5 possibili operatori di aggregamento: –conteggio, minimo, massimo, media, somma Gli operatori di aggregamento NON sono rappresentabili in Algebra Relazionale
Giugno-Pulvirenti AA Cosa sono? Operano su insiemi di righe per dare un risultato per gruppo. IMPIEGATI “SalarioMassimo” DEPTNO SAL MAX(SAL)
Giugno-Pulvirenti AA Uso SELECT[column,] group_function(column) FROMtable [WHEREcondition] [GROUP BYcolumn] [ORDER BYcolumn];
Giugno-Pulvirenti AA Operatori aggregati: COUNT COUNT restituisce il numero di righe o il numero di valori distinti di un particolare attributo Esempio: Il numero di figli di Franco: SELECT count(*) as NumFigliDiFranco FROM Paternita WHERE Padre = 'Franco' –l’operatore aggregato (count) viene applicato al risultato dell’interrogazione: SELECT * FROM Paternita WHERE Padre = 'Franco'
Giugno-Pulvirenti AA Padre Paternità Figlio Luigi Sergio Olga Filippo Franco Andrea Aldo Franco Andrea Aldo NumFigliDiFranco 2 Esempio
Giugno-Pulvirenti AA COUNT e valori nulli Numero di tuple SELECT count(*) FROM persone Numero di volte il campo ‘reddito’ non e’ NULL SELECT count(reddito) FROM persone Numero di valori distinti del campo ‘reddito’ (senza i NULL) SELECT count(distinct reddito) FROM persone NomeEtàPersoneReddito Andrea27 Maria55 Anna50 Aldo NULL
Giugno-Pulvirenti AA Altri operatori aggregati SUM, AVG, MAX, MIN Media dei redditi di coloro che hanno meno di 30 anni: SELECT avg(reddito) FROM persone WHERE eta < 30 Uso del JOIN: media dei redditi dei figli di Franco: SELECT avg(reddito) FROM persone JOIN paternita ON nome=figlio WHERE padre='Franco‘ Uso di piu’ operatori di aggregamento nella target list: SELECT avg(reddito), min(reddito), max(reddito) FROM persone WHERE eta < 30
Giugno-Pulvirenti AA Uso di AVG e SUM AVG(SAL) MAX(SAL) MIN(SAL) SUM(SAL) Possono essere usati su dati numerici. SQL> SELECTAVG(sal), MAX(sal), 2MIN(sal), SUM(sal) 3FROMemp 4WHEREjob LIKE 'SALES%';
Giugno-Pulvirenti AA Uso di MIN e MAX Possono essere usati su qualsiasi tipo. SQL> SELECTMIN(hiredate), MAX(hiredate) 2 FROMemp; MIN(HIRED MAX(HIRED DEC JAN-83
Giugno-Pulvirenti AA Operatori aggregati e valori nulli SELECT avg(reddito) AS redditomedio FROM persone NomeEtàPersoneReddito Andrea27 Maria55 Anna50 Aldo NULL
Giugno-Pulvirenti AA Operatori aggregati e target list un’interrogazione scorretta: SELECT nome, max(reddito) FROM persone di chi sarebbe il nome? La target list deve essere omogenea SELECT min(eta), avg(reddito) FROM persone
Giugno-Pulvirenti AA Operatori aggregati e raggruppamenti Le funzioni possono essere applicate a partizioni delle relazioni Clausola GROUP BY –Syntax: GROUP BY listaAttributi Il numero di figli di ciascun padre SELECT padre, count(*) AS NumFigli FROM paternita GROUP BY Padre Padre paternita Figlio Luigi Sergio Olga Filippo Franco Andrea Aldo Franco PadreNumFigli Luigi Sergio 2 Franco2 1
Giugno-Pulvirenti AA Raggruppare piu’ di una colonna IMPIEGATI “sommare I salari in IMPIEGATI per ongi lavoro, Ragruppati per dipartimeno” DEPTNO JOB SAL MANAGER PRESIDENT CLERK CLERK CLERK ANALYST MANAGER SALESMAN MANAGER SALESMAN CLERK SALESMAN SALESMAN 1250 JOB SUM(SAL) CLERK 1300 MANAGER 2450 PRESIDENT 5000 ANALYST 6000 CLERK 1900 MANAGER 2975 CLERK 950 MANAGER 2850 SALESMAN 5600 DEPTNO
Giugno-Pulvirenti AA Uso di GROUP BY Tutte le colonne della SELECT che non sono in funzioni di gruppo devono essere nella GROUP BY. SQL> SELECT deptno, AVG(sal) 2 FROM emp 3 GROUP BY deptno; DEPTNO AVG(SAL)
Giugno-Pulvirenti AA Esempio GROUP BY Per ogni dipartimento, restituire la somma degli stipendi di tutti gli impiegati (di quel dipartimento) Relazione: Employee(Name,Dept,Office,Salary,City)
Giugno-Pulvirenti AA Semantica degli operatori di raggruppamento (1) La query e’ innanzitutto eseguita senza operatori aggregati e senza GROUP BY:
Giugno-Pulvirenti AA Semantica degli operatori di raggruppamento (2) Quindi il risultato e’ diviso in sottoinsiemi aventi gli stessi valori per gli attributi indicati nel GROUP BY (Dept nel nostro caso) Quindi l’operatore di aggregamento e’ calcolato su ogni sottoinsieme:
Giugno-Pulvirenti AA Raggruppamenti e target list scorretta SELECT padre, avg(f.reddito), p.reddito FROM persone f JOIN paternita ON figlio = nome JOIN persone p ON padre =p.nome GROUP BY padre corretta SELECT padre, avg(f.reddito) FROM persone f JOIN paternita ON figlio = nome JOIN persone p ON padre =p.nome GROUP BY padre
Giugno-Pulvirenti AA Condizioni sui gruppi, clausola HAVING Si possono applicare condizioni sul valore aggregato per ogni gruppo Esempio: I dipartimenti la cui somma dei salari e’ maggiore di 100
Giugno-Pulvirenti AA WHERE o HAVING? I padri i cui figli sotto i 30 anni hanno un reddito medio maggiore di 25: SELECT padre, avg(f.reddito) FROM persone f JOIN paternita ON figlio = nome WHERE eta < 30 GROUP BY padre HAVING avg(f.reddito) > 25
Giugno-Pulvirenti AA Sintassi, riassumiamo SelectSQL ::= select ListaAttributiOEspressioni from ListaTabelle [ where CondizioniSemplici ] [ group by ListaAttributiDiRaggruppamento ] [ having CondizioniAggregate ] [ order by ListaAttributiDiOrdinamento ]
Giugno-Pulvirenti AA Esercitazione Considera il seguente schema relazionale: –Quadri( Pittore, Titolo, DataCreazione, NomeMuseo) –Musei( NomeMuseo, Citta, Curatore) –Costo( Titolo, Prezzo) Scrivere le seguenti query in SQL: –Elenco dei musei e del valore medio dei quadri posseduti. –Il numero di quadri per ogni pittore fra tutti i musei parigini. –Il museo con il maggior numero di quadri esposti.
Giugno-Pulvirenti AA Elenco dei musei e del valore medio dei quadri posseduti. –Quadri( Pittore, Titolo, DataCreazione, NomeMuseo) –Musei( NomeMuseo, Citta, Curatore) –Costo( Titolo, Prezzo) SELECT avg(c.prezzo) ‘prezzo medio’, m.nomeMuseo FROM quadri q, musei m, costo c WHERE q.nomeMuseo = m.nomeMuseo AND q.Titolo = c.Titolo GROUP BY m.nomeMuseo
Giugno-Pulvirenti AA Elenco dei musei e del valore medio dei quadri posseduti. –Quadri( Pittore, Titolo, DataCreazione, NomeMuseo) –Musei( NomeMuseo, Citta, Curatore) –Costo( Titolo, Prezzo) SELECT avg(c.prezzo) ‘prezzo medio’, m.nomeMuseo FROM (musei JOIN quadri ON musei.nomeMuseo = quadri.nomeMuseo) JOIN costo ON quadri.Titolo = costo.Titolo GROUP BY m.nomeMuseo
Giugno-Pulvirenti AA Il numero di quadri per ogni pittore fra tutti i musei parigini. –Quadri( Pittore, Titolo, DataCreazione, NomeMuseo) –Musei( NomeMuseo, Citta, Curatore) –Costo( Titolo, Prezzo) SELECT count(*) ‘numero quadri’, pittore FROM musei m, quadri q, costo c WHERE m.Citta = ‘Parigi’ AND m.nomeMuseo = q.nomeMuseo AND q.titolo = c.Titolo GROUP BY pittore
Giugno-Pulvirenti AA Il museo con il maggior numero di quadri esposti. –Quadri( Pittore, Titolo, DataCreazione, NomeMuseo) –Musei( NomeMuseo, Citta, Curatore) –Costo( Titolo, Prezzo)
Giugno-Pulvirenti AA Unione, intersezione e differenza La SELECT da sola non permette di fare unioni; serve un costrutto esplicito: SELECT … UNION [all] SELECT... i duplicati vengono eliminati (a meno che si usi all) –anche dalle proiezioni!
Giugno-Pulvirenti AA Notazione posizionale! SELECT padre FROM paternita UNION SELECT madre FROM maternita quali nomi per gli attributi del risultato? –nessuno –quelli del primo operando –…
Giugno-Pulvirenti AA Luisa Anna Maria Luisa Maria Olga Filippo Andrea Aldo Luigi Figlio Luigi Franco Sergio Olga Filippo Andrea Aldo Franco Luisa Anna Maria Luisa Maria Olga Filippo Andrea Aldo Luigi PadreFiglio Luigi Franco Sergio Olga Filippo Andrea Aldo Franco
Giugno-Pulvirenti AA Notazione posizionale, 2 SELECT padre, figlio FROM paternita UNION SELECT figlio, madre FROM maternita SELECT padre, figlio FROM paternita UNION SELECT madre, figlio FROM maternita
Giugno-Pulvirenti AA Notazione posizionale, 3 Anche con le ridenominazioni non cambia niente: SELECT padre as genitore, figlio FROM paternita UNION SELECT figlio, madre as genitore FROM maternita Corretta: SELECT padre as genitore, figlio FROM paternita UNION SELECT madre as genitore, figlio FROM maternita
Giugno-Pulvirenti AA Differenza SELECT Nome FROM Impiegato EXCEPT SELECT Cognome as Nome FROM Impiegato vedremo che si può esprimere con SELECT nidificate
Giugno-Pulvirenti AA Intersezione SELECT Nome FROM Impiegato INTERSECT SELECT Cognome as Nome FROM Impiegato –equivale a SELECT I.Nome FROM Impiegato I, Impiegato J WHERE I.Nome = J.Cognome
Giugno-Pulvirenti AA Limitare le righe selezionate –Limitare le righe tramite l’uso della clausola WHERE. –La clausola WHERE segue la clausola FROM. SELECT[DISTINCT] {*| colonna [alias],...} FROM tabella [WHEREcondizione(i)];
Giugno-Pulvirenti AA Interrogazioni nidificate Condizione : := Predicato | “(“Condizione”)” | NOT Condizione | Condizione (AND | OR) Condizione Predicato –Espr op (Espr | “(“ Sottoselect “)” ) –op {=, <>, >, >=, <, <=} –SottoSelect deve dare come risultato una tabella con un solo elemento o vuota (vedremo alcuni esempi) SELECT[DISTINCT] {*| colonna [alias],...} FROM tabella [WHEREcondizione(i)];
Giugno-Pulvirenti AA Interrogazioni nidificate le condizioni in SQL permettono anche il confronto fra un attributo e il risultato di una sottoquery –Syntax: Scalare Operatore (ANY | ALL) SelectQuery ANY : il predicato e’ vero se almeno uno dei valori restituiti da Query soddisfano la condizione ALL : il predicato e’ vero se tutti i valori restituiti dalla Query soddisfano la condizione –quantificatore esistenziale EXISTS SelectQuery Il predicato e’ vero se la SelectQuery restituisce almeno una tupla
Giugno-Pulvirenti AA Esempio di SELECT nidificate nome e reddito del padre di Franco SELECT Nome, Reddito FROM Persone, Paternita WHERE Nome = Padre AND Figlio = 'Franco' SELECT Nome, Reddito FROM Persone WHERE Nome = (SELECT Padre FROM Paternita WHERE Figlio = 'Franco') La query nella clausola WHERE e’ la query nidificata
Giugno-Pulvirenti AA Interrogazioni nidificate, commenti La forma nidificata è “meno dichiarativa”, ma talvolta più leggibile (richiede meno variabili) La forma piana e quella nidificata possono essere combinate Le sottointerrogazioni non possono contenere operatori insiemistici (“l’unione si fa solo al livello esterno”); la limitazione non è significativa
Giugno-Pulvirenti AA Nome e reddito dei padri di persone che guadagnano più di 20 milioni SELECT distinct P.Nome, P.Reddito FROM Persone P, Paternita, Persone F WHERE P.Nome = Padre AND Figlio = F.Nome AND F.Reddito > 20 SELECT Nome, Reddito FROM Persone WHERE Nome in (SELECT Padre FROM Paternita WHERE Figlio = any (SELECT Nome FROM Persone WHERE Reddito > 20))
Giugno-Pulvirenti AA Nome e reddito dei padri di persone che guadagnano più di 20 milioni SELECT distinct P.Nome, P.Reddito FROM Persone P, Paternita, Persone F WHERE P.Nome = Padre AND Figlio = F.Nome AND F.Reddito > 20 SELECT Nome, Reddito FROM Persone WHERE Nome in (SELECT Padre FROM Paternita, Persone WHERE Figlio = Nome AND Reddito > 20)
Giugno-Pulvirenti AA Negazione con le query nidificate Trovare quei dipartimenti dove non c’e’ nessuno che si chiama ‘Brown’: Oppure:
Giugno-Pulvirenti AA Operatori IN e NOT IN IN e’ sinonimo di: =ANY NOT IN e’ sinonimo di: <>ALL
Giugno-Pulvirenti AA MAX e MIN con le query nidificate Esempio: Il dipartimento(i) dove lavora colui con lo stipendio piu’ alto di tutta l’azienda: Oppure:
Giugno-Pulvirenti AA Interrogazioni nidificate, commenti, 2 La prima versione di SQL prevedeva solo la forma nidificata (o strutturata), con una sola relazione in ogni clausola FROM. Il che è insoddisfacente: –la dichiaratività è limitata –non si possono includere nella target list attributi di relazioni nei blocchi interni
Giugno-Pulvirenti AA Nome e reddito dei padri di persone che guadagnano più di 20 milioni, con indicazione del reddito del figlio SELECT distinct P.Nome, P.Reddito, F.Reddito FROM Persone P, Paternita, Persone F WHERE P.Nome = Padre AND Figlio = F.Nome AND F.Reddito > 20 SELECT Nome, Reddito, ???? FROM Persone WHERE Nome in (SELECT Padre FROM Paternita WHERE Figlio = any (SELECT Nome FROM Persone WHERE Reddito > 20))
Giugno-Pulvirenti AA Interrogazioni nidificate, commenti, 3 regole di visibilità: –non è possibile fare riferimenti a variabili definite in blocchi più interni –se un nome di variabile è omesso, si assume riferimento alla variabile più “vicina” in un blocco si può fare riferimento a variabili definite in blocchi più esterni
Giugno-Pulvirenti AA NomeEtà Persone Reddito Andrea27 Maria55 Anna50 Filippo26 Luigi50 Franco60 Olga30 Sergio85 Luisa75 Aldo Madre Maternità Figlio Luisa Anna Maria Luisa Maria Olga Filippo Andrea Aldo Luigi Padre Paternità Figlio Luigi Franco Sergio Olga Filippo Andrea Aldo Franco
Giugno-Pulvirenti AA Quantificazione esistenziale Ulteriore tipo di condizione –EXISTS ( Sottoespressione ) Le persone che hanno almeno un figlio SELECT * FROM Persone WHERE EXISTS (SELECT * FROM Paternita WHERE Padre = Nome) OR EXISTS (SELECT * FROM Maternita WHERE Madre = Nome)
Giugno-Pulvirenti AA I padri i cui figli guadagnano tutti più di venti milioni SELECT distinct Padre FROM Paternita Z WHERE NOT EXISTS ( SELECT * FROM Paternita W, Persone WHERE W.Padre = Z.Padre AND W.Figlio = Nome AND Reddito <= 20) Quantificazione esistenziale, 2
Giugno-Pulvirenti AA Semantica delle espressioni “correlate” La query piu’ interna puo’ usare variabili della query esterna L’interrogazione interna viene eseguita una volta per ciascuna ennupla dell’interrogazione esterna Esempio, trovare tutti gli studenti che hanno un omonimo: –SELECT * FROM Student S WHERE EXISTS (SELECT * FROM Student S2 WHERE S2.Nome = S.Nome AND S2.Cognome = S.Cognome AND S2.Matricola <> S.Matricola)
Giugno-Pulvirenti AA Semantica delle espressioni “correlate”, 2 Esempio, trovare tutti gli studenti che NON hanno un omonimo: –SELECT * FROM Student S WHERE NOT EXISTS (SELECT * FROM Student S2 WHERE S2.Nome = S.Nome AND S2.Cognome = S.Cognome AND S2.Matricola <> S.Matricola)
Giugno-Pulvirenti AA Confronto su piu’ attributi Il confronto con il risultato di una query nidificata puo’ essere basato su piu’ attributi Stessa query di prima, trovare tutti gli studenti che hanno un omonimo: –SELECT * FROM Student S WHERE (Nome, Cognome) IN (SELECT Nome, Cognome FROM Student S2 WHERE S2.Matricola <> S.Matricola)
Giugno-Pulvirenti AA Visibilità scorretta: SELECT * FROM Impiegato WHERE Dipart in (SELECT Nome FROM Dipartimento D1 WHERE Nome = 'Produzione') OR Dipart in (SELECT Nome FROM Dipartimento D2 WHERE D2.Citta = D1.Citta) –D1 non e’ visibile nella seconda query nidificata in quanto le due sottoquery sono allo stesso livello
Giugno-Pulvirenti AA Commenti finali sulle query nidificate Query nidificate possono essere “meno dichiarative” in un certo senso ma spesso sono piu’ facilmente interpretabili –Suddivisibili in blocchi piu’ semplici da interpretare L’utilizzo di variabili deve rispettare le regole di visibilita’ –Cioe’, una variabile puo’ essere usata solo all’interno dello stesso blocco e in un blocco piu’ interno Comunque, query nidificate complesse possono essere di difficile comprensione –Soprattutto quando si usano molte variabili comuni tra blocchi diversi