Modulo 4 Relatore: Stefano Furlan SQL SERVER Modulo 4 Relatore: Stefano Furlan
Una premessa Lezioni pratiche con in mente il progetto Requisiti Information retrieval Non avere paura di usare google Capacità progettuale Dove voglio arrivare? (definizione della specifica) Cosa mi serve per arrivarci? (analisi) In che ordine lo faccio? (separazione dei task) Come capisco che sono arrivato? (verifica del risultato) OVVERO: Buonsenso!
? Cos’è un DBMS? In realtà dovremmo chiederci… A COSA CI SERVE? A quali domande del nostro committente dobbiamo dare risposta?
Architettura di un sistema di telecontrollo Dati Sistema di controllo Controllo Pannelli fotovoltaici Utente Applicazione di configurazione Collettore dati DB Sistema di reportistica
A cosa serve un DBMS? Storage Dati Ma quali dati? Dati tecnici Configurazioni Logs Siamo fortunati: tipicamente una base dati per il telecontrollo è piuttosto semplice
Struttura del DBMS QUERY SQL MOTORE DATI Dati
LINGUAGGIO SQL Structured query language Comandi testuali strutturati per il database DML (data manipulation language) DDL (data definition language) Vantaggio: compatibilità TSQL: dialetto di MS Sql Server
SQL SERVER È un sw server! Accesso usando tool SSMS Come lo contatto? Meccanismo di istanze (Nomemacchina\nomeserver) Accesso usando tool SSMS Interfaccia user friendly Query testuali
Operazioni preliminari Accesso con SSMS Creazione di un DB vuoto Skip delle impostazioni
CREAZIONE DI UNA BASE DATI
MAPPARE LA STRUTTURA DELLA REALTA’ PANNELLI (3 pannelli piccoli e uno grande) GRUPPI (divisi in due zone) ENERGIA PRODOTTA (che producono energia ad ogni ora)
ENTITÀ FONDAMENTALI in una base dati TABELLE Campi (colonne) tipizzati Chiavi Indici RELAZIONI Chiavi esterne VISTE PROCEDURE
OPERAZIONI FONDAMENTALI in una base dati Lettura o selezione (SELECT) Scrittura o inserimento (INSERT) Modifica (UPDATE) Cancellazione (DELETE)
TABELLA IdPannello Nome Potenza DataInstallazione 1 Pannello 1 3kW 1/1/2013 2 Pannello 2 2kW 3 Pannello 3 1/3/2013 4 Pannello 4 null Esempio di tabella
TABELLA CAMPI tipizzati Numerici Testuali Date Altri (poco usati) Interi Tinyint (1 byte) 0-255 Smallint (2 bytes) -32000 +32000 Integer (4 bytes) +-miliardi (+-2^31) Bigint (8 bytes) +- le particelle dell’universo (+-2^63) Frazionari Float (attenzione: errori di arrotondamento) Decimal(x,y) (preciso ma lento) Money (4 cifre decimali) Testuali Char(x) Varchar(x) nvarchar(x) (unicode) Date Datetime Altri (poco usati)
TABELLE: chiave primaria Campo o campi che permettono di individuare univocamente ciascuna riga Spesso un codice ID intero ad auto incremento idPannello Nome 1 Panel1 2 Panel2 3 Panel3 CHIAVE PRIMARIA
TABELLA: altre features Identity Default value Vincoli check Indici Univoci Valori Nulli e campi nullabili Convenzione: i nomi tabella iniziano con «tab»
Un po’ di pratica Accediamo a SQL server per creare una tabella per i pannelli (Usando SSMS)
Interfaccia di creazione tabella
Ultime info su SSMS Gli oggetti non si aggiornano da soli in visualizzazione Refresh Ctrl-shift R Context menu Inserimento dei dati in tabella manualmente
TABELLA: relazioni tra tabelle Si chiama «relazionale» per qualche motivo Relazioni tra entità Integrità referenziale enforced da DB (il db impedisce che nella tabella dei consumi esista mai una riga «orfana») idPannello Nome 1 Panel1 2 Panel2 3 Panel3 idPannello Data Energia 2 01/01/2013 100 3 200 4 250 01/02/2013 10 5 40
Il diagramma database Metodo facilitato di creazione Permette di tenere sotto controllo in maniera grafica le relazioni Usato per separare parti diverse di un progetto complesso
Esempio di semplice diagramma…
Torniamo alla nostra realtà… PANNELLI (3 pannelli piccoli e uno grande) GRUPPI (divisi in due zone) ENERGIA PRODOTTA (che producono energia ad ogni ora)
Progettazione di una base dati: STEPS Individuazione delle entità (tipicamente ogni entità avrà la sua tabella) Individuazione delle relazioni Alcune tabelle saranno collegate ad altre in maniera naturale Produzione del diagramma Esempio: dati di sistema fotovoltaico Dati di funzionamento (energia prodotta ogni quarto d’ora) Configurazioni (quanti e quali pannelli ho?) Dati di log (listato diagnostico)
REGOLE DI PROGETTAZIONE Buonsenso! Ogni tabella mappa un’entità (o una relazione) Deve esistere sempre una chiave primaria Evitare dati non atomici (concatenazione di dati nello stesso campo) Mai lo stesso dato contemporaneamente in due posti diversi! Mai perdere informazioni Evitare che vengano inserite porcherie Forme normali
TABELLE: alcuni consigli Usare il tipo di dato più corretto per ogni campo ma pensando con lungimiranza Impedire l’inserimento di dati scorretti Se qualcosa può andare storto LO FARA’ ES: Codici fiscali Campi di testo libero a Varchar(max) Vedi la legge di murphy sopra
ESERCITAZIONE Che tipo di dato è bene usare per : Per la temperatura del corpo umano? Perché? Per un numero civico? Perché? Per la potenza istantanea di un impianto? Perché? Che vincoli mettereste sui dati di cui sopra? Progettare un SEMPLICE database per gestire un parco fotovoltaico (usando il diagramma) Entità: pannello, energia prodotta ogni quarto d’ora da ciascun pannello, raggruppamento di pannelli in aree.
Esercitazione: data entry Una volta creata la base dati Creare 4 pannelli Creare due zone (una con tre pannelli l’altra con uno) Inserire dati di energia prodotta per tutti i giorni di Gennaio 2013 per tutti e 4 i pannelli Possibile utilizzo di excel per il data entry
Progettazione di una base dati PROGETTARE UNA BASE DATI È UN’ATTIVITÀ SOLO APPARENTEMENTE BANALE MOLTI PERICOLI NASCOSTI FARE MODIFICHE IN CORSO D’OPERA PUÒ ESSERE DISPENDIOSO MEGLIO PROGETTARE BENE DALL’INIZIO Chiara definizione delle entità Buone naming conventions (prefissi, camel-case)
APPROFONDIMENTI Indici e Considerazioni di performances
UTILIZZO DI UNA BASE DATI
Azioni sulla base dati Lettura o selezione (SELECT) Scrittura o inserimento (INSERT) Modifica (UPDATE) Cancellazione (DELETE) QUERY Frase in pseudo inglese ES: seleziona <qualcosa> da una <tabella> quando <si verifica una certa condizione>
SELECT La funzione più usata in assoluto Sintassi usata anche in altre funzionalità Ritorna un recordset
SELECT: sintassi SELECT [idPannello] ,[Pannello] ,[Note] SELECT <lista campi> FROM <tabella> WHERE <condizione> ORDER BY <lista campi ordinamento> Es: SELECT [idPannello] ,[Pannello] ,[Note] FROM tabPannelli Le Keyword in MAIUSCOLO per convenzione
SELECT : lista campi SELECT Nome,Potenza as PotKWH FROM tabPannelli IdPannello Nome Potenza DataInstallazione 1 Pannello 1 3kW 1/1/2013 2 Pannello 2 2kW 3 Pannello 3 1/3/2013 4 Pannello 4 null SELECT Nome,Potenza as PotKWH FROM tabPannelli Nome PotKWH Pannello 1 3kW Pannello 2 2kW Pannello 3 Pannello 4 null
SELECT: lista campi Asterisco= tutti i campi Alias Es: select * from tabella Alias Es: SELECT nome as NomePannello from tabPannelli Sono possibili alcune operazioni in fase di select (concatenazione di stringhe) ES: SELECT ‘il pannello ‘ + idpannello +’ è rotto’ as Anomalia FROM tabPannelli 3 part naming convention Es: SELECT * FROM dbFotovoltaico.dbo.tabPannelli Parentesi quadre se campo contiene spazio ES: SELECT nome as [il mio nome] FROM tabPannelli
SELECT : condizioni WHERE <campo/valore><operatore><campo/valore> Es: WHERE idpannello=1 WHERE IN (lista elementi) Es: WHERE idpannello IN (1,2,3) WHERE IN (query) Es: WHERE idpannello IN (select idpannello from tabPannelli where nomepannello=‘pannello1’) WHERE LIKE Es: WHERE nome LIKE ‘Pannello%’ Uso di valori testuali Padding SQL iniection
SELECT: condizioni Usabili tutti gli operatori di confronto (< , > , = , != , <>) Es: WHERE idPannello=1 Altri operatori (LIKE, BETWEEN) Tutti i costrutti booleani (AND, OR, NOT) Usare sempre le parentesi Es: SELECT * FROM tabPannelli WHERE idpannello=1 AND (nomepannello=‘Pannello1’ OR nomepannello=‘Pannello2’ )
SELECT: ordinamento La clausola ORDER BY specifica il criterio di ordinamento Es: SELECT * FROM tabPannelli ORDER BY idPannello ASC ,NomePannello DESC
? JOIN Come collegare i dati di tabelle distinte? tabEnergia tabPannelli idPannello Data Energia 2 01/01/2013 100 3 200 4 250 01/02/2013 10 5 40 idPannello Nome 1 Panel1 2 Panel2 3 Panel3 ?
JOIN (collegamento di più tabelle) INNER È l’opzione più comune Vengono restituite solo le righe comuni a entrambe le tabelle Se in una delle tabelle non ho un match la riga «scompare» Possono essere restituite più righe delle due tabelle! (tipicamente è un errore) idPannello Nome Data Energia 1 Panel1 null 2 Panel2 01/01/2013 100 3 Panel3 200 4 250 01/02/2013 10 5 40
JOIN LEFT righe a sx più righe a dx che matchano RIGTH è una left con le tabelle scambiate (da non usare per problemi di leggibilità) idPannello Nome Data Energia 1 Panel1 null 2 Panel2 01/01/2013 100 3 Panel3 200 4 250 01/02/2013 10 5 40 idPannello Nome Data Energia 1 Panel1 null 2 Panel2 ######## 100 3 Panel3 200 4 250 10 5 40
JOIN FULL OUTER CROSS Fa il cartesiano(tutte le combinazioni). Con le tabelle sopra sono 18 righe… idPannello Nome Data Energia 1 Panel1 null 2 Panel2 01/01/2013 100 3 Panel3 200 4 250 01/02/2013 10 5 40
JOIN: sintassi SELECT <lista campi> FROM <tabella> as <Alias> INNER JOIN <tabella> as <Alias2> ON Alias1.campo = Alias2.campo Es: SELECT * FROM tabEnergia INNER JOIN tabPannelli ON tabEnergia.idPannello=tabPannelli.idPannello
ESERCITAZIONE: Mostrare la tabella consumi ma, al posto dell’idPannello mostrare il nome del pannello
JOIN in cascata È possibile combinare più tabelle in una serie di join successivi Es: SELECT * FROM tabEnergia INNER JOIN tabPannelli ON tabEnergia.idPannello=tabPannelli.idPannello INNER JOIN tabGruppi ON tabGruppi.idGruppo=tabPannelli.idGruppo
Best practices su SELECT e JOIN Attenzione ai cartesiani! Attenzione alle INNER su campi non chiave: potrebbero «sparire righe» o uscire «righe in più» Ordinare le tabelle nella clausola di join a partire dalla più informativa Usare solo left join e mai right join per facilità di lettura Formattazione delle query
AGGREGAZIONE E RAGGRUPPAMENTO Che succede se voglio sommare dei valori? Es: sapere quanto ha prodotto ogni pannello in un certo periodo? Ma io ho questo: Pannello Energia Prodotta In Gennaio Pannello1 1230 Pannello2 132 Pannello3 1244 idPannello Data Energia 2 01/01/2013 100 3 200 4 250 01/02/2013 10 5 40
AGGREGAZIONE E RAGGRUPPAMENTO SELECT<lista campi> <lista funzione di aggregazione(Campo)> FROM <tabella> WHERE <condizione> HAVING <condizione su campi raggruppati> Es: SELECT tabPannelli.Pannello , SUM(tabEnergiav2.Energia) AS EnergiaTot FROM tabEnergiav2 INNER JOIN tabPannelli ON tabEnergiav2.idPannello = tabPannelli.idPannello GROUP BY tabPannelli.idPannello , tabPannelli.Pannello
ESERCITAZIONE Mostrare in una lista tutti i pannelli e, per ognuno mostrare l’energia prodotta (sia che il pannello abbia prodotto, sia no!)
ESERCITAZIONE Mostrare la quantità di energia prodotta da ogni pannello (specificando il nome pannelloe non l’ID!) In totale Raggruppata per giorno Per la prima settimana di gennaio 2013 Raggruppata per mese e salvare la query Raggruppata per settimana(!) (non si può fare con la base dati che abbiamo: perché? Come si può fare?) Mostrare in una lista tutti i pannelli e, per ognuno mostrare l’energia prodotta (sia che il pannello abbia prodotto, sia no!)
INSERT INSERT VALUES INSERT RESULTS INSERT INTO tabella (lista campi) (lista valori) INSERT RESULTS SELECT <lista campi> FROM tabella WHERE <condizione>
UPDATE Aggiornamento di tabelle Sintassi Es: UPDATE <tabella> SET campo=<Valore> FROM <tabella> Es: UPDATE tabEnergia SET energia=0 FROM tabEnergia WHERE (Ora >23 OR Ora<5)
DELETE Sintassi: In caso di join DELETE FROM tabella WHERE idpannello=1 In caso di join DELETE FROM tabella FROM tabella INNER JOIN tabella2 ON tabella.id=tabella2.id WHERE tabella2.Nome=‘Pannello2’ Attenzione in caso di relazioni con cascade!
ESERCITAZIONE Creare una tabella con i giorni dell’anno e alimentarla Eliminare tutti i dati di energia prodotta Inserire nuovi dati di consumo per tutto il 2013 (con QTA casuali da 50 a 100 di giorno, 0 di notte) per i pannelli 1,2,4 A marzo 2013 simulare un malfunzionamento del pannello 2 (aggiornando i dati con NULL in tabella) Lanciare la query salvata nella precedente esercitazione per visualizzare i dati di ogni pannello per ogni mese
NOZIONI AVANZATE
UNA PREMESSA DATA ENCAPSULATION INFORMATION HIDING LOGICA N-TIERED Garanzie di successo del progetto Divisione efficiente in tasks Manutenibilità
VISTE Sono in pratica delle query di tipo SELECT nel DB Calcolate «on the fly» Piccole differenze tutti i campi devono essere univoci Ogni campo deve avere un nome Possono essere create con designer Ma fa un po’ schifo
VISTE: sintassi CREATE VIEW <nomevista> AS <query> ES: CREATE VIEV vwPannelli SELECT * FROM tabpannelli
VISTE: alcune considerazioni Vengono calcolate ogni volta Possibili lentezze Se varia un campo la modifica non è a cascata Utili per comunicare con l’esterno Nascondono complessità implementative (information hiding) Utenti Sistemi di reportistica Possono essere richiamate nelle query in maniera semplice e comoda
STORED PROCEDURES Esigenze di data encapsulation e information hiding Molto potenti A differenza delle viste Possono eseguire azioni Possono non ritornare un recordset (dati tabellari) Possono usare step intermedi di calcolo (es: temp tables) Ammettono variabili in ingresso e uscita Svantaggi Non posso fare join sul risultato di una store
STORED PROCEDURES: sintassi CREATE PROCEDURE <nome> ( <Parametri> ) AS BEGIN <istruzioni> END CREATE PROCEDURE spMostraEnergiaPerPannello @idPannello as int Select sum(energia) From tabEnergiaProdotta WHERE idpannello=@idPannello
STORED PROCEDURE: chiamata Sintassi: EXEC spVisualizzaPannello 1 OPPURE EXEC spVisualizzaPannello @idPannello=1
ESERCITAZIONE Creare una procedura che cancelli la tabella dell’energia prodotta (spResetData) Creare una procedura che chiamata con parametro IdPannello mostri l’energia prodotta da quel pannello
SINTASSI TSQL: una piccola toolbox Variabili Strutture di controllo IF Cicli FOR WHILE Cursori Da vedere poi…
SINTASSI TSQL: VARIABILI Iniziano con @ Vanno dichiarate DECLARE @intIdPannello as int=10 Se non inizializzate sono NULL! DECLARE @intIdPannello as int è NULLA Si impostano con istruzione SET SET @intIdPannello =10
SINTASSI TSQL: Strutture condizionali IF (<condizione>) BEGIN <azione> END ELSE ES: IF (@idPannello=1) DELETE FROM tabPannello WHERE idPannello=@idPannello
SINTASSI SQL CONDIZIONE SU RISULTATO QUERY IF EXISTS(<query>) BEGIN <azioni> END ELSE <altre azioni>
SINTASSI TSQL: altro CASE WHEN <condizione> THEN <espressione> WHEN <condizione> THEN <espressione> ELSE <espressione> END CICLI FOR WHILE
ESERCITAZIONE Allo scopo di generare dei dati da analizzare: Creare una procedura sp_generaDatiDEmoPannello che, dato un idpannello Elimini dalla tabella energia prodotta tutti i dati di quel pannello Generi per ogni giorno dell’anno 2013 una riga di misurazione con una quantità randomica da 50 a 100 ( per tutte le ore dalle 8 alle 19) solo alle ore 12 Cercare su google la funzione RAND per la funzione random Se il pannello è il 3 corregga il dato così prodotto simulando un malfunzionamento per tutto marzo e aprile2013(tutte le qta andranno a NULL)
ESERCITAZIONE Creare una procedura spGeneraDatiDemo che chiami la procedura precedente per ogni pannello esistente in tabella La soluzione adottata come reagisce al fatto che io aggiungo un pannello? Si adatta? Cosa mi servirebbe? Eseguirla e Verificare usando la vista dell’energia prodotta i risultati ottenuti
CASE STUDY: import massivo dati
Progettazione di una Procedura di controllo per l’import dati. Una stored proc (parametro=idtrasmissione) Che la trasmissione sia arrivata(che sia arrivato almeno un dato) Il pannello esiste?(lo facciamo dopo) La qta non negativa Qta inferiore a soglia 500 La data della misurazione deve essere univoca e non già presente nel database(per pannello) Chiamare la store:spVerificaTrasmissione (@idTrasmissione) Alla fine aggiornare il campo stato con 1 se successo, 0 se fallimento DECLARE @cnt AS int SELECT @cnt=count(*) FROM tabella (approfondire problema della quantizzazione temporale)
ALTRE FUNZIONALITA’ FUNZIONI TABLE FUNCTIONS Richiamabili da query Solitamente non usate: problematiche di performances TABLE FUNCTIONS «viste» parametriche Anche qui problemi di performances