Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoAngiola Leonardi Modificato 10 anni fa
1
Informatica B Allievi Elettrici - AA 2000-01 Le Basi di Dati
2
Sistema Informativo Elemento del sistema organizzativo dellazienda Insieme di risorse umane, strumenti di elabora- zione, scambio, acquisizione di informazioni, procedure per il loro trattamento, regole orga- nizzative, che consente il funzionamento del sistema organizzativo Evoluzione dei sistemi informativi da settoriali a integrati
3
Sistemi Informativi e Basi di Dati (Sistemi Integrati) DB P1 P2 P3 P4 P5 V1 V2V3 V4 V5
4
I sistemi di gestione di basi di dati Un SGBD (Data Base Management System = DBMS): –permette di accedere in modo efficiente ai dati con una granularità più fine che il file system –permette di accedere in modo diretto ai dati basandosi sulle loro proprietà –effettua il controllo della concorrenza alla granularità del singolo record –realizza meccanismi sofisticati per il controllo dellaffidabilità –realizza meccanismi di controllo della privatezza –realizza latomicità delle transazioni
5
Il concetto di transazione Atomicity (atomicità) Consistency (non contraddittorietà) Isolation (isolamento) Durability (persistenza)
6
Componenti fondamentali di un SGBD (DBMS) Gestore della affidabilità (Recovery Manager) Gestore della Concorrenza Buffer manager Ottimizzatore delle interrogazioni
7
Livelli di astrazione Un DBMS fornisce ai suoi utilizzatori una visione astratta della base di dati distinguibile in tre livelli di astrazione: Livello fisico A questo livello la base di dati è vista come un insieme di blocchi fisici su disco. Qui viene decisa lallocazione dei dati e le modalità di memorizzazione dei dati sul disco. Livello logico Evidenzia lorganizzazione dei dati dal punto di vista del loro contenuto informativo, descrivendo la struttura di ciascun record e i collegamenti tra record diversi. Livello esterno Presenta i dati organizzati secondo un punto di vista appropriato ad ogni particolare utente (viste dutente).
8
Definizioni preliminari Modello dei dati: collezione di concetti che possono essere usati per rappresentare la realta. Es: alberi, grafi, tabelle Schema dei dati: rappresentazione di una specifica parte della realta, che usa un modello dei dati. Es. albero genealogico, sistema delle strade e delle citta, tabella degli studenti e dei voti nei singoli esami Istanza: collezione di valori dei dati che rispetta la struttura dello schema. Es: albero genealogico della mia famiglia oggi, rete viaria della Germania il giorno 22 febbraio 2000, dati sugli studenti e gli esami in questo preciso istante
9
Il modello relazionale dei dati Dati organizzati in tabelle dette relazioni Nomi delle colonne: attributi; Numero di colonne: grado Righe: tuple; Numero di righe: cardinalità MATRIC. FONDAM. INFO CHIMICAFISICA I ANALISI GEOMETR …. 5132AB 6123CD 5432CB … …. 30 26 29 22 24 28 26 24 30 lode 28 29 24 30 lode 27 19 23 30 22 18 25 STUDENTI
10
Definizioni Si dice schema di una relazione la descrizione della sua struttura, e cioe il suo nome seguito dallelenco dei nomi dei suoi attributi; a ciascun attributo è associato il suo tipo. Listanza della relazione e, istante per istante, il suo contenuto. La chiave di una relazione è un insieme di attributi che serve ad identificare univocamente le tuple della relazione e che garantisce le seguenti due proprietà: -unicità: in una qualunque istanza di una relazione non possono esistere due tuple distinte la cui restrizione alla chiave sia uguale; -minimalità: non deve essere possibile sottrarre alla chiave un attributo senza che la condizione di unicità cessi di valere.
11
Esempio di schema di base di dati PRESIDENTI (NOME-P, DATA-N, DATA-M, PARTITO, STATO, NOME-M) CONGRESSI (# CONGRESSO, %S-REP, %C-REP, %S-DEM, %C-DEM) AMMINISTRAZIONI (# AMMIN, DATA-IN, VICE-PRES, NOME-P, DATA-N) ELEZIONI (ANNO, VOTI-PRES, NOME-P, DATA-N, NOME-PERD, VOTI-PERD) STATI (STATO, POPOLAZ, # AMMIN.) PRESID-CONGR (NOME-P, DATA-N, # CONGR)
12
Problema Come organizzare i dati nelle tabelle in modo efficace ed efficiente? –Evitare contraddizioni –Permettere lottimizzazione delle interrogazioni
13
La progettazione concettuale Traduce i requisiti di un qualsiasi sistema informatico in una descrizione: formale: espressa in modo non ambiguo ma adeguato a catturare le caratteristiche fondamentali del mondo da descrivere integrata: la descrizione si riferisce alla totalita dellambiente (non settoriale) indipendente dalla realizzazione fisica
14
Lastrazione E un processo mentale che: evidenzia alcune proprieta rilevanti ai fini dellapplicazione esclude le proprieta irrilevanti ai fini dellapplicazione
15
Concetto: persona Persona: nome, cognome, codice fiscale, indirizzo, data di nascita, n. telefono,... Persona come studente: nome, cognome, numero di matricola, corso di laurea, esami sostenuti, voti, anno di corso… Persona come paziente: nome, cognome, data di nascita, gruppo sanguigno, malattie avute, risultati esami medici,...
16
Caratteristiche Schema dei dati: e statico, si progetta una tantum quando si progetta il sistema Istanza: e dinamica, varia col tempo (es. il sistema delle vie viene aggiornato con lintroduzione di una nuova autostrada, nasce un nuovo bambino nella famiglia)
17
Il modello Entita Relazione Entita Relazioni Attributi Persona abita nome
18
Un piccolo esempio Impiegato Reparto Azienda Lavora in Appartiene N. matr. Nome N. Denomin Indirizzo P.IVA Rag. Soc.
19
Gestione dei reparti di un ospedale Si vuole progettare un sistema informativo per la gestione dei reparti di un ospedale. Per ogni reparto si conoscono la denominazione, la posizione (edificio e piano), i nomi del primario e della caposala, il numero delle camere di ciascun tipo (da 1, 2, 3 o 4 letti). I pazienti sono identificati dai loro dati anagrafici, a ciascuno di loro sono associati la patologia, il reparto in cui sono ricoverati e il relativo numero di letto. I pazienti possono arrivare al pronto soccorso ed essere ricoverati (cio' succede per i casi urgenti), oppure il loro ricovero viene prenotato dal loro medico di base, mediante una telefonata nella quale indica i dati del paziente e si accorda sul periodo di ricovero. Le camere possono essere chiuse per manutenzione, e per quel periodo ovviamente non si possono accettare prenotazioni. Inoltre il sistema deve poter gestire le richieste di informazioni sui reparti e sui letti a disposizione.
20
Le entita Sono classi di oggetti Sono aggregazioni dei loro attributi Possono essere generalizzate
21
Le relazioni Sono aggregazioni di entita Sono per la maggior parte binarie Possono essere anche ternarie Se ne considera la cardinalita
22
Gli attributi Sono insiemi di valori Le entita sono ottenute come loro aggregazione Se ne considera la cardinalita
23
Altri elementi Cardinalita –delle relazioni –degli attributi Identificatori
24
Cardinalita Insieme 1 Insieme 2
25
Cardinalita delle relazioni Dato un oggetto di una classe, a quanti oggetti dellaltra classe puo corrispondere, in un certo istante, attraverso la relazione considerata? 0:1 0:n 1:1 1.n
26
Cardinalita delle relazioni Esempi: matrimonio (0:1) ; (0:1) azienda-dipendente (m:n) ; (0:1) impiegato-progetto (1:3) ; (m:n) (oppure (o:n)) dirigente-subordinato (0:n) ; (1:1) genitore-figlio (0:n) ; (0:2) (oppure (2:2))
27
Cardinalita degli attributi Dato un oggetto di una classe, quanti valori dellattributo possono essergli associati in un certo istante? 0:1 0:n 1:1 1.n
28
Cardinalita degli attributi Esempi: persona-codice fiscale (1:1) persona- numero di telefono (0:n) prodotto-codice prodotto (1:1) persona-data di morte (0:1) libro-autore (1:n)
29
Identificatori E un sottoinsieme minimale degli attributi di unentita sufficiente a identificare univocamente un oggetto della classe Si definisce un identificatore per ogni entita Esempi: PERSONA: Codice fiscale PERSONA: Nome, Cognome, Data di nascita, Luogo di nascita
30
Discussione Come si sceglie se definire una nuova entita o un attributo? Esempio: MOBILE COLORE oppure MOBILECOLORE HA
31
Laboratorio: Riviste scientifiche Si vuole progettare un sistema informativo di supporto allorganizzazione di una casa editrice che pubblica riviste scientifiche. Ogni rivista viene identificata attraverso la sua denominazione, ed ha un settore scientifico di riferimento, e un prezzo di abbonamento Ogni numero di una certa rivista ha una data di pubblicazione e l'indice, cioe' la sequenza di articoli che contiene. Tale indice viene deciso da un apposito comitato (il comitato di edizione), costituito da un gruppo di esperti del settore. Gli articoli sono caratterizzati dal titolo (si immagini non esistano due articoli con lo stesso titolo), gli autori, il numero della rivista e il numero dordine nell'indice. Per ogni articolo compreso in qualche indice la segreteria deve provvedere a memorizzare tutte le informazioni sugli autori. Il sistema deve memorizzare tutte le persone (con il relativo nome, lindirizzo, il recapito telefonico e di posta elettronica) che hanno a che fare con le riviste:abbonati, esperti compresi nei comitati di edizione (di cui si conosce anche il settore o i settori in cui sono esperti), autori degli articoli (di cui si conosce, per motivi statistici, anche la data di nascita). Il sistema deve anche fornire alla segreteria lelenco degli abbonati ad ogni rivista, completo delle date di inizio dell'abbonamento e di pagamento.
32
Laboratorio: Il sistema di gestione dei musei del Veneto Si vuole progettare il sistema informativo per la gestione dei musei del Veneto.Gli utilizzatori del sistema informativo saranno i visitatori da una parte, per quanto riguarda le informazioni generali, e le direzioni dei musei dallaltra, per quanto riguarda gli aspetti organizzativi. Il sistema deve, su richiesta, fornire informazioni al pubblico relativamente agli orari di ciascun museo (di cui sono memorizzati il nome, la citta', lindirizzo e il numero di telefono): giorno di chiusura settimanale, orari di apertura, che possono variare nei vari giorni della settimana. Tra le informazioni, vi è anche il costo del biglietto di ingresso (diviso per categorie: adulti e ridotti). Vengono inoltre fornite informazioni relative a eventuali mostre presso il museo (periodo di apertura, titolo della mostra, costo del biglietto di ingresso per la mostra). Queste informazioni vengono inserite e modificate da un opportuno ufficio Mostre Temporanee (che e' parte del sistema) e possono essere richieste, con una domanda al sistema, sia da parte della direzione, sia da parte del pubblico. Inoltre, una attivita' di Gestione del Personale può inserire o modificare dati sul personale (che ha una matricola, nome, cognome, indirizzo e numero di telefono, e una lista di mansioni), e assegna il personale a turni (con una data, un orario di inizio e di fine e la sala a cui la persona è assegnata). Per ogni sala di ogni museo vi deve essere sempre almeno una persona addetta alla sorveglianza durante gli orari di apertura.
33
Laboratorio: Gestione delle prenotazioni alberghiere Si vuole progettare il sistema di prenotazioni per un gruppo di alberghi. Per ogni albergo si conoscono il nome, lindirizzo, la città, il periodo di apertura, il prezzo nelle varie stagioni per ciascun tipo di camera (si suppongano due stagioni, alta e bassa, e due tipi di camere, singola e doppia), il numero delle camere di ciascun tipo. I clienti sono identificati da nome e numero di telefono e possono prenotare una o più camere per uno o più giorni (consecutivi). Si supponga di volere gestire le richieste di informazioni da parte dei clienti, le prenotazioni, le cancellazioni di prenotazioni. Le prenotazioni possono anche arrivare per telefono, ma viene comunque richiesto un fax contenente, oltre ai dati suddetti, anche l'indirizzo e il numero di documento d'identita'. Se un cliente prenotato arriva dopo le sei, la sua prenotazione viene automaticamente annullata. Se un cliente vuole che la sua prenotazione gli venga tenuta anche oltre le sei, deve segnalare anche il numero della sua carta di credito. Si accettano anche clienti senza la prenotazione, se al momento in cui arrivano c'e' posto. Inoltre si vuole poter inserire un nuovo albergo, con tutti i dati relativi, quando questo viene acquisito all'interno della catena.
34
Laboratorio: Gestione di una ditta di trasporti Si vuole progettare il sistema informativo per la gestione di una ditta di trasporti con sede in Torino, che spedisce merci in tutto il Nord Italia. Le richieste di servizio arrivano per telefono o via fax. In una richiesta di servizio, occorre precisare la destinazione dei colli che vengono inviati, il loro ingombro e il loro peso, e lindirizzo dove occorre andare a prelevarli. Inizialmente, le richieste di servizio vengono raccolte e non viene loro data alcuna risposta. Ogni mattina un impiegato esamina tutte le richieste di servizio pendenti e le raggruppa, in primo luogo per destinazione, e poi, tra quelle con la stessa destinazione, riunisce insieme quelle che hanno indirizzi di prelevamento vicini. Esamina poi le risorse disponibili, in termini di autofurgoni e di personale (autisti e facchini), e tenta di soddisfare prioritariamente le richieste appartenenti ai gruppi piu numerosi, tenendo conto della capienza dei furgoni e dellingombro dei colli. Quando, utilizzando questo criterio, ha terminato le risorse disponibili, tenta di associare tra loro richieste singole per poterne soddisfare di piu. Le richieste non soddisfatte vengono poste in coda tra le richieste pendenti per il giorno successivo. Le richieste pendenti da piu di tre giorni assumono maggiore priorita, percio occorre soddisfarle anche se si riferiscono a destinazioni non accoppiabili con le altre. Successivamente, vengono avvertiti i clienti le cui merci saranno trasportate in giornata (richieste soddisfacibili), e il trasporto vero e proprio viene organizzato assegnando il presonale ai vari furgoni e passando le bolle di consegna ai trasportatori.
35
Laboratorio: Centro di istruzione permanente Si progetti il sistema informativo per la segreteria di un centro di istruzione permanente. I docenti propongono i corsi e forniscono il relativo materiale sotto forma di file. Di ogni corso si conosce la durata (espressa in ore di lezione), i docenti, il responsabile (che è uno dei docenti), il programma e il tipo di strumenti richiesti per le eventuali esercitazioni. La direzione valuta le proposte, decide quali corsi realizzare e ne stabilisce il calendario che viene comunicato ai responsabili dei corsi. In seguito vengono pubblicati e distribuiti i volantini con il calendario e i programmi dei corsi. Gli allievi sono di due tipi: privati (che si iscrivono personalmente ai corsi cui sono interessati presentandosi alla segreteria e fornendo i propri dati anagrafici) e dipendenti di unazienda, che li iscrive inviando i dati mediante fax. Le tariffe aziendali prevedono sconti per gruppi superiori a 3 componenti per lo stesso corso. La segreteria prepara una copia del materiale per ogni partecipante e provvede a distribuirla agli iscritti. Alla fine di ogni corso è prevista una prova finale il cui superamento comporta il rilascio di un attestato. Il sistema deve tenere memoria di tutti i corsi tenuti con i relativi docenti e partecipanti, registrando in particolare coloro che hanno conseguito lattestato.
36
Il modello relazionale dei dati Dati organizzati in tabelle dette relazioni Nomi delle colonne: attributi; Numero di colonne: grado Righe: tuple; Numero di righe: cardinalità MATRIC. FONDAM. INFO CHIMICAFISICA I ANALISI GEOMETR …. 5132AB 6123CD 5432CB … …. 30 26 29 22 24 28 26 24 30 lode 28 29 24 30 lode 27 19 23 30 22 18 25 STUDENTI
37
Progettazione logica Consiste nella produzione di schemi di tabelle a partire dallo schema Entità- Relazione Il passaggio da modello a modello comporta un diverso tipo di rappresentazione La nuova rappresentazione impoverisce linformazione
38
Trasformazione delle entità Per ogni entità una tabella che ha lo stesso nome, la tabella ha per attributi gli attributi dellentità, la tabella ha per chiave gli attributi che identificano lentità Es: PAZIENTE(Cod-fisc, Nome,Cognome, Tessera-Asl, N-letto)
39
Trasformazione delle relazioni Per ogni relazione una tabella ponte che ha il nome della relazione la tabella ha per attributi tutti gli attributi chiave delle entità collegate e gli attributi della relazione la tabella ha per chiave tutti gli attributi chiave delle entità collegate. Es: RICOVERO(Cod-fisc, N-stanza,Piano,Edif)
40
Ottimizzazione delle relazioni Per ogni relazione di cardinalità (1:1) da una parte la tabella ponte può essere eliminata inserendo la chiave di una delle due entità nello schema dellaltra. Es: PAZIENTE(Cod-fisc, Nome, Cognome, Tessera-Asl, N-letto, N-stanza, Piano, Edif) possiamo farlo perché a ogni paziente corrisponde una e una sola stanza
41
Linguaggi di interrogazione Permettono di trovare un dato basandosi sulle sue proprietà. Es: tabella STUDENTI--> trovare tutti gli studenti che hanno preso più di 28 a Fondamenti di Informatica Permettono di trovare dati basandosi su confronti tra i contenuti di più tabelle. Es: tabella ELEZIONI, tabella PRESIDENTI --> Trovare gli anni in cui è stato eletto un presidente repubblicano proveniente dallIllinois.
42
Il linguaggio SQL Select A1,…An (attributi da includere nel risultato) from R1,…Rm (nomi di relazioni da cui estrarre i dati) where P (condizione che i dati cercati soddisfano) Esempio: Select MATRIC from STUDENTI where FONDAM-INFO > 28
43
Esempi Trovare gli anni in cui è stato eletto un presidente repubblicano proveniente dallIllinois (condizioni di join): SELECT ANNO FROM ELEZIONI, PRESIDENTI WHERE ELEZIONI.NOME-P = PRESIDENTI.NOME-P AND ELEZIONI.DATA-N = PRESIDENTI.DATA-N AND STATO = ILLINOIS AND PARTITO = REPUBBLICANO Oppure (interrogazione nidificata): SELECT ANNO FROM ELEZIONI WHERE NOME-P, DATA-N IN ( SELECT NOME-P, DATA-N FROM PRESIDENTI WHERE PARTITO = REPUBBLICANO AND STATO = ILLINOIS )
44
Altre parole chiave utili Laggiunta del comando UNIQUE (o DISTINCT) subito dopo il comando SELECT permette di rimuovere i duplicati. MINUS differenza INTERSECT intersezione UNION unione ORDER BY ordinamento GROUP BY raggruppamento in base al valore di un attributo: una volta costruita una tale partizione è possibile valutare funzioni aggregate sugli attributi numerici delle tuple di ciascuna classe di equivalenza: MIN (minimo), MAX (massimo), SUM (somma), AVG (media); è inoltre possibile contare il numero di elementi, tramite la funzione COUNT. HAVING condizioni da usare subito dopo il GROUP BY
45
Altri esempi Trovare i nomi delle mogli dei presidenti provenienti dalla California eletti dopo il 1960. SELECT NOME-M FROM PRESIDENTI, ELEZIONI WHERE ELEZIONI.NOME-P = PRESIDENTI.NOME-P AND ELEZIONI.DATA-N = PRESIDENTI.DATA-N AND ANNO > 1960 AND STATO = CALIFORNIA
46
Altri esempi (unione) Trovare le persone che sono state presidenti oppure vicepresidenti in amministrazioni inaugurate dopo il 1880. SELECT NOME-P FROM AMMINISTRAZIONI WHERE DATA-IN > 1880 UNION SELECT VICE-PRES FROM AMMINISTRAZIONI WHERE DATA-IN > 1880
47
Altri esempi (intersezione) Trovare le persone che sono state presidenti e anche vicepresidenti in qualche amministrazione inaugurata dopo il 1880. SELECT NOME-P FROM AMMINISTRAZIONI WHERE DATA-IN > 1880 INTERSECT SELECT VICE-PRES FROM AMMINISTRAZIONI WHERE DATA-IN > 1880
48
Altri esempi (differenza) Trovare le persone che sono state presidenti ma mai vicepresidenti in amministrazioni inaugurate dopo il 1880. SELECT NOME-P FROM AMMINISTRAZIONI WHERE DATA-IN > 1880 MINUS SELECT VICE-PRES FROM AMMINISTRAZIONI WHERE DATA-IN > 1880
49
Altri esempi (aggregazione) Trovare la media dei voti ottenuti dai presidenti eletti per ciascun partito SELECT PARTITO, AVG (VOTI-PRES) FROM PRESIDENTI, ELEZIONI WHERE ELEZIONI.NOME-P = PRESIDENTI.NOME-P AND ELEZIONI.DATA-N = PRESIDENTI.DATA-N AND GROUP BY PARTITO
50
Lesecuzione delle interrogazioni Le interrogazioni vengono tradotte in un formato interno da un ottimizzatore di interruzioni. Lottimizzatore, conoscendo le dimensioni delle tabelle, produce un piano daccesso in termini di modello logico, poi trasmesso ad un gestore dei metodi daccesso, che trasforma il piano daccesso fornito dallottimizzatore a livello fisico. Il buffer manager, invece, si occupa del trasferimento dei dati da blocchi di memoria di massa a pagine di memoria centrale e viceversa ed è in stretto contatto con il gestore della memoria virtuale.
51
Data Manipulation Language INSERT INTO relazione,,,….. Serve per inserire una tupla DELETE FROM relazione WHERE attributo con condizione Serve per cancellare delle tuple UPDATE relazione SET attributo = espressione nuova da assegnare WHERE attributo con condizione Serve per modificare una relazione
52
Data Definition Language CREATE TABLE nome-relazione A1 tipoA1, A2 tipoA2, A3 tipoA3, An tipoAn Es: CREATE TABLE PAZIENTE Cod-fisc string, Nome string, Cognome string, ….. DROP TABLE nome-relazione Es: DROP TABLE PAZIENTE
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.