La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Dati Strutturati e Semantica delle Informazioni Dott. Matteo Palmonari.

Presentazioni simili


Presentazione sul tema: "Dati Strutturati e Semantica delle Informazioni Dott. Matteo Palmonari."— Transcript della presentazione:

1 Dati Strutturati e Semantica delle Informazioni Dott. Matteo Palmonari

2 –2–2 Liberamente rielaborato da Batini C., sorgente originale: Atzeni et al., Basi di dati, Mc-Graw Hill I modelli logici dei dati

3 –3–3 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Cosa e un modello logico E un insieme di strutture di rappresentazione utilizzabili per descrivere un insieme di dati, o schema logico, che, a sua volta, descrive una realta di interesse

4 –4–4 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Processo di rappresentazione Rappresentazione nel modello Strutture di Rappresentazione Schema

5 –5–5 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Processo di rappresentazione nel modello ER Descrizione (o modellazione) nel modello ER Entita + Relationship + Generalizzazione GaraAuto corre Sigla Marca Pilota Numero Sede

6 –6–6 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Processo di rappresentazione nel modello relazionale Relazione Descrizione (o modellazione) nel modello logico Gara (Numero, Sede, SiglaAutomobile, Marca, Guidatore)

7 Data model Un modello dei dati (data model) definisce un insieme di strutture di base in cui organizzare linformazione e regole logiche che ne regolamentano linterdipendenza è associato a uno o più linguaggi di interrogazione (query); la semantica di tale linguaggio è basata su criteri di correttezza delle risposte specifici rispetto al tipo di strutture alla base del modello –7–7 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill

8 Alcuni modelli Esistono vari data model: Gerarchico Relazionale (database più noti, e.g. access) Ad oggetti … XML RDF … –8–8 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill

9 –9–9 Riepilogo del modello relazionale

10 –10 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Perche le relazioni? Il mondo e la totalita dei fatti, non delle cose (L. Wittgenstein) Cose Mario 35 anni Fatti Mario ha 35 anni

11 –11 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill 1. La struttura concettuale di base: la relazione

12 –12 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Relazione matematica D 1, …, D n (n insiemi anche non distinti, detti anche domini) prodotto cartesiano D 1 ×…×D n : linsieme di tutte le n-uple (d 1, …, d n ) tali che d 1 D 1, …, d n D n relazione matematica su D 1, …, D n : un sottoinsieme di D 1 ×…×D n. D 1, …, D n sono i domini della relazione

13 –13 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Relazione matematica, esempio una relazione r D 1 × D 2 a a a b b b x y z x y z a a b x z y D 1 ={a,b} D 2 ={x,y,z} prodotto cartesiano D 1 × D 2

14 –14 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Relazione matematica, esempio Ciascuno dei due domini String Integer ha due ruoli diversi, distinguibili attraverso la posizione: La struttura è posizionale Juve Lazio Juve Roma Lazio Milan Roma Milan Partite string × string × integer × integer

15 –15 –Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill Domanda Che informazione porta la relazione matematica? Prova a descriverla in italiano Risposta Parla di quattro partite, nella prima delle quali la Juve ha giocato in casa con la Lazio e ha vinto 3 a 1, nella seconda delle quali ecc. ecc. Noi riusciamo a distinguere tra squadre in casa e fuori casa dalla posizione nella n-pla Juve Lazio Juve Roma Lazio Milan Roma Milan

16 –16 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Struttura non posizionale Juve Lazio Juve Roma Lazio Milan Roma Milan A ciascun dominio si associa un nome (attributo), che ne descrive il "ruolo" RetiCasaRetiFuoriCasaFuori

17 –17 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Relazioni (o Tabelle) Una relazione (o tabella) nel modello relazionale rappresenta una relazione (in matematica) in cui: i valori di ogni colonna (attributo) sono fra loro omogenei (es. Juve, Lazio, ecc.) le righe (n-ple o tuple) sono diverse fra loro le intestazioni delle colonne (nomi di attributi) sono diverse tra loro In una relazione nel modello relazionale: lordinamento tra le righe è irrilevante lordinamento tra le colonne è irrilevante

18 –18 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Vogliamo rappresentare con tre relazioni gli studenti Rossi Mario, Neri Paolo, Verdi Luisa, Rossi Maria, con matricola, nome, cognome, data nascita, tutti gli esami superati, con voto, e per i corsi corrispondenti il titolo e il docente. Prova a disegnare tre relazioni che rispettino le precedenti specifiche, associando agli studenti e corsi un codice identificativo e scegliendo valori opportuni per i vari attributi diversi da nome e cognome, che sono stati esemplificati in precedenza. Di quanti attributi hai avuto bisogno in tutto? Domanda 3.2.1

19 –19 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 Studenti CodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi Corsi StudenteVotoCorso Esami Possibile soluzione Nota il ripetersi dei valori nelle tabelle 10 attributi

20 –20 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 Studenti CodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi Corsi StudenteVotoCorso Esami Domanda Quanti esami ha superato la studentessa Maria Rossi?

21 –21 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 Studenti CodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi Corsi StudenteVotoCorso Esami Risposta 2 Per rispondere hai anzitutto cercato Maria Rossi nella prima relazione, poi, sulla base del valore del suo numero di matricola hai cercato quante n-ple con quel numero compaiono nella tabella Esami.

22 –22 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 studentiCodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi corsi StudenteVotoCorso esami 26 Riferimenti tra valori nellesempio Studenti-Esami- Corsi

23 –23 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Schemi vs. Istanze nel modello relazionale

24 –24 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Concetti che vengono definiti nel seguito 1.Schema di relazione 2.Schema di base di dati 3.N-pla (o ennupla) 4.Istanza di relazione 5.Istanza di base di dati

25 –25 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Schema di relazione e di base di dati 1. Schema di relazione: un nome R con un insieme di attributi A 1,..., A n : R(A 1,..., A n ) 2. Schema di base di dati: insieme di schemi di relazione: R = {R 1 (X 1 ),..., R k (X k )}

26 –26 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Esempio di schema di relazione Esame (Matricola Studente, Codice Corso, Voto, Data)

27 –27 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Esempio di schema di base di dati che descrive persone, loro comuni di nascita e loro occupazioni Persona (Codice Fiscale, Nome, Cognome, Comune di Nascita, Data di Nascita) Comune (Nome Comune, Provincia, Regione) Occupazione (Codice Fiscale, Tipo di Occupazione, Data Inizio, Data Fine)

28 –28 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill 3. Ennupla Una ennupla (o n-pla) su un insieme di attributi X è una funzione che associa a ciascun attributo A in X un valore del dominio di A Esempio Codice:01 Titolo:Analisi Docente:Rossi Il simbolo t[A] denota il valore della ennupla t sull'attributo A Esempio t[Codice] per la ennupla sopra e 01

29 –29 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill MatricolaCognomeNomeData di nascita 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/1979 studenti CodiceTitoloDocente 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi corsi StudenteVotoCorso esami Esempi di n-pla e di singolo valore n-pla t t[voto]

30 –30 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill 4. Istanza di relazione Istanza di relazione (o relazione) su uno schema R(X): insieme r di ennuple su X 01AnalisiMario 02ChimicaBruni 04ChimicaVerdi Corsi Esempio

31 –31 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill 5. Istanza di base di dati Istanza di base di dati (o base di dati) su uno schema R= {R 1 (X 1 ),..., R n (X n ) : insieme di relazioni r = {r 1,..., r n } (con r i relazione su R i ) 6554RossiMario05/12/ NeriPaolo03/11/ RossiMaria01/02/ VerdiLuisa12/11/ AnalisiMario 02ChimicaBruni 04ChimicaVerdi Studenti Esami Corsi

32 –32 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Relazioni come rappresentazione di una realta osservata Possiamo vedere una relazione come la rappresentazione di un frammento di realta osservata Relazione Giovanni Antonio Elena Ada Studenti Realta osservata

33 –33 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Vincoli di integrità – introduzione - 1 Esistono istanze di basi di dati che, pur sintatticamente corrette, non rappresentano stati possibili nella realta Relazione Studenti Giovanni Antonio Elena Fido Ada ? cagnolino

34 –34 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Vincoli di integrità – introduzione - 2 Esempio: puo esistere nella realta uno studente che a un esame prende come voto 27 e lode? Rossi Fisica 27 e lode Studenti e esami superati Relazione

35 –35 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Domanda Considera ora questaltra istanza Quali aspetti delle tabelle non vanno bene? StudenteVotoLodeCorso e lode e lode Esami Matricola Cognome Rossi Neri Bianchi Nome Mario Piero Luca Studenti e lode Un voto non puo avere valore 32 Un voto non puo avere valore 27 e lode Non ci possono essere due studenti con la stessa matricola Non ci puo essere qui un numero di matricola che non compare in Studenti

36 –36 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Abbiamo scoperto un altro concetto fondamentale: il vincolo di integrità Proprietà che deve essere soddisfatta da tutte le istanze di uno schema che rappresentano informazioni corrette per lapplicazione Un vincolo di integrita è una funzione booleana (o predicato) che associa ad ogni istanza r: Il valore vero se la istanza e corretta (rappresentazione della realta) Il valore falso se la istanza e scorretta (rappresentazione della realta)

37 –37 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill 1. Permettono una rappresentazione più accurata della realtà, e quindi contribuiscono alla qualità dei dati, cioe alla proprieta dei dati di essere una corretta rappresentazione della realta 3. Sono utili nella progettazione perche portano a generare uno schema di elevata qualita Vincoli di integrità, perché ne abbiamo bisogno?

38 –38 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Tipi di vincoli 1. Vincoli intrarelazionali, cioe definiti allinterno di una relazione 2. Vincoli interrelazionali, cioe definiti tra due o piu relazioni

39 –39 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Tipi di vincoli intrarelazionali Vincoli su valori (o di dominio), cioe su singoli valori di attributi Vincoli di ennupla, cioe definiti sulle ennuple di una relazione Vincoli relativi allinsieme di ennuple di una relazione Vincoli di relazione caso importante, vincoli di chiave (vedi avanti)

40 –40 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Vediamo per concludere questa lezione un esempio di vincolo di valore StudenteVotoLodeCorso e lode e lode Esami Matricola Cognome Rossi Neri Bianchi Nome Mario Piero Luca Studenti Il voto puo assumere solo valori tra 18 e 30, 32 e un valore sbagliato

41 –41 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Domanda Per i quattro vincoli di integrita dellesempio, definire a quali tipologie appartengono StudenteVotoLodeCorso e lode e lode Esami Matricola Cognome Rossi Neri Bianchi Nome Mario Piero Luca Studenti e lode Un voto non puo avere valore 32 Un voto non puo avere valore 27 e lode Non ci possono essere due studenti con la stessa matricola Non ci puo essere qui un numero di matricola che non compare in Studenti Vincolo di valore Vincolo di ennupla Vincolo interrelazionale Vincolo di relazione Risposte

42 –42 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Semantica nelle basi di dati relazionali La semantica di una base di dati è definita in accordo con la struttura relazionale (algebra relazionale) ed è determinata, relativamente ai suoi elementi costitutivi (valori, tuple, relazioni), sostanzialmente da: Livello dello schema: schema logico definisce la macro-organizzazione della rappresentazione di un dominio vincoli di integrità definiscono vincoli relazionali di dettaglio tra specifici oggetti e fatti rappresentati Livello delle istanze: insieme delle istanze costituisce linsieme di oggetti e fatti effettivamente rappresentati come veri nella bas di dati

43 –43 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Semantica, Schemi e Istanze Lo schema di una base di dati definisce le regole generali cui deve aderire ciascun insieme di istanze (per essere considerato valido); è in questi termini che lo schema costituisce una parte fondamentale della semantica di una base di dati Tali regole (ad esempio i vincoli di integrità) supportano linterrogazione delle basi di dati (verifica della sussistenza o non sussistenza di alcuni fatti nella base di dati) permettono di controllare la validità dello schema non permettono di dedurre nuove conoscenze

44 –44 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Query nel modello relazionale Il linguaggio di interrogazione piùdiffuso per le basi di dati è SQL (Structured Query Language) Ragionamento piuttosto debole

45 SQL Query Example SQL (base/select) Principio: soddisfazione/correttezza Meccanismo/semantica: algebra relazionale –45 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill

46 –46 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Esempi di altri data model

47 The Object-Oriented Data Model –47 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Objects/id Attributes Methods Classes Class Hierachies Alla base di JAVA/C++ etc

48 Object-Oriented Schema (Example) –48 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill

49 Cosa succede nel Web? –49 –Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill Ci sono ancora schemi e istanze? Che tipo di interrogazioni si possono fare? Che tipo di ragionamenti si possono fare?


Scaricare ppt "Dati Strutturati e Semantica delle Informazioni Dott. Matteo Palmonari."

Presentazioni simili


Annunci Google