La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

IDUL 09 BASI DI DATI. USO DI STRUMENTI INFORMATICI PER LA GESTIONE DI INFORMAZIONI Forse la piu importante applicazione di metodi informatici nelle materie.

Presentazioni simili


Presentazione sul tema: "IDUL 09 BASI DI DATI. USO DI STRUMENTI INFORMATICI PER LA GESTIONE DI INFORMAZIONI Forse la piu importante applicazione di metodi informatici nelle materie."— Transcript della presentazione:

1 IDUL 09 BASI DI DATI

2 USO DI STRUMENTI INFORMATICI PER LA GESTIONE DI INFORMAZIONI Forse la piu importante applicazione di metodi informatici nelle materie umanistiche è per gestire grandi quantita di dati STRUTTURATI (in basi di dati) NON STRUTTURATI (in archivi di testi)

3 PROSOPOGRAFIA DELLIMPERO BIZANTINO Basilios 7 Sex M FloruitE/L IX Dates813 (n.) / 886 (ob.) PmbZ No.832 Variant NamesBasileios EthnicityMacedonian;Armenian Locations: Kepoi (Thrakesioi); Macedonia (property); Peloponnesos; Hagios Diomedes (Monastery of, Constantinople) (topographical); Constantinople (officeplace); Adrianoupolis (Macedonia) (residence); Bulgaria (residence); Constantinople (residence); Adrianoupolis (Macedonia); Bulgaria; Constantinople; Adrianoupolis (Macedonia) (birthplace) OccupationFarmer TitlesPatrikios (dignity); Augustus (office); Basilikos protostrator (office); Basilikos strator (office); Emperor (office); Parakoimomenos (office); Protostrator (office) Textual SourcesBar Hebraeus, Chronographia, tr. E. A. W. Budge, The Chronography of Abu 'l-Faraj (London, 1932; repr. Amsterdam, 1976) (history); Chronicon Anonymi ad annum 1234 pertinens, ed. and tr. J.-B. Chabot, I = CSCO 81-82 (Paris, 1916-20), II = CSCO 109 (Louvain, 1937) (chronicle); Genesii, Josephi, Regum Libri Quattuor, eds. A. Lesmüller-Werner and I. Thurn, CFHB 14 (Berlin, 1978) (history); Georgius Monachus Continuatus, in Theophanes Continuatus, ed I Bekker (Bonn, 1839), pp. 761-924 (history); Leo Grammaticus, Chronographia, ed. I. Bekker (Bonn, 1842) (chronicle); Pseudo-Symeon, Chronographia, ed. I. Bekker (Bonn, 1838), pp. 603-760 (history); Theophanes Continuatus, ed. I. Bekker (Bonn, 1838) (history); Vita Ignatii Patriarchae, by Nicetas (BHG 817), PG 105.488-574) (hagiography); Vita Irenae Chrysobalanton, The Life of St Irene Abbess of Chrysobalanton, ed. with introd., tr., notes and indices, J. O. Rosenqvist, Acta Universitatis Upsaliensis (hagiography); Vita Nicolai Studitae (BHG 1365), PG 105. 863-925 (hagiography); Zonaras = Ioannis Zonarae Epitome Historiarum, libri XIII-XVIII, ed. Th. Büttner-Wobst, (Bonn, 1897) (history) Basilios 7 is the emperor Basil I (867-886). The history of his life and reign was written by his grandson, the emperor Constantine VII Porphyrogenitus (= Theophanes Continuatus, Book V); Constantine described him as of great benefit to the empire and composed his history in order to inform posterity of the origins of the ruling dynasty and to provide a model of conduct to be followed by future descendants of Basilios 7 (in particular, no doubt, Constantine's own son, the future emperor Romanos II): Theoph. Cont. V 1.

4 DATABASE STORICI:PROSOPOGRAPHY OF THE BIZANTYNE EMPIRESTORICI:PROSOPOGRAPHY OF THE BIZANTYNE EMPIRE Prosopografia: un registro di tutti gli individui vissuti in un certo periodo In questo caso: tutti gli individui vissuti a Bisanzio tra il 641 ed il 1261 Costruita a partire dalle loro menzioni in documenti dellepoca Informazioni su 8500 individui, dimensioni equivalenti a 11 000 pagine di testo

5 BASI DI DATI DI OPERE DARTE

6 STRUTTURE DATI TEMPORANEE E PERMANENTI Per potere rappresentare informazioni in modo duraturo occorre sviluppare delle tecniche per mantenerle in memoria secondaria e poterle consultare in modo pratico Lo strumento informatico utilizzato per questo scopo sono le BASI DI DATI (Data-Base)

7 BASI DI DATI Una base di dati e una collezione di dati immagazzinati in modo PERMANENTE su disco Una base di dati permette di Definire degli oggetti (concetti) e delle relazioni Inserire nuovi dati Ritrovare questi dati anche combinandoli con altri Visualizzare i dati in modi particolari Il tipo di base di dati più comune sono le basi di dati RELAZIONALI

8 PROGETTAZIONE DI UNA BASE DATI MODELLAZIONE CONCETTUALE Progetto dello SCHEMA MODELLAZIONE LOGICA Scelta della rappresentazione: TABELLE, ALBERI, etc PROGETTAZIONE FISICA Utilizzando il DBMS scelto

9 MODELLI CONCETTUALI Un modello concettuale e unanalisi del tipo di dati che si vogliono rappresentare, che prescinde dalla realizzazione fisica dei dati particolari Tipicamente, questa analisi si articola attorno ad una definizione de Gli OGGETTI che si vogliono rappresentare I loro ATTRIBUTI Le RELAZIONI tra questi oggetti

10 ESEMPIO DI MODELLO CONCETTUALE: IL DURHAM LIBER VITAE

11 UN SEMPLICE MODELLO CONCETTUALE RISULTATI_ESAMI Matricola Materia Data Voto STUDENTE Matricola Cognome, Nome Data di Nascita

12 MODELLAZIONE LOGICA Una volta decisi quali sono i concetti importanti da rappresentare e quali sono i loro attributi, occorre pensare come e possibile rappresentare questa informazione usando una base di dati Questo è il compito della modellazione logica (attenzione: questa non esprime ancora proprietà di dati specifici, ma delle loro proprietà e/o relazioni) Esprimibile in diagrammi

13 SCHEMA LOGICO (FILM) Diagramma Entità-Relazione (Chen 1970) Entità Relazioni tra entità Attributi di entità

14 SCHEMA LOGICO (FILM) Con cardinalità delle relazioni (MIN,MAX)

15 SCHEMA LOGICO (GERARCHIE)

16

17 SCHEMA LOGICO (COMPLETO)

18 MODELLI DI RAPPRESENTAZIONE DATI A partire dagli anni Settanta il modello dominante è stato il quello RELAZIONALE, proposto da Edgard F. Codd nel 1970 Per certi tipi di applicazioni (in particolare per basi di dati accessibili via Web) si fa molto uso di XML (vedi prossime lezioni)

19 IL MODELLO RELAZIONALE Linformazione e rappresentata nelle basi di dati sotto forma di RELAZIONI r(x,y,z,w) Due tipi di relazioni rappresentate Relazioni rappresentate con TABELLE che rappresentano un OGGETTO ed i suoi attributi risultato_esame(IUB,4/2/2008,112233,29) Relazioni tra le tabelle Per esempio, tra tabella studente e tabella risultato_esame

20 TABELLE CHE RAPPRESENTANO RELAZIONI RECORD ATTRIBUTO

21 RECORDS I records sono strutture dati usate per rappresentare oggetti che hanno ATTRIBUTI

22 ESEMPIO: RISULTATO ESAME MateriaDataMatr.VotoLode? IDUL4/2/1011223329no IUC4/2/1011442230si RECORD ATTRIBUTO risultato_esame(IDUL,4/2/2010,112233,29) VALORE (o CAMPO) SCHEMA della RELAZ.

23 UN ALTRO ESEMPIO MATRICOLACOGNOMENOMEDATA NASCITA …. 112233RossiMario11/11/1973 …. STUDENTE studente(112233,Rossi,Mario,11/11/1973)

24 VALORI CHIAVE Ogni riga di ogni tabella (cioe ogni rappresentazione di un oggetto) deve avere almeno un campo che permetta di identificare quella riga in modo univoco non deve dunque esserci un altro record con lo stesso valore per quellattributo, anche se il valore può apparire in altri attributi Tale attributo è chiamato CHIAVE

25 VALORI CHIAVE MATRICOLACOGNOMENOMEDATA NASCITA …. 112233RossiMario11/11/1973 …. STUDENTE

26 VALORI CHIAVE MULTIPLI NOMECOGNOMEESAMEAPPROVATO? CarloRossiIUBsi MarioRossiIUBno CarloBianchiIUCsi A volte la chiave è definita da più campi insieme.

27 VALORI CHIAVE ARTIFICIALI IDMATERIADATAMATRICOLAVOTO 1…. 2IUB4/2/200811223329 3…. RISULTATO_ESAME Tipicamente, numeri consecutivi, uno per record

28 VALORI NULLI NOMEEtàPADRE Matusalemme968Enoch EvaNULL …. PERSONAGGI BIBLICI Il valore NULL può essere dato a campi il cui valore non si conosce, o per casi in cui il valore non è definito (a volte i due casi sono distinti)

29 RELAZIONI TRA TABELLE Una base di dati relazionale permette di specificare, oltre che informazioni su attributi di oggetti, informazioni sulle relazioni tra oggetti Per esempio, che un particolare risultato di esame e stato ottenuto dallo studente Mario Rossi

30 RELAZIONI TRA TABELLE IDMATERIADATAMATRICOLAVOTO …. 456789IUB4/2/200811223329 …. MATRICOLACOGNOMENOMEDATA NASCITA …. 112233RossiMario11/11/1973 ….

31 DATABASE MANAGEMENT SYSTEMS RELAZIONALI Praticamente tutti i DATABASE MANAGEMENT SYSTEMS (DBMS) moderni sono basati sul modello relazionale E.g., Oracle, Access, MySQL, PostgreSLQ (open source)MySQLPostgreSLQ Disponibili per i principali sistemi operativi (Windows, UNIX)

32 UNA TABELLA IN ACCESS

33 RELAZIONI TRA TABELLE

34 OPERAZIONI SU UN DATABASE RELAZIONALE Operazioni tipiche su un database relazionale RITROVARE un sottoinsieme delle righe Possibilmente restringendo il ritrovamento ad un sottoinsieme delle colonne AGGIUNGERE dati DEFINIRE nuove tabelle e nuove relazioni VISUALIZZARE un sottoinsieme dei dati per scopi particolari

35 PROIEZIONE E SELEZIONE PROIEZIONE ( π test ): estrazione di una serie di colonne (attributi) da un DB SELEZIONE ( σ test ): estrazione di una serie di righe (record) Dove test è un test che, se ha successo, aggiunge la colonna/riga sotto esame alla proiezione/selezione (rispettivamente)

36 ESEMPIO: DATABASE FILM Selezione su titolo ed anno Proiezione su selezione per valore dellattributo nazione

37 ESEMPIO: DATABASE FILM Intersezione ( ) tra gli attori di film diversi attori NON presenti in un film (differenza, - )

38 DA ER AL DB RELAZIONALE La progettazione nello schema ER contiene costrutti che vanno tradotti nel sistema relazionale. Ciò comporta: La eliminazione delle gerarchie, riportando le informazioni su nodo padre. La traduzione delle entità come tabelle, i cui valori saranno i valori dei singoli individui appartenenti a quella entità La connessione tra le tabelle così stabilite

39 Gerarchie come relazioni

40 Distribuzione o Produzione"

41 ENTITA COME RELAZIONI In un diagramma ER, le entità sono collezioni di individui, ciascuno dotato di attributi con valori. Rese come tabelle: EDIZIONE(codice, titolo, nazione, durata, lingua, vietato) FILM(codice, titolo, durata, anno, nazione)

42 COLLEGARE TABELLE EDIZIONE(codice, titolo, nazione, durata, lingua, vietato) FILM(codice, titolo, durata, anno, nazione) Come specificare che una edizione è ledizione di un certo film? Aggiungendo alla tabella EDIZIONE una chiave esterna (qui, il numero di codice del film). La chiave si specifica aggiungendo ai valori di EDIZIONE il nome della relazione che contiene la chiave: EDIZIONE(codice, titolo, nazione, durata, lingua, vietato, film) Impossibile fare il contrario, visto che un film ha tipicamente molte edizioni: un campo può contenere un solo valore! FILM(codice, titolo, durata, anno, nazione, edizione)

43 COLLEGARE TABELLE CON RELAZIONI N-a-N Come specificare che un film ha la relazione di CAST con molti attori, ed una PERSONA ha spesso recitato in molti FILM? E necessario indicarlo in maniera indiretta, tramite una nuova relazione (qui, CAST), che conterrà DUE chiavi esterne: PERSONA(nome, nazione, data_di_nascita) FILM(codice, titolo, durata, anno, nazione) CAST(persona, film, personaggio)

44 RITROVAMENTO INFORMAZIONI CON SQL Le informazioni in una base di dati possono essere ritrovate mediante INTERROGAZIONI In un database relazionale moderno le interrogazioni sono fatte utilizzando un linguaggio di interrogazione chiamato SQL (Simple Query Language)

45 SINTASSI DI SQL Diversi tipi di comandi: DDL (Data Definition Language: comandi per la creazione e lupdate del DB) DML (Data Manipulation Language: comandi per la interrogazione del DB) Create TABLE persona ( Nomevarchar(50) PRIMARY KEY, Nazione varchar(50), Data_Nascitadate ); SELECT nome, nazione, data_nascita FROM persona WHERE nazione = Italia;

46 CREARE UNA TABELLE CON SQL CREATE TABLE persona ( Codiceinteger PRIMARY KEY, Titolovarchar(50), NOT NULL, Annovarchar(4), Duratainteger, Nazionevarchar(50), DEFAULT Italia );

47 CREARE UNA ASSOCIAZIONE TRA TABELLE CON SQL CREATE TABLE cast ( persona varchar(50), REFERENCES persona(nome), filminteger, REFERENCES film(codice) personaggiovarchar(50) PRIMARY KEY(persona, film) );

48 POPOLAMENTO DI UN DB Comandi INSERT, UPDATE, DELETE 1. INSERT INTO film VALUES (5, Il sesto senso, 1999, 107, USA); 2. INSERT INTO film(codice, titolo, anno) VALUES (5, Il sesto senso, 1999); 3. UPDATE film SET durata = 130 WHERE titolo = Il senso senso; 4. DELETE FROM persona WHERE nazione = Italia; 2 inserisce valori NULL per gli attributi non specificati; 4 distrugge unintera tupla (record) della tabella persona se sono verificate le condizioni

49 INTERROGAZIONI DI UN DB Comando di interrogazione: SELECT Clausole piu usate: FROM (specifica la tabella) WHERE (specifica restrizioni)

50 INTERROGAZIONE SELECT Materia, Data, Matricola FROM Esami;

51 INTERROGAZIONE SELECT Materia, Data, Matricola FROM Esami;

52 SQL: ESEMPIO DI USO DI ATTRIBUTI SELECT Nome, Cognome FROM Studenti WHERE Matricola=112233;

53 SQL: ESEMPIO CON ATTRIBUTI SELECT isbn, title, price FROM books WHERE price > 100.00 ORDER BY title;

54 INTERROGAZIONI CHE COINVOLGONO PIU TABELLE

55 AGGIUNGERE TABELLE

56 INTERROGAZIONE A TABELLE MULTIPLE

57 SQL VIEW

58 SQL: ESEMPIO DI INTERROGAZIONE DA TABELLE LINKATE SELECT Studenti.Nome, Studenti.Cognome FROM Studenti INNER JOIN Esami ON Studenti.Matricola=Esami.Matricola WHERE Esami.Materia='IUB' And Esami.Voto>25;

59 CREARE UNA BASE DATI Creare una base di dati realizza un modello concettuale Richiede tradurre oggetti e relazioni in tabelle e legami tra tabelle

60 CREARE UNA BASE DI DATI IN ACCESS 1. Creare le tabelle usando Create Table in Design View 2. Salvare 3. Cambiare a Datasheet view per inserire i dati 4. Continuare a creare altre tabelle 5. Linkare le tabelle

61 1. TABLE DESIGN VIEW

62

63 2. DATASHEET VIEW

64 REALIZZAZIONE DI MODELLI CONCETTUALI Tabelle Alberi (XML)

65 PASSI SUCCESSIVI Dati non strutturati XML e TEI ONTOLOGIE e SEMANTIC WEB

66 DATI NON STRUTTURATI Molto spesso i dati da gestire non sono organizzati in tabelle: Archivi di testi ed immagini Discuteremo di archivi di testi ed immagini e del ritrovamento in questo caso la prossima lezione

67 DARE STRUTTURA A DATI NON STRUTTURATI I linguaggi di markup come SGML o XML permettono di imporre una struttura su documenti non strutturati Vedremo la lezione successiva

68 RAPPRESENTAZIONE DELLA CONOSCENZA ED ONTOLOGIE La ricerca sul modo ideale per rappresentare le informazioni ha portato alla nascita di ricerca sulla KNOWLEDGE ENGINEERING o rappresentazione della conoscenza anche in senso non applicato Particolarmente interessante per domini piu complessi che studenti e gli esami? Larea della KNOWLEDGE ENGINEERING raggruppa ricercatori da database, Intelligenza Artificiale, e nellarea del SEMANTIC WEB Un area molto legata allo studio delle ONTOLOGIE

69 LETTURE Tomasi, capitolo 3 Wikipedia: http://it.wikipedia.org/wiki/Database http://it.wikipedia.org/wiki/Modello_relazionale ACCESS: http://office.microsoft.com/http://office.microsoft.com/


Scaricare ppt "IDUL 09 BASI DI DATI. USO DI STRUMENTI INFORMATICI PER LA GESTIONE DI INFORMAZIONI Forse la piu importante applicazione di metodi informatici nelle materie."

Presentazioni simili


Annunci Google