1 Basi di Dati Semistrutturate e XML Carlo Sartiani Dipartimento di Informatica Università di Pisa Questo lavoro è stato in parte finanziato con i fondi.

Slides:



Advertisements
Presentazioni simili
Il raffinamento dello schema e la normalizzazione nei database relazionali Eugenio Di Sciascio.
Advertisements

CORSO DI RECUPERO CONTROLLI AUTOMATICI Prof. Filippo D’Ippolito
Principale limitazione di AR e SQL-92: interrogazioni ricorsive
EUCIP IT Administrator Modulo 4 - Uso Esperto della Rete Reti informatiche: Introduzione AICA © 2005.
WWW XML-Namespace Fabio Vitali. WWW Fabio Vitali2 Introduzione Qui esaminiamo: u Lesigenza e il funzionamento dei Namespace in XML.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità C1 Il linguaggio SQL.
Nana Mbinkeu Rodrigue Carlos 1 DB unimo OTTIMIZZAZIONE DI QUERY IN MOMIS Università degli studi di Modena e Reggio Emilia Relatore: Prof. Sonia.
Query OQL e XQUERY a confronto
Università degli studi di Modena e Reggio Emilia
Il sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente di.
Università degli Studi di Modena e Reggio Emilia
Principale limitazione di AR e SQL-92: interrogazioni ricorsive IMPIEGATO NOMENOMECAPO RossiVerdi NeriVerdi DeSio TucciDeSio DeLucaDeSio Lazio selezionare.
Meccanica aprile 2011 Urti Conservazione della quantita` di moto e teorema dell’impulso Energia cinetica Urti elastici e anelastici Urto con corpi.
QUESTIONARIO AIR STUDENTI
Progettazione ER Un database universitario contiene informazioni riguardanti i professori (identificati dal codice fiscale) e informazioni relative ai.
SQL Dati i seguenti schemi relazionali:
Dipartimento di Ricerca Sociale - Università del Piemonte Orientale 1 Castelli Aperti giugno 2005 Castello di Camino (AL) IL PUBBLICO DI CASTELLI.
1 Capitolo 2: Semplificazione, Ottimizzazione e Implicazione.
Corso di Informatica (Basi di Dati)
Corso di Laurea in Biotecnologie Informatica (Programmazione)
Corso di Informatica (Programmazione)
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Problemi e algoritmi Anno Accademico 2009/2010.
1 © Paolo Ferrario: riproduzione riservata solo ai partecipanti ai corsi di formazione Prof. Paolo Ferrario Università
Corso di Informatica per Giurisprudenza Lezione 5
Seminario su clustering dei dati – Parte II
Architettura del World Wide Web
CVM un modello concettuale per la gestione di versioni di schema in un contesto di integrazione Fabio Grandi DEIS - Università di Bologna.
Dipartimento di Informatica e Sistemistica Alessandro DE CARLI Anno Accademico MOVIMENTAZIONE CONTROLLATA AZIONAMENTI CON MOTORE BRUSHLESS.
1Sonda di elettroni Capitolo 7. 2Confronto fra microscopio elettronico e acceleratore Capitolo 7.
INFORMATICA UMANISTICA B STRUTTURE DATI BASI DI DATI RAPPRESENTAZIONE DELLA CONOSCENZA ONTOLOGIE.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Simulazione di un esperimento di laboratorio: Caduta di un corpo quadrato in.
Unità Didattica 1 Algoritmi
Laboratorio di Calcolo I 1) Introduzione Università Roma Tre Corso di Studi in Fisica AA 2002/03.
FONDAMENTI DI INFORMATICA III A2A2-1 CARATTERISTICHE E MODELLIZZAZIONE DEL LAVORO DUFFICIO Argomento 2 Approfondimento 2 CARATTERISTICHE E MODELLIZZAZIONE.
PERCORSO FORMATIVO D.U.R.C. ON LINE
Qualità - 1 / 26 Lezione 1 La qualità del prodotto.
Dipartimento di Economia
1 XPath. 2 What is XPath? XPath is a syntax for defining parts of an XML document XPath uses paths to define XML elements XPath defines a library of standard.
Documentazione automatica su un linguaggio schema di Alessandro Modica Relatore: Fabio Vitali.
1Analisi RBS su rocce lunari Capitolo 6. 2Apparato per misure RBS Capitolo 6.
Aspetti strategico – organizzativi - gestionali delle imprese che aderiscono ad una rete Dott. Vincenzo Presutto Dottore Commercialista e Revisore Legale.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
TECNOLOGIE DELLINFORMAZIONE E DELLA COMUNICAZIONE PER LE AZIENDE Materiale di supporto alla didattica.
INPS - COMUNI SERVIZI AL CITTADINO.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
UNIVERSITA FEDERICO II DI NAPOLI Dipartimento di Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informatica Strumenti per la gestione di DataBase.
1 Questionario di soddisfazione ATA - a. sc. 2008/09 Il questionario è stato somministrato nel mese di aprile Sono stati restituiti 29 questionari.
Universita' degli Studi di Modena e Reggio Emilia
1 Questionario di soddisfazione del servizio scolastico Anno scolastico 2011/2012 Istogramma- risposte famiglie.
Gerarchie Ricorsive Una gerarchia ricorsiva deriva dalla presenza di una ricorsione o ciclo (un anello nel caso più semplice) nello schema operazionale.
Peer-to-Peer Systems Content-Based Routing of Path Queries in Peer-to-Peer Systems Georgia Koloniari and Evaggelia Pitoura Ingargiola Salvatore Montauti.
Ad opera di: Matteo Donatelli e Maurizio Di Paolo Presentazione su : Elettropneumatica 1.
1 Questionario di soddisfazione personale ATA Il questionario è stato somministrato a fine settembre 2006; Il questionario è stato somministrato a fine.
C’è / Ci sono Scegli un numero.
I dati del questionario di autovalutazione dei docenti Prime rilevazioni.
1. Non di sola arte Viaggio in Italia tra voci e numeri della giovane arte contemporanea Facoltà del Design, Politecnico di Milano, 8 aprile 2008 Giulia.
Bando di Residenza Cap Scheda ENTE 3ROL - Richieste On Line.
Capitolo 2 I concetti di base della cinematica
© GfK 2012 | Title of presentation | DD. Month
Pippo.
Distribuzione per causa delle irregolarità al servizio Azienda ATL (Valori assoluti) 1.
Tecnologie di InternetFondamenti di Linguaggi di Markup Dott. Nicola Dragoni Introduzione a e ai (Fondamenti di Markup Languages)
Bando Pittori e Scultori in Piemonte alla metà del ‘700
lun mar mer gio ven SAB DOM FEBBRAIO.
Introduzione P. Gallo - rielaborazione del prof. Roberto SPEDICATO
COMUNE DI BOLOGNA Dipartimento Riqualificazione Urbana Simulazione invio telematico SCIA Processo di dematerializzazione per la presentazione delle pratiche.
1 Microsoft Access Gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni Informatica per laurea triennale.
Lelio Iapadre (Università dell’Aquila) Convegno su
Indicizzazione di documenti semistrutturati Sistemi informativi – AA D’Este Laura.
Transcript della presentazione:

1 Basi di Dati Semistrutturate e XML Carlo Sartiani Dipartimento di Informatica Università di Pisa Questo lavoro è stato in parte finanziato con i fondi del Progetto MURST DATA-X

2 Struttura della presentazione Introduzione Modelli dei dati Linguaggi di interrogazione Meccanismi di schematizzazione Conclusioni

3 INTRODUZIONE

4 Basi di dati semistrutturate Una base di dati semistrutturata è caratterizzata da: –unelevata irregolarità strutturale e/o –unelevata instabilità strutturale Queste caratteristiche rendono gli SSD non agevolmente gestibili con sistemi relazionali e/o object-oriented

5 AUTHOR = {R. Goldman and J. Widom}, TITLE = {Approximate DataGuides}, BOOKTITLE = {To appear in Proceedings of the second International Workshop WebDB '99, Pennsylvania}, YEAR = {1999}, MONTH = {June}, author = {S. Nestorov and J. Ullman and J. Wiener and S. Chawathe}, editor = {Alex Gray and Per-{\AA}ke Larson}, title = {Representative Objects: Concise Representations of Semistructured, Hierarchial Data}, booktitle = {Proceedings of the Thirteenth International Conference on Data Engineering, April 7-11, 1997 Birmingham U.K}, publisher = {IEEE Computer Society}, year = {1997}, isbn = { }, pages = {79-90}, bibsource = {DBLP, }

6 Somiglianze tra XML e SSD Autodescrittività Flessibilità nella rappresentazione Integrazione dei risultati ottenuti nei due ambiti di ricerca –SSD: modelli dei dati e linguaggi di interrogazione –XML: meccanismi di schematizzazione

7 MODELLI DEI DATI

8 Modelli dei dati per SSD e XML I modelli dei dati usualmente impiegati per gli SSD si basano su OEM OEM rappresenta una base di dati come un grafo diretto etichettato OEM può essere facilmente esteso alla rappresentazione di documenti XML

9 Un documento XML MacOS 9.1 Apple Computer Inc. WIndowsNT 4 SP6 Microsoft Inc.

10 Rappresentazione del documento

11 LINGUAGGI DI INTERROGAZIONE

12 Desiderata Dichiaratività Chiusura rispetto al modello dei dati Capacità di esprimere interrogazioni e trasformazioni Composizionalità delle query XML: capacità di sfruttare, ai fini dellottimizzazione di query, le eventuali DTD associate ai documenti interrogati

13 Linguaggi per XML XML-QL è stato progettato specificamente per interrogare documenti data-oriented –Può essere considerato il migliore linguaggio di query per XML data-oriented XQL è un linguaggio per linterrogazione di documenti general-purpose –XQL non è consigliabile per linterrogazione di documenti data-oriented

14 XML-QL CONSTRUCT { WHERE $t $a IN CONSTRUCT $t $a }

15 XQL La query precedente, pur semplice, non è esprimibile in XQL Una query XQL: \database\softwareVendors\company[$i=ID]\name

16 MECCANISMI DI SCHEMATIZZAZIONE

17 Assenza di schema logico I sistemi di gestione di SSD sono di solito privi di uno schema logico Lassenza di schemi logici crea problemi: –esecuzione inefficiente delle query –mancanza di una nozione di correttezza di query –difficoltà nella formulazione delle query

18 Schemi per XML data-oriented Le DTD non sono soddisfacenti –Descrivono la struttura sintattica e non lorganizzazione logica –Impongono un ordinamento sui dati –Non permettono di esprimere vincoli sui riferimenti

19 Schemi per XML data-oriented Esistono numerose proposte di schemi per documenti XML La più interessante, per quanto riguarda i documenti data-oriented, è SOX2.0 –Tipizzazione dei riferimenti –Maggiore attenzione allorganizzazione logica dei dati

20 CONCLUSIONI

21 Direzioni di ricerca Buona parte della comunità di ricerca ritiene soddisfacenti le soluzioni per SSD relative a: –modelli dei dati –linguaggi di interrogazione Non siamo daccordo

22 Problemi aperti I problemi aperti sono ancora troppi –Ottimizzazione –Correttezza –Applicazioni su database La loro risoluzione richiede, a nostro avviso, un approccio diverso da quello finora seguito

23 Approccio unificante È necessario un approccio unificante Il progetto che stiamo sviluppando (Data-X) –Realizzazione di un query language tipizzato –Sistema di tipi che risolva i tre problemi precedentemente citati