Lezione 4 XML.

Slides:



Advertisements
Presentazioni simili
I Namespace Mario Arrigoni Neri.
Advertisements

Introduzione all’HTML
WWW XML-Namespace Fabio Vitali. WWW Fabio Vitali2 Introduzione Qui esaminiamo: u Lesigenza e il funzionamento dei Namespace in XML.
DTD Document Type Definition per XML
Introduzione al DTD Mario Arrigoni Neri.
Introduzione ad XML Mario Arrigoni Neri.
HTML+XML= XHTML Il ritorno al futuro del WEB A cura di Barbara Lotti.
Lezione 1 Primi passi in HtML SCRIVERE TESTI di Sergio Capone
A. FERRARI Alberto Ferrari. L'HyperText Markup Language (HTML) (traduzione letterale: linguaggio di marcatura per ipertesti) è un linguaggio usato per.
1 Introduzione ad XML. 2 Problemi con SGML Complesso da comprendere ed utilizzare Non è pensato per la rete: mancano link ipertestuali e specifiche grafiche.
Lezione 18 MIDI e XML Programmazione MIDI (Prof. Luca A. Ludovico)
Document Type Definition per XML Presentazione 8.1 Informatica Generale (Prof. Luca A. Ludovico)
DTD Laurea Magistrale in Informatica Chapter 03 Modulo del corso Thecnologies for Innovation.
XSLT (eXtensible Stylesheet Language Transformation) Laurea Magistrale in Informatica Reti 2 (2005/06) dott. Francesco De Angelis
Query OQL e XQUERY a confronto
G. Mecca – – Università della Basilicata Tecnologie di Sviluppo per il Web XML: Dettagli e Approfondimenti versione 2.0 Questo lavoro è
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica.
XML Prof. Alfredo Pulvirenti. XML XML (eXtensible Markup Language) è un meta linguaggio. Può essere definito come un insieme di regole e convenzioni che.
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
Laboratorio di Applicazioni Informatiche II mod. A
XML Prof. Barbara Pernici Politecnico di Milano. Introduzione a XML.
XML Prof. Barbara Pernici Politecnico di Milano aggiornato 10/12/2002.
Linguaggi di marcatura e fogli stile Presentazione del corso.
XHTML Danilo Deana. XHTML2 XHTML (eXtensible HyperText Markup Language) XHTML è una riformulazione di HTML come applicazione XML. Utilizzando XHTML è
Componenti di un documento HTML Danilo Deana. Componenti di un documento HTML 2 Elementi HTML comprende elementi per rappresentare paragrafi, elenchi,
XML e DTD. –il "PROLOG contiene: dichiarazione della versione di XML; commenti (facoltativi); dichiarazione del DOCUMENT TYPE. –il "DOCUMENT INSTANCE.
Lezione 3 Codifica di alto livello: dalla selezione degli elementi da marcare ad XML.
IDUL 2013 Marcature ad alto livello, corpora e XML.
IDUL 2011 Marcature ad alto livello, XML. DATA BASE E LINGUAGGI DI MARCATURA Una base di dati organizza dati altamente strutturati ed interconnessi in.
Lezione 5 Attributi, Entità, Parametri e Namespaces.
DTD, Entità, Parametri, Namespace
Laboratorio di Informatica di Base Laboratorio di Informatica di Base Laurea in Informatica Multimediale Docente: Andrea Fusiello profs.sci.univr.it/~fusiello.
Un’introduzione a HTML (I)
Introduzione e nozioni fondamentali di sintassi
Linguaggi di markup1 LINGUAGGI DI MARKUP. Linguaggi di markup2 Documenti su Internet Internet permette (tra laltro) di accedere a documenti remoti In.
XML per documenti e applicazioni transazionali su Internet Alessio Saltarin Progetto XML Factory.
1 Titolo Presentazione / Data / Confidenziale / Elaborazione di... ASP. Net View State e controlli Elaborazione di Franco Grivet Chin.
Corso di PHP.
XSLT Trasformazioni XSL Ing. Luca Sabatucci. XSLT Uno dei vantaggi principali nell'utilizzo dell'Extensible Markup Language è la facilità con cui si possono.
Informatica Umanistica A.A. 2009/2010 eXtensible Markup Language (XML)
Importanza DTD La DTD (Document Type Definition) consente di dichiarare in maniera univoca la struttura di markup mediante la definizione dello schema.
Linguaggi di codifica.
HyperText Markup Language 17-23/6/08 Informatica applicata B Cristina Bosco.
HTML per iniziare Gianpaolo Cecere. 29 aprile Sintassi HTML I tag HTML sono direttive per i browser I tag sono contenitori per porzioni di documento.
Creare pagine web Xhtlm. Struttura di una pagina.
HTML Lezione 3 Stili.
Il linguaggio HTML Antonella Schiavon – settembre 2008 rev. 1 – aprile 2011.
HTML HyperText Markup Language Linguaggio per marcare un’Ipertesto
Introduzione a XML applicazioni in open archives Azalea III Incontro di Formazione, Roma 2-3 febbraio 2004.
Informatica Umanistica A.A. 2007/2008 LEZIONE 4 eXtensible Markup Language (XML) INTRODUZIONE.
Gli standard web W3C standard HTML CSS “…a set of standardized best practices for building web sites, and a philosophy of web design and development.
Roma, 16 giugno 2005 AZALEA Un sistema di conoscenza in oncologia a disposizione di pazienti e cittadini Gli aspetti informatici.
XHTML Corso linguaggi per il web a.s. 2011/2012 ITIS A. Righi – Corsico Relatore – Aldo Guastafierro.
Lezione 3 Struttura lessicale del linguaggio
CORSO Di WEB DESIGN prof. Leonardo Moriello
Impostare i caratteri. Le prime versioni del linguaggio HTML così come le prime versioni dei browser consentivano unicamente la scelta tra due tipi di.
Tecnologie di InternetDocument Type Definition Dott. Nicola Dragoni Document Type Definition  Document Type Definition (DTD)  Documento XML valido 
HTML e CSS C. Gena, C. Picardi, J. Sproston HTML e CSS.
A.a. 2004/05Tecnologie Web1 Introduzione a XML: Document Type Definition; parser XML; XML-schema; eXtensible Stylesheet Language.
PROGETTO… Internet Providers, registrazione del dominio Costruire una home page … e renderla visibile sul Web.
TW Asp - Active Server Pages Nicola Gessa. TW Nicola Gessa Introduzione n Con l’acronimo ASP (Active Server Pages) si identifica NON un linguaggio di.
Fondamenti di Markup Languages: Richiami di HTML © 2005 Stefano Clemente Stefano Clemente
Cenni Su SGML, HTML, XML SGML (Standard Generalized Markup Language) è il padre di tutti i linguaggi "Markup" – Lo svantaggio è la "pesantezza" dei suoi.
WWW La sintassi di SGML  XML Fabio Vitali. WWW Fabio Vitali2 Introduzione Qui esaminiamo in breve tutti gli aspetti di SGML che sono in comune con XML:
Documenti XML ben formati Altre componenti di un documento XML – Struttura dei documenti XML.
2 Indice Un esempio Che cosa è A cosa serve Confronto con HTML Punti di forza La sua struttura.
Il linguaggio XML per la rappresentazione dei dati Lo Extensible Markup Language o XML è stato concepito da un gruppo di lavoro del World Wide Web Consortium.
HTML. Pagina HTML Struttura Titolo Hello World! Paragrafo apre il documento html contiene informazioni come il titolo della pagina, i meta tags, la codifica.
Transcript della presentazione:

Lezione 4 XML

L’XML (eXtensible Markup Language) è un linguaggio di markup sviluppato dallo XML Working Group del W3C a partire dal 1996 XML è uno dei più importanti sviluppi nella storia della computazione. Negli ultimi anni è stato adottato in campi molto diversi tra loro: legge, aeronautica, finanza, sicurezza, robotica, turismo, arte, design del software, fisica, letteratura, … XML è nato dallo sforzo di dare forza e struttura all’SGML (“Standard Generalized Markup Language”, ISO standard: ISO 8879:1986) nel web, in una forma che fosse però abbastanza semplice per gli utenti non esperti.

XML XML nasce dalla lunga storia dei sistemi di elaborazione di testi allo scopo di permettere l’elaborazione delle informazioni piuttosto che la loro visualizzazione in un documento XML, quindi, non e’ necessario fare alcun riferimento al modo in cui le informazioni verranno visualizzate: le regole per la visualizzazione saranno inserite in un foglio esterno chiamato foglio di stile (ingl. “Stylesheet”) XML permette all’utente di definire il proprio insieme di tag (elementi) e in questo senso può essere considerato un meta-markup language: i tag definiti dall’utente possono avere dei nomi che rispecchiano il contenuto del documento stesso Le specifiche complete dell’ XML 1.0 sono sul web (in italiano a http://www.xml.it:23456/XML/REC-xml-19980210-it.html)

Struttura logica generale dei tag XML (HTML/SGML) <marcatore>testo a cui si riferisce</marcatore> <marcatore attributo=“valore”>testo a cui si riferisce</marcatore> <marcatore_aperto_e_chiuso/> Oltre al termine “marcatore” si usa “etichetta” o l’inglese “tag”; il termine tecnico è “elemento” A differenza che in SGML ed in HTML, in XML ogni marcatore aperto deve essere chiuso (XML è più restrittivo di SGML)

Markup XML per codifica strutturale <libro> <titolo>Le avventure di Pinocchio <sottotitolo>Storia di un burattino</sottotitolo> </titolo> <autore>Carlo Collodi</autore> <parte p_id=”1”> <titolo>Parte prima</titolo> <capitolo c_id=”I”> <titolo> Come andò che maestro Ciliegia, falegname, trovò un pezzo di legno, che piangeva e rideva come un bambino.</titolo> <capoverso num=”p1c1c1”>C'era una volta...</capoverso> <capoverso num=”p1c1c2”>- Un re! - diranno subito i miei piccoli lettori.</capoverso> <capoverso num=”p1c1c3”>No, ragazzi, avete sbagliato. C'era una volta un pezzo di legno.</capoverso> <capoverso num=”p1c1c4”>Non era un legno di lusso, ma un semplice pezzo da catasta, di quelli che d'inverno si mettono nelle stufe e nei caminetti per accendere il fuoco e per riscaldare le stanze.</capoverso> </capitolo></parte> </libro>

Markup doppio markup per la codifica di informazione strutturale + markup (parziale) per la codifica di informazione linguistica <libro> … <parte> <capitolo c_id=”I”> <titolo>Come <parola cat=“V” tempo=“passRem”>andò</parola> che <parola cat=“N” genere=“m” num=“s”>maestro</parola> Ciliegia, falegname, trovò <sintagma tipo=”nominale”><parola cat=“artInd” genere=m” num=“s”>un</parola> pezzo di legno</sintagma>, che piangeva e rideva come un bambino. </titolo> </capitolo></parte> </libro>

Problema: Markup incrociato Con la presenza di markup multiplo si pone il problema delle etichette incrociate <pagina pag_n=“1”>…Non era un legno di lusso, ma un semplice pezzo da catasta, di quelli <frase-rel>che d'inverno si mettono nelle stufe</pagina><pagina pag_n=“2> e nei caminetti per accendere il fuoco e per riscaldare le stanze.</frase-rel> <grassetto>AAA<corsivo>BBB</grassetto>CCC…</corsivo> La sintassi dell’ XML non permette questi incroci!!! (e neanche quella dell’ HTML, anche se i browser sono a questo proposito molto accomodanti)

Principali differenze fra HTML e XML XML non è un sostituto del HTML: XML e HTML sono stati pensati per scopi diversi. XML è pensato per descrivere dati e porre l'attenzione su cosa sono (marcatura dichiarativa) HTML è pensato per visualizzare dati e porre l'attenzione su come presentarli (marcatura mista procedurale/dichiarativa) Tuttavia, è possibile tradurre tutto l’HTML in XML: il risultato si chiama XHTML HTML + Browser: sistema di visualizzazione di dati; XML + Processore XML + Applicazione = formato dati generale

SGML XHTML XML HTML funziona come

Le parti di un progetto XML Un documento in XML è in realtà la combinazione di tre parti. Ci riferiamo ad esse come tre documenti separati; spesso, ma non necessariamente, sono anche file separati in maniera fisica. Un documento dei contenuti cioé la parte che l’autore vuole esporre a chi la visualizza o utilizza; Un documento DTD (Document Type Definition) che specifica i macatori usati e la loro sintassi; Uno stylesheet (foglio di stile) che stabilisce come verrà visualizzato e presentato il contenuto. La DTD è opzionale e spesso viene caricata direttamente dal web tramite una chiamata all’interno del documento dei contenuti (meccanismo dei “Namespace”) Il foglio di stile è opzionale, e superfluo se il contenuto non deve essere visualizzato in modo particolare.

XML Un documento XML è costituito da composizioni di stringhe, ovvero sequenze di caratteri UNICODE. Caratteristica di XML è quella di essere CASE SENSITIVE, ovvero di fare differenza tra lettere maiuscole e minuscole. Pertanto il tag "Pino" è diverso dai tag "pino", "pIno", "PINO", ecc.

Parti di un documento XML Un documento XML si compone di due parti principali: il "PROLOG“ contiene: dichiarazione della versione di XML; commenti (facoltativi); dichiarazione del DOCUMENT TYPE. il "DOCUMENT INSTANCE“ contiene i dati veri e propri.

<?xml version="1.0" encoding="…" standalone="yes" ?> Esempio di Prolog un documento XML dovrebbe iniziare con <?xml version="1.0" encoding="…" standalone="yes" ?> se non si specifica il valore dell’attributo encoding la codifica è quella UNICODE standalone può assumere valori "yes" o "no" (il cui significato sarà chiaro in seguito) <?xml version="1.0"?> <!-- Documento di prova --!> <!DOCTYPE MEMO SYSTEM "memo.dtd"> nome del documento file con la descrizione della struttura

Esempio di Document Instance Un documento XML è un documento di testo ed è formato da tag che una volta aperti devono SEMPRE essere chiusi <memo> <da> <nome>Ugo</nome> <email>ugo@megaditta.it</email> </da> <a> <nome>Pina</nome> <email>Pina@casamia.it</email> </a> <oggetto>San Valentino</oggetto> <testo><paragrafo>Pina.... ti amo moltissimo! Tuo Ugo.</paragrafo> </testo> </memo>

<?xml version="1.0" standalone="no" ?> <memo> <from> <name>Rossi</name> <email>rossi@tin.it</email> </from> <to> <name>Verdi</name> <email>verdi@tiscalinet.it</email> </to> <oggetto>Esempio in XML</oggetto> <body> <paragrafo>bla bla</paragrafo> </body> </memo> N.B. L’uso del rientro variabile (“indentation”) non è parte della sintassi XML, ma un modo per aiutare gli esseri umani nella identificazione della struttura. Idem per l’uso dei colori, di grassetto, font, ecc.

XML - struttura ad albero Un documento XML definisce una struttura ad albero che si ottiene esaminando le relazioni di annidamento che esistono tra i tag Deve esistere un solo tag che non sia all’interno di nessun altro. Questo tag definisce la radice dell’albero (“root”) (nellì’esempio, “memo”). verdi@tiscalinet.it memo from to body oggetto name email paragrafo Rossi rossi@tin.it Verdi esempio in XML bla bla

Root (“radice”) e componenti Ogni documento XML ben formato (“well-formed”) ha un solo elemento radice/root Gli elementi non ROOT sono chiamati COMPONENTI del documento.

Ingredienti principali di un documento XML Elementi: identificano porzioni di testo o punti nel testo; possono contenere testo puro e/o altre etichette (cf. le cartelle di windows) Entità abbreviazioni per caratteri o espressioni varie; Commenti ignorati dal processore, utili per l’autore Attributi (e loro valori) definiti come proprietà degli elementi, ciascuno con un insieme di possibili valori;

Il processore XML Si assume che un documento XML venga analizzato (“parsed”) da un modulo software detto processore XML Tale modulo fa normalmente parte di qualche applicazione che usi dati in formato XML Il processore XML rileva la correttezza del documento, a due livelli: Ben-formatezza sintattica: conformità alle regole generali della sintassi XML (p.es. niente etichette incorciate) Validità: conformità alle specifiche della DTD Ovviamente un documento senza DTD non può essere dichiarato valido.

Entità predefinite Servono per far sì che i caratteri normalmente interpretati come MARKUP possano essere utilizzati come caratteri di testo (ad esempio per scrivere un manuale HTML). Sono i seguenti: & = & < = < > = > &apos; = ' " = " In generale le “entità” (sia predefinite che definite dall’utente hanno la forma &nome; )

Commenti All’interno di un documento XML posso aggiungere commenti, definiti come: “<!--” + Contenuto del commento + “-->” Esempio: <!-- dichiarazione per <head> & <body> --> I commenti sono “invisibili” al processore XML e servono solo per utenti umani. Eventuali tag all’interno non vengono processati Non possono essere inserite doppie linette “--” in un commento, se non alla fine, per chiuderlo.

XML - attributi i tag XML possono avere uno o più attributi un attributo è una coppia nome="valori”, che viene associata al tag (prima di chiuderlo con “>”) <persona altezza="170cm" peso="60kg"> Mario Rossi </persona> il valore di un attributo va tra virgolette semplici (‘) o doppie (“) (attenzione alla sostituzione automatica di “ con ”!)

XML – da non dimenticare… Virgolette necessarie nell’inserimento di attributi (“…” o ‘…’ ma mai misti: “…’ o ‘…”) Bilanciamento dei tags (se si apre il tag <img> deve essere anche chiuso da </img>; oppure si utilizzano tag vuoti (<hr></hr>, possibilmente compattati: <hr/>) Tag incassati - uso corretto: <h1> <a href=“percorso”> ecco il link </a> </h1> Tag incassati – uso non corretto (tag incrociati) <h1> <a href=“percorso”> ecco il link </h1> </a> Caratteri speciali devono comparire sempre con la loro sequenza vista in html: à si scrive con à > con > etc… XML è case sensitive: <img> è diverso da <IMG>!!!

Esempio (negozi.xml) <?xml version="1.0" standalone="no" ?> <citta nome="Trento"/> <negozio apertura="8.30-12.30/15.00-19.00" domenica="no"> <nome> Supermercati Poli </nome> <indirizzo tipo="completo"> <via> S.Pio X </via> <numero> 2 </numero> <zona> …… </zona> </indirizzo> <genere> Alimentare</genere> </negozio> <negozio apertura="8.00-12.00/15.00-19.00" domenica="si"> <nome> Ubiq </nome> <indirizzo tipo="ridotto"> <via> Corso 3 Novembre </via> <numero> 10 </numero> <genere> Libreria </genere> <descrizione> …… </descrizione> </negozi>

Esempio 4: info come testo o come attributo? <?xml version="1.0" standalone="no" ?> <negozi> <negozio domenica="si"> <nome> Ubiq </nome> <indirizzo tipo="ridotto"> <via> Corso 3 Novembre </via> <numero> 10 </numero> </indirizzo> <apertura domenica=“si”>8.00-12.00/15.00-19.00</apertura> <genere> Libreria </genere> <descrizione> …… </descrizione> </negozio> </negozi> Un caso di informazione doppia: <parola cat=“num” val=“44”>quarantaquattro</parola><parola cat=“N”>gatti</parola>

La DTD L'XML non è limitato a un insieme fisso di tipi di elementi, ma permette di definire e utilizzare elementi e attributi personalizzati; per far questo viene fornita una sintassi con cui è possibile specificare gli elementi e gli attributi che possono essere utilizzati all'interno dei documenti. In altre parole è possibile creare un modello, chiamato Document Type Definition (DTD), che descrive la struttura e il contenuto di una classe di documenti.

DTD: Esempio antologia <poesia><titolo>The SICK ROSE</titolo> <strofa> <verso>O Rose thou art sick.</verso> <verso>The invisible worm,</verso> <verso>That flies in the night</verso> <verso>In the howling storm:</verso> </strofa> <verso>Has found out thy bed</verso> <verso>Of crimson joy:</verso> <verso>And his dark secret love</verso> <verso>Does thy life destroy.</verso> </poesia> <!-- continua con altre poesie --> </antologia> Alcune caratteristiche per la definizione di “antologia di poesie” Una antologia contiene un certo numero di poesie e nient'altro. Una poesia contiene a volte un singolo elemento di titolo che precede la prima strofa, e non contiene mai nessun altro elemento. A parte il titolo, una poesia consiste solo di strofe. Una strofa consiste solo di versi ed ogni verso è contenuto in una strofa. Una strofa non può essere seguita da nulla tranne che da un'altra strofa, oppure dalla fine della poesia. Un verso non può essere seguito da nulla se non da un altro verso, oppure dall'inizio di una nuova strofa.

Esempio DTD: Antologia <!ELEMENT antologia (poesia+)> <!ELEMENT poesia (titolo?, strofa+)> <!ELEMENT titolo (#CDATA) > <!ELEMENT strofa (verso+) > <!ELEMENT verso (#CDATA) >

XML – documenti “well formed” un documento XML è ben formato se e solo se: tutti i suoi tag sono chiusi, nell’ordine corretto esiste un solo elemento radice i valori degli attributi sono scritti tra virgolette gli elementi non hanno due attributi con lo stesso nome i nomi degli elementi e degli attributi non contengono i caratteri < > & NB: i parser XML sono in grado di trattare solo i documenti XML ben formati

la DTD L'XML ha una propria DTD (attualmente descritto nella specifica REC-xml-19980210) in cui vengono elencate le regole della specifica stessa del linguaggio. Con l'XML è anche introdotta una classe di documenti che fa riferimento alla sola DTD dell'XML; la creazione di una DTD personale non è quindi indispensabile.

DTD type valid I documenti con le specifiche della DTD XML possono essere trovati agli indirizzi: http://www.w3c.org/XML/ La seguente URL contiene un controllore di validità http://www.stg.brown.edu/service/xmlvalid/ Se un documento è conforme alle specifiche di una DTD personale, allora si dice che è TYPE VALID ("valido").

Esempio di una DTD Per esempio, dato la seguente DTD personale: <!DOCTYPE persona [ <!ELEMENT persona (nome,cognome)> <!ELEMENT nome (#PCDATA)> <!ELEMENT cognome (#PCDATA)> ]>

Documento type valid il seguente documento risulta TYPE VALID: <persona> <nome> Luigi </nome> <cognome> Rossi </cognome> </persona>

Esempio 2 Consideriamo la seguente DTD, che definisce la struttura di un documento che contiene un indirizzo postale: <!DOCTYPE indirizzo [ <!ELEMENT indirizzo (nome, via, citta, stato, CAP)> <!ELEMENT nome (#PCDATA)> <!ELEMENT via (#PCDATA)> <!ELEMENT citta (#PCDATA)> <!ELEMENT stato (#PCDATA)> <!ELEMENT CAP (#PCDATA)> ]>

Osservazioni Osservazioni: il nome del document type ("indirizzo") è puramente arbitrario, avremmo potuto scrivere anche “address" o altro...; il root element deve avere (obbligatoriamente) lo stesso nome del document type (nell' esempio, "indirizzo");

Osservazioni Una volta definito la DTD, un documento TYPE VALID di tipo "indirizzo“ avrà la seguente forma: <indirizzo> <nome> Giuseppe </nome> <via> Garibaldi </via> <città> Pinerolo (TO) </città> <stato> Italia </stato> <CAP> 12345 </CAP> </indirizzo>

Dove si trova la DTD? la DTD di un file XML può trovarsi: DENTRO il file stesso (internal set): questo sistema comporta uno svantaggio in termini di condivisione in quanto la DTD non può essere usata per altri documenti XML simili; FUORI dal file (external set): qui, invece, la DTD è condivisibile e riutilizzabile.

External set In caso di external set la DTD di riferimento viene caricata tramite il sistema operativo (SYSTEM) <!DOCTYPE label SYSTEM "/URL/della/risorsa">. La URL della risorsa può: essere un percorso sul file system locale. Esempio: <!DOCTYPE label SYSTEM "C:\mydocuments\xml\dtd\label.dtd"> oppure essere un indirizzo esterno: <!DOCTYPE label SYSTEM "http://www.lt-2002.com/indirizzo.dtd"> Chiaramente la seconda soluzione offre maggiore accessibilità.

Tipi di content specification Abbiamo già visto un esempio di "content specification" quando abbiamo elencato gli elementi di "indirizzo": "nome", "via", "citta", "stato", "CAP“: <!ELEMENT nome (#PCDATA)> #PCDATA (“Parsed characted data”) indica un contenuto “misto” (testo e/o marcatori). Il processore XML analizzarà i marcatori, ma la DTD non ne specifica la struttura. Una specifica #CDATA, al contrario, indica al processore XML che non deve analizzare il contenuto, ma è tuttavia formato da caratteri Una specifica #NDATA indica invece che il contenuto di un tag potrebbe essere anche un file binario arbitrario (p.es. una immagine)

Altri tipi di content specification TIPO CONTENUTO PERMESSO EMPTY (vuoto) nessuno ANY qualsiasi MIXED Dati o sotto-elementi ELEMENT SOLO sotto elementi

Esempio TIPO COME SI DICHIARA EMPTY (vuoto) <!ELEMENT VUOTO1 EMPTY> ANY (qualunque cosa) <!ELEMENT QUI-QUO-QUA ANY> MIXED <!ELEMENT nome (RILIEVO)> <!ELEMENT RILIEVO (#PCDATA)> <!ELEMENT comm (#PCDATA | NOME)> ELEMENT <!ELEMENT label (nome,via,città,)>

Elementi alternativi E` possibile specificare che un certo elemento può essere composto da uno di due elementi in alternativa: <!ELEMENT FIGURA (DIDASCALIA, (IMMAGINE|CODICE))> Questo esempio definisce l' elemento "figura" (per esempio di un libro) dicendo che una figura ha SEMPRE una didascalia più un'immagine o un pezzo di codice a scelta.

Il numero degli elementi Per indicare opzionalità o ripetizioni si usano i modificatori già incontrati nelle espressioni regolari: ? ? = l' elemento che precede sarà presente da 0 a 1 volta * = l' elemento che precede sarà presente 0 o più volte + = l' elemento che precede sarà presente 1 o più volte Esempio: <!ELEMENT CAPITOLO (titolo, sottotitolo?, paragrafo+)> <!ELEMENT PARAGRAFO (#PCDATA | note)*> <!ELEMENT note (#PCDATA)> L' elemento “sottotitolo“, se c’è, è unico. L' elemento "paragrafo" deve essere presente per lo meno UNA volta. L' elemento "note" può essere ripetuto infinite volte oppure essere totalmente assente.

DTD: Esempio antologia <poesia><titolo>The SICK ROSE</titolo> <strofa> <verso>O Rose thou art sick.</verso> <verso>The invisible worm,</verso> <verso>That flies in the night</verso> <verso>In the howling storm:</verso> </strofa> <verso>Has found out thy bed</verso> <verso>Of crimson joy:</verso> <verso>And his dark secret love</verso> <verso>Does thy life destroy.</verso> </poesia> <!-- continua con altre poesie --> </antologia> Alcune caratteristiche per la definizione di “antologia di poesie” Una antologia contiene un certo numero di poesie e nient'altro. Una poesia contiene a volte un singolo elemento di titolo che precede la prima strofa, e non contiene mai nessun altro elemento. A parte il titolo, una poesia consiste solo di strofe. Una strofa consiste solo di versi ed ogni verso è contenuto in una strofa. Una strofa non può essere seguita da nulla tranne che da un'altra strofa, oppure dalla fine della poesia. Un verso non può essere seguito da nulla se non da un altro verso, oppure dall'inizio di una nuova strofa.

Esempio Antologia <!ELEMENT antologia (poesia+)> <!ELEMENT poesia (titolo?, strofa+)> <!ELEMENT titolo (#CDATA) > <!ELEMENT strofa (verso+) > <!ELEMENT verso (#CDATA) >

Notare la differenza tra: Altro esempio: ritornello Con questi elementi possiamo dichiarare una poesia come composta da una o più strofe, versi liberi o quartine, definite ad esempio come: <!ELEMENT quartina (verso-1, verso-2, verso-3, verso-4)> <!ELEMENT poesia (titolo?, (strofa+ | quartina+ | verso+))> Notare la differenza tra: <!ELEMENT poesia (titolo?, (strofa+ | distico+ | verso+) ) > <!ELEMENT poesia (titolo?, (strofa | distico | verso)+ ) > Altro esempio: ritornello <!ELEMENT ritornello (verso+)> <!ELEMENT poesia (titolo?, ( verso+ | (ritornello?, (strofa, ritornello?)+ ))) >