Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica Capitolo V.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Le forme della rappresentazione digitale La rappresentazione livello zero: codifica ASCII – stringhe di caratteri non interpretate Laggiunta di informazioni sul testo e sul documento: i linguaggi di codifica – dati informazionali sulle istanze di contenuto tradite dalle fonti testuali
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Testo e documento Il documento come rappresentazione MATERICA e MATERIALE della fonte Il testo come fonte di contenuto, trasmissione di DATI INFORMAZIONALI Es. Rappresentazione logica del contenuto veicolato da una fonte testuale, il contenuto dellopera, che è il testo VS una specifica rappresentazione fisica, cioè una particolare edizione del testo, che è il documento, vale a dire lattestazione fisica del testo, lo specifico esemplare.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, I linguaggi dichiarativi e procedurali Sistemi di tipo WYSIWYG (What You See Is What You Get) – a interfaccia grafica Sistemi basati sui markup language: 1. PROCEDURALI (specific markup), che istruiscono il device di output sullaspetto del documento; 2. DICHIARATIVI (generic markup) che consentono di aggiungere informazioni sul testo
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, SGML Standard Generalized Markup Language Linguaggio di markup dichiarativo per la codifica della struttura logica delle fonti testuali. Metalinguaggio che consente lelaborazione di linguaggi di codifica fornendo principi sintattici. Markup: aggiunta di informazioni a ogni partizione logica della fonte tramite tag Aspetto tag: delimitatori che contengono linformazione utile a descrivere la porzione di testo, nella forma: Concetto di DTD come luogo utile a specificare il valore di ogni elemento che si intende utilizzare in fase di markup
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, HTML Hyper Text Markup Language DTD SGML: set di marcatori ad hoc per la codifica di costrutti ipertestuali Principi sintattici basati su SGML Struttura del codice: testo a cui si riferisce il marcatore Limiti HTML: linguaggio non modificabile, scarsamente strutturato, predilezione marcatori stilistici
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Un file HTML Le Stanze di Poliziano Stanze Angelo Poliziano LIBRO PRIMO 1 Preposizione Le gloriose pompe e' fieri ludi della città che 'l freno.. 2 Invocazione ad Amore. O bello idio ch'al cor per gli occhi.. dolce disir d'amaro pensier..
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, XML Extensible Markup Language Sottoinsieme SGML (non DTD!) semplificato e ottimizzato specificamente per applicazioni in ambiente Word Wide Web Propensione per la descrizione della struttura logica della fonte rispetto alla resa grafica in layout Aspetto del documento delegato ad altri linguaggi (come XSL) Utilizzo di DTD esistenti o creazione dei marcatori ad hoc per la tipologia documentaria Documenti XML validi (che si rifanno a una DTD) e ben- formati (well-formed), ossia che si limitano ad aderire alle norme sintattiche XML
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, File per lavorare con XML Documento XML (file.xml): struttura gerarchica ad albero dei marcatori – concetto di elemento, attributo ed entità DTD (file.dtd): specificazione dei nomi degli elementi e delle mutue relazioni gerarchiche, degli attributi e dei riferimenti di entità utilizzati nel documento XML Foglio di stile (file.xsl): descrizione del layout, di come appariranno in fase di visualizzazione le porzioni di testo codificate nel file XML
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Un documento XML Stanze Angelo Poiliziano LIBRO PRIMO 1 Preposizione Le gloriose pompe e' fieri ludi della città che 'l freno Invocazione ad Amore O bello idio ch'al cor per gli occhi.. dolce disir d'amaro pensier.....
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Schema ad albero POEMA TITOLO AUTORE CANTO CANTO INTESTAZIONE OTTAVA OTTAVA … TITOLO VERSO VERSO VERSO …
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Porzione di DTD
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Porzione di file XSL
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Alcuni standard correlati a XML Gestione dei fogli di stile: XSL (Extensible Stylesheet Language) Gestione dei link ipertestuali: XML Linking Language (Xlink e Xpointer) Gestione dei metadati: RDF (Resource Description Format )
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La DTD per i testi umanistici: Text Encoding Initiative (TEI) DTD elaborata per la gestione dei testi letterari Nasce per SGML e ora è compatibile anche con XML Prevede la codifica di ogni fenomeno letterario (conta oltre 400 elementi) TEILite – versione ridotta dello schema di codifica Pizza Chef – per la creazione del set di marcatori ad hoc per la tipologia testuale o gli scopi della ricerca
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Struttura TEI Divisa in sezioni: elementi utilizzabili in ogni tipo di testo elementi specifici per tipologia testuale (testo in prosa, in versi, testo drammatico, dizionario, trascrizione di registrazioni verbali) elementi legati agli obiettivi della resa computazionale (codifica di fonti primarie e predisposizione dellapparato delle varianti, codifica di strutture morfosintattiche, rappresentazione di strutture interpretative profonde, rappresentazione di costrutti ipertestuali)
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Schema base della DTD TEI [start tag della TEI] [informazioni relative allesemplare cartaceo di riferimento e alla versione elettronica - metadati] [start tag del testo] [dati che precedono il corpo del documento] [corpo del testo] [dati che seguono il corpo del documento] [end tag del testo] [end tag della Tei]