Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 1 La rappresentazione dellinformazione testuale e i linguaggi di codifica.

Slides:



Advertisements
Presentazioni simili
I LINGUAGGI DI MARCATURA
Advertisements

INFORMATICA UMANISTICA MODULI B, C E D
Informatica umanistica moduli B, C e D dit. unitn
Informatica umanistica: Moduli B, C e D
INFORMATICA UMANISTICA MODULI B, C E D Massimo Poesio (B, D) Marco Baroni (Lab D) Roberto Zamparelli (C)
Introduzione ad XML Mario Arrigoni Neri.
HTML+XML= XHTML Il ritorno al futuro del WEB A cura di Barbara Lotti.
HYPER TEXT MARK-UP LANGUAGE
HTML Hyper Text Mark-Up Language. HTML Hyper Text Mark-Up Language Linguaggio di marcatura per ipertesti E un linguaggio di formattazione usato per descrivere.
A. FERRARI Alberto Ferrari. L'HyperText Markup Language (HTML) (traduzione letterale: linguaggio di marcatura per ipertesti) è un linguaggio usato per.
HTML Hyper Text Mark-Up Language. HTML Hyper Text Mark-Up Language Linguaggio di marcatura per ipertesti E un linguaggio di formattazione usato per descrivere.
1 Introduzione ad XML. 2 Problemi con SGML Complesso da comprendere ed utilizzare Non è pensato per la rete: mancano link ipertestuali e specifiche grafiche.
Lezione 18 MIDI e XML Programmazione MIDI (Prof. Luca A. Ludovico)
Introduzione ai CSS. Cosa è successo allHTML Perché usare i CSS Introduzione ai CSS Fondamenti.
Query OQL e XQUERY a confronto
Re-engineering del wrapper XML Schema per il sistema MOMIS
Biblioteche elettroniche e archivi digitali
XML Prof. Alfredo Pulvirenti. XML XML (eXtensible Markup Language) è un meta linguaggio. Può essere definito come un insieme di regole e convenzioni che.
Introduzione ai Web Services. E' un nuovo meccanismo RPC ottimizzato per l'uso in Internet Un qualunque Client su una generica piattaforma deve poter.
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
Microsoft Word (oppure, OpenOffice Writer)‏
Linguaggi per il Web Laboratorio di Applicazioni Informatiche II mod. A.
XML Prof. Barbara Pernici Politecnico di Milano. Introduzione a XML.
XML Prof. Barbara Pernici Politecnico di Milano aggiornato 10/12/2002.
Linguaggi di marcatura e fogli stile Presentazione del corso.
TECNOLOGIE PER DOCUMENTI DIGITALI
XML e DTD. –il "PROLOG contiene: dichiarazione della versione di XML; commenti (facoltativi); dichiarazione del DOCUMENT TYPE. –il "DOCUMENT INSTANCE.
Architettura del World Wide Web
INFORMATICA UMANISTICA B
HyperText Markup Language
Laboratorio di Informatica
Il testo e i sistemi per la gestione del testo Lezione 3 Laboratorio di Informatica.
Introduzione e nozioni fondamentali di sintassi
1 Titolo Presentazione / Data / Confidenziale / Elaborazione di... ASP. Net View State e controlli Elaborazione di Franco Grivet Chin.
XSLT Trasformazioni XSL Ing. Luca Sabatucci. XSLT Uno dei vantaggi principali nell'utilizzo dell'Extensible Markup Language è la facilità con cui si possono.
STRUTTURA E RAPPRESENTAZIONE –Desideriamo un software che ci permetta linterscambio di documenti a prescindere dalla piattaforma –Il software deve permettere.
Informatica Umanistica A.A. 2009/2010 eXtensible Markup Language (XML)
Importanza DTD La DTD (Document Type Definition) consente di dichiarare in maniera univoca la struttura di markup mediante la definizione dello schema.
Linguaggi di codifica.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
HyperText Markup Language 17-23/6/08 Informatica applicata B Cristina Bosco.
WORLD WIDE WEB Il World Wide Web (Web, WWW o W3) è un'architettura software utilizzata per fornire l'accesso e la navigazione ad un insieme molto vasto.
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
CORSO AVANZATO INFORMATICA
V.1 Progettazione Multimediale – 1 Progettazione multimediale HTML e i tag di base.
Andrea Spinelli Linguaggio HTML Lezione 1: Ipertesti Precursori Linguaggi di marcatura Ted Nelson Tim Berners-Lee Strutture di base.
Il metalinguaggio XML: la nuova frontiera per la codifica dellinformazione Relatore: Ing. Marco Porta Tesi di Laurea di: Andrea Mocchi ANNO ACCADEMICO.
Creare pagine web Xhtlm. Struttura di una pagina.
Gianpaolo Cecere Introduzione
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Il linguaggio HTML Antonella Schiavon – settembre 2008 rev. 1 – aprile 2011.
Hyper-Text Mark-Up Language
Programma delle lezioni LABORATORIO B  Lezione 01: 27/02martedi  Lezione 02: 06/03martedi  Lezione 03: 13/03martedi  Lezione 04:
Informatica Umanistica A.A. 2007/2008 LEZIONE 4 eXtensible Markup Language (XML) INTRODUZIONE.
Internet e HTML Diffusione di informazioni mediante la rete Internet.
Tecnologie di InternetDocument Type Definition Dott. Nicola Dragoni Document Type Definition  Document Type Definition (DTD)  Documento XML valido 
HTML HTML e il web.
HTML e CSS C. Gena, C. Picardi, J. Sproston HTML e CSS.
Introduzione alle Griglie computazionali - aa Introduzione alle griglie computazionali Introduzione alle griglie computazionali Università degli.
Cenni Su SGML, HTML, XML SGML (Standard Generalized Markup Language) è il padre di tutti i linguaggi "Markup" – Lo svantaggio è la "pesantezza" dei suoi.
Linguaggi di markup Marco Mesiti
Ingegneria del software Modulo 3 -Tecniche di implementazione Unità didattica 1 -Ingegneria dei componenti Ernesto Damiani Università degli Studi di Milano.
1 La Text Encoding Initiative (TEI). 2 La TEI perchè  Proliferazione degli schemi di codifica  Difficoltà per il mondo umanistico ad avere visibilità.
Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi.
Documenti XML ben formati Altre componenti di un documento XML – Struttura dei documenti XML.
Laboratorio di XHTML e CSS
2 Indice Un esempio Che cosa è A cosa serve Confronto con HTML Punti di forza La sua struttura.
Tecnologia per la comunicazione
Transcript della presentazione:

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica Capitolo V.

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Le forme della rappresentazione digitale La rappresentazione livello zero: codifica ASCII – stringhe di caratteri non interpretate Laggiunta di informazioni sul testo e sul documento: i linguaggi di codifica – dati informazionali sulle istanze di contenuto tradite dalle fonti testuali

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Testo e documento Il documento come rappresentazione MATERICA e MATERIALE della fonte Il testo come fonte di contenuto, trasmissione di DATI INFORMAZIONALI Es. Rappresentazione logica del contenuto veicolato da una fonte testuale, il contenuto dellopera, che è il testo VS una specifica rappresentazione fisica, cioè una particolare edizione del testo, che è il documento, vale a dire lattestazione fisica del testo, lo specifico esemplare.

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, I linguaggi dichiarativi e procedurali Sistemi di tipo WYSIWYG (What You See Is What You Get) – a interfaccia grafica Sistemi basati sui markup language: 1. PROCEDURALI (specific markup), che istruiscono il device di output sullaspetto del documento; 2. DICHIARATIVI (generic markup) che consentono di aggiungere informazioni sul testo

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, SGML Standard Generalized Markup Language Linguaggio di markup dichiarativo per la codifica della struttura logica delle fonti testuali. Metalinguaggio che consente lelaborazione di linguaggi di codifica fornendo principi sintattici. Markup: aggiunta di informazioni a ogni partizione logica della fonte tramite tag Aspetto tag: delimitatori che contengono linformazione utile a descrivere la porzione di testo, nella forma: Concetto di DTD come luogo utile a specificare il valore di ogni elemento che si intende utilizzare in fase di markup

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, HTML Hyper Text Markup Language DTD SGML: set di marcatori ad hoc per la codifica di costrutti ipertestuali Principi sintattici basati su SGML Struttura del codice: testo a cui si riferisce il marcatore Limiti HTML: linguaggio non modificabile, scarsamente strutturato, predilezione marcatori stilistici

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Un file HTML Le Stanze di Poliziano Stanze Angelo Poliziano LIBRO PRIMO 1 Preposizione Le gloriose pompe e' fieri ludi della città che 'l freno.. 2 Invocazione ad Amore. O bello idio ch'al cor per gli occhi.. dolce disir d'amaro pensier..

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, XML Extensible Markup Language Sottoinsieme SGML (non DTD!) semplificato e ottimizzato specificamente per applicazioni in ambiente Word Wide Web Propensione per la descrizione della struttura logica della fonte rispetto alla resa grafica in layout Aspetto del documento delegato ad altri linguaggi (come XSL) Utilizzo di DTD esistenti o creazione dei marcatori ad hoc per la tipologia documentaria Documenti XML validi (che si rifanno a una DTD) e ben- formati (well-formed), ossia che si limitano ad aderire alle norme sintattiche XML

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, File per lavorare con XML Documento XML (file.xml): struttura gerarchica ad albero dei marcatori – concetto di elemento, attributo ed entità DTD (file.dtd): specificazione dei nomi degli elementi e delle mutue relazioni gerarchiche, degli attributi e dei riferimenti di entità utilizzati nel documento XML Foglio di stile (file.xsl): descrizione del layout, di come appariranno in fase di visualizzazione le porzioni di testo codificate nel file XML

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Un documento XML Stanze Angelo Poiliziano LIBRO PRIMO 1 Preposizione Le gloriose pompe e' fieri ludi della città che 'l freno Invocazione ad Amore O bello idio ch'al cor per gli occhi.. dolce disir d'amaro pensier.....

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Schema ad albero POEMA TITOLO AUTORE CANTO CANTO INTESTAZIONE OTTAVA OTTAVA … TITOLO VERSO VERSO VERSO …

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Porzione di DTD

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Porzione di file XSL

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Alcuni standard correlati a XML Gestione dei fogli di stile: XSL (Extensible Stylesheet Language) Gestione dei link ipertestuali: XML Linking Language (Xlink e Xpointer) Gestione dei metadati: RDF (Resource Description Format )

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La DTD per i testi umanistici: Text Encoding Initiative (TEI) DTD elaborata per la gestione dei testi letterari Nasce per SGML e ora è compatibile anche con XML Prevede la codifica di ogni fenomeno letterario (conta oltre 400 elementi) TEILite – versione ridotta dello schema di codifica Pizza Chef – per la creazione del set di marcatori ad hoc per la tipologia testuale o gli scopi della ricerca

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Struttura TEI Divisa in sezioni: elementi utilizzabili in ogni tipo di testo elementi specifici per tipologia testuale (testo in prosa, in versi, testo drammatico, dizionario, trascrizione di registrazioni verbali) elementi legati agli obiettivi della resa computazionale (codifica di fonti primarie e predisposizione dellapparato delle varianti, codifica di strutture morfosintattiche, rappresentazione di strutture interpretative profonde, rappresentazione di costrutti ipertestuali)

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, Schema base della DTD TEI [start tag della TEI] [informazioni relative allesemplare cartaceo di riferimento e alla versione elettronica - metadati] [start tag del testo] [dati che precedono il corpo del documento] [corpo del testo] [dati che seguono il corpo del documento] [end tag del testo] [end tag della Tei]