Informatica Umanistica

Slides:



Advertisements
Presentazioni simili
Le funzioni dell’ “Operatore”.
Advertisements

Informatica II – Basi di Dati (08/09) – Parte 1
1 t Mobilità internazionale e conversione dei voti Maria Sticchi Damiani Università della Calabria 8 febbraio 2013.
ECTS: la conversione dei voti Maria Sticchi Damiani Parte IV Conservatorio di Musica “N. Paganini” Genova, 2 maggio
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
/ fax
Tecnologia dell’architettura
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica.
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
1 Tavolo del Patto per la crescita intelligente, sostenibile e inclusiva Il ricorso agli ammortizzatori sociali nei territori colpiti dagli eventi sismici.
DISEGNO TECNICO INDUSTRIALE
S.B.Capitanio Risultati Questionario Qualità Genitori Medie a.s Risultato Questionari Genitori medie
1 Istruzioni, algoritmi, linguaggi. 2 Algoritmo per il calcolo delle radici reali di unequazione di 2 o grado Data lequazione ax 2 +bx+c=0, quali sono.
Dipartimento di Ricerca Sociale - Università del Piemonte Orientale 1 Castelli Aperti giugno 2005 Castello di Camino (AL) IL PUBBLICO DI CASTELLI.
PROGRAMMI DI COOPERAZIONE TERRITORIALE I controlli di primo livello in azione Un caso pratico Programma Interreg IV C Progetto B3 Regions Regione Piemonte.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Puntatori Marco D. Santambrogio – Ver. aggiornata al 21 Marzo 2013.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Lab 2 – Info B Marco D. Santambrogio – Riccardo Cattaneo –
1 Valutazione degli apprendimenti e portfolio delle competenze 1. Le pratiche di valutazione tra pensieri e saperi 3 marzo marzo 2007.
Esercitazione Pensare la comunicazione sociale
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Sociologia dei Processi Culturali
(Modulo base – Il restauro del testo)
e la storia della tradizione
INTRODUZIONE 1° lezione 23 settembre 2010 Anno Accademico 2010/2011.
Tabella di marcia e calendario
CORSO DI RICERCA BIBLIOGRAFICA 4. giornata (20 marzo 2008) Web of Science Beilstein e Gmelin Crossfire.
Laboratorio di Informatica
Strutture di controllo in C -- Flow Chart --
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
PROGETTO MICHAEL Censimento delle collezioni digitalizzate dellAteneo di Trento Convegno "Collezioni digitali di periodici in Italia e in Europa: standard,
19 Lezione 21/5/04 Composizione dell'immagine 1 COMPOSIZIONE DELLIMMAGINE.
GiocHI sull’alfabeto A O I U ESEMPIO M E L A ESEMPIO ESEMPIO E L M A
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
HyperText Markup Language 17-23/6/08 Informatica applicata B Cristina Bosco.
Educare al multimediale 1 – Verso il digitale 2 Presentazione a cura di Gino Roncaglia Prima parte: Informazione in formato digitale.
DSA e strumenti compensativi
Test Reti Informatiche A cura di Gaetano Vergara Se clicchi sulla risposta GIUSTA passi alla domanda successiva Se clicchi sulla risposta ERRATA passi.
“Alla ricerca del senso” La missione della Famiglia
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
1 SOSTEGNO PSICOLOGICO SCUOLE DELLAQUILA. 2 Aiuto ai docenti in qualità di persone. L obiettivo è quello di sostenere e contenere lo stato emotivo personale.
1 Guida per linsegnamento nei corsi per il conseguimento del CERTIFICATO DI IDONEITÀ ALLA GUIDA DEL CICLOMOTORE.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
2000 Prentice Hall, Inc. All rights reserved. Capitolo 10 (Deitel) Strutture, unioni ed enumerazioni Sommario Introduzione Definire le strutture.
Istituto di Istruzione Secondaria Liceo Classico e Liceo Scientifico MASCALUCIA Copertina Realizzazione e foto: Carlo Manfredini,
1 Questionario di soddisfazione ATA - a. sc. 2008/09 Il questionario è stato somministrato nel mese di aprile Sono stati restituiti 29 questionari.
La tabella dei voti ECTS Maria Sticchi Damiani Sapienza, Roma 26 settembre
QUIZ – PATENTE EUROPEA – ESAME WORD
1101 = x 10 x 10 x x 10 x = CORRISPONDENZE
1 Questionario di soddisfazione Studenti - a. sc. 2008/09 Il questionario è stato somministrato dal mese di aprile al mese di maggio Sono stati restituiti.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Array e stringhe Marco D. Santambrogio – Ver. aggiornata al 9 Agosto 2013.
I dati del questionario di autovalutazione dei docenti Prime rilevazioni.
Bando di Residenza Cap Scheda ENTE 3ROL - Richieste On Line.
1Piero Scotto - C14. Finalità del corso Programma Materiale Requisiti Spendibilità 2Piero Scotto - C14.
1 Guida per linsegnamento nei corsi per il conseguimento del CERTIFICATO DI IDONEITÀ ALLA GUIDA DEL CICLOMOTORE.
Bando Valorizzazione a rete. 2ROL - Richieste On Line Pittori e scultori.
Progettare corsi con Moodle
Modulo 6 Test di verifica
Bando Beni in comune. 2ROL - Richieste On Line 3.
Corsi di informatica ICCARBONERA.
lun mar mer gio ven SAB DOM FEBBRAIO.
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
Università di Bologna Dipartimento di Filosofia e comunicazione Corso di Filosofia del linguaggio LM 2014/15.
Informatica Introduzione alle basi di dati Lezione 2 Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
Prof. Romano Boni Assistente Silvia Torrani ECONOMIA AZIENDALE AA Note Organizzative.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
L’analisi di un libro di testo Seminario Irc e storia / 2 Sergio Cicatelli.
Transcript della presentazione:

Informatica Umanistica 29/03/2017 Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Analisi automatica di un testo. Metodi e strumenti Informatica Umanistica 29/03/2017 Analisi automatica di un testo. Metodi e strumenti Informatica e Analisi del testo letterario: un binomio, non un paradosso Lezione 7 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Il testo. Questa è la domanda… Informatica Umanistica 29/03/2017 Il testo. Questa è la domanda… Poi che, tacendo, si mostrò spedita l’anima santa di metter la trama in quella tela ch’io le porsi ordita. Dante Alighieri, Paradiso, XVII, vv. 100-2 Definizione: Dal latino textus, il cui uso in relazione al discorso linguistico viene sperimentato con Quintiliano E… il punto di vista? CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 Segre: il testo Il testo è serie di collegamenti, contenutistici e grammaticali Il testo letterario è: Comunicazione sui generis facile delimitazione (suggerita o esplicitamente indicata nella trascrizione o stampa) indeterminazione di contesto (l’emittente ignora per lo più le condizioni in cui il testo sarà letto) mancanza di tratti soprasegmentali CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 Corti: il testo il testo è enunciato di natura polisemica; ipersegno (complesso di segni verbali con Eco, “super-funzione segnica”) unità semiotica superiore al testo = macrotesto. il testo letterario è per sua natura costruito, più che tutti gli altri testi verbali, in maniera da offrire diversi percorsi significativi e comunicativi CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Il testo di riferimento: tradizione Informatica Umanistica 29/03/2017 Il testo di riferimento: tradizione il percorso dei testi dall’originale all’edizione a stampa è la tradizione < traditio < trado, consegna, insegnamento, lezione. Analisi della tradizione Scelta della fonte CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Il testo di riferimento: fonte Informatica Umanistica 29/03/2017 Il testo di riferimento: fonte il testo su supporto cartaceo (stampato, manoscritto…) memorizzato su supporto magnetico acquisito (tramite lo scanner o “a mano”) Codificato è la fonte CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Esempio di testo di riferimento Informatica Umanistica 29/03/2017 Esempio di testo di riferimento Il nostro esempio, scegliere il tipo di edizione: originale Vaticano Latino 3195: fonte diretta del Vat 3195: edizioni meccaniche, diplomatiche, interpretative scelta dell’edizione secondo i criteri: a) valore scientifico edizione b) autorevolezza e diffusione dell’edizione Contini 1964 (a voler essere pignoli riedizione Parigi, Tallone, 1949!) CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Storia della tradizione Informatica Umanistica 29/03/2017 Storia della tradizione [abbozzi e stesure precedenti alla sistemazione] [raccolta di testi non definitivi (Vaticano latino 3196)] Vaticano latino 3195 edizione Contini del 1949 edizione Contini del 1964 testo elettronico CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Conservazione o Perdita? Informatica Umanistica 29/03/2017 Conservazione o Perdita? ogni passaggio prevede una perdita di informazioni: la lezione del testo, ovvero errori di copia nelle parole (per chi ha fatto filologia, varianti sostanziali e varianti formali) gli elementi grafici che indicano la struttura del testo: titolo, sottotitolo, capitolo, paragrafo ecc. Ad esempio, l’andata a capo indica la fine di un verso; anticamente si usava un punto… noi useremo <l></l> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Edizione elettronica di un testo letterario Informatica Umanistica 29/03/2017 Edizione elettronica di un testo letterario CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 Processo di scansione Fotocopie del testo di riferimento Lo scanner digitalizza il testo come immagine L’OCR (Optical Character Recognize) tramite algoritmi tenta di identificare e trasformare l’immagine in carattere Prima scansione: errori di impostazione dell’OCR. Seconda scansione con impostazioni ad hoc Individuazione degli errori e correzione del testo. CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Edizione di un testo: techné Informatica Umanistica 29/03/2017 Edizione di un testo: techné Scansione e riconoscimento caratteri tramite OCR: CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Edizione di un testo: techné Informatica Umanistica 29/03/2017 Edizione di un testo: techné Controllo e correzione su eventuali errori di trascrizione: CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Altri esempi di errori di riconoscimento Informatica Umanistica 29/03/2017 Altri esempi di errori di riconoscimento CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Dichiarazione di responsabilità: TEI-HEADER Informatica Umanistica 29/03/2017 Dichiarazione di responsabilità: TEI-HEADER E la responsabilità del testo? Viene dichiarata nella TEI-HEADER Individuazione del testo elettronico attraverso indicazioni bibliografiche (titolo, autore, luogo e data di edizione, etc.) Certificazione della responsabilità editoriale del testo (anche nel caso in cui la codifica ha avuto diversi responsabili) Indicazione della fonte del testo elettronico (edizioni di testi già editi su stampa o trascrizioni di manoscritti) Documentazione accurata delle metodologie di rappresentazione dei vari fenomeni testuali, Documentazione delle scelte di approcci disciplinari o teorici che permettano di interpretare correttamente i simboli usati nella codifica del testo Documentazione delle eventuali correzioni e modifiche introdotte rispetto alla fonte. CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Le parti della TEI-Header Informatica Umanistica 29/03/2017 Le parti della TEI-Header CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Le parti della TEI-Header Informatica Umanistica 29/03/2017 Le parti della TEI-Header CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 1. TEI-Header del 268 <!DOCTYPE TEI.2 PUBLIC "-//TIL//DTD TIL 1.0//EN"> <tei.2> <teiHeader type="ISBD"> <fileDesc> <titleStmt> <title>Il canzoniere</title> <author> <persName> <surname>Francesco</surname> <forename>Petrarca</forename> </persName> </author> <respStmt> <resp>Prima edizione elettronica TIL a cura di </resp><name>Liber Liber</name> <resp>Codifica a cura di </resp><name>Maria Mataluno</name> </respStmt> </titleStmt> <editionStmt> <edition>Prima Edizione TIL</edition> </editionStmt> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 2. TEI-Header del 268 <publicationStmt> <publisher>Progetto Testi Italiani in Linea (TIL)</publisher> <pubPlace>Roma</pubPlace> <idno type="TIL">%numero di serie%</idno> <availability>&libero;</availability> <date value="%YYYY%">%data di edizione%</date> </publicationStmt> <seriesStmt> <title>&liber-til;</title> </seriesStmt> <sourceDesc> <biblFull> <titleStmt> <title>Il canzoniere</title> <author> <persName> <surname>Petrarca </surname> <forename>Francesco</forename> </persName> </author> <editor><name>Gianfranco Contini</name></editor> </titleStmt> <editionStmt> <edition></edition> </editionStmt> <publisher>Einaudi</publisher> <pubPlace>Torino</pubPlace> <date value="$AAAA$">1964</date> <title></title> </biblFull> </sourceDesc> </fileDesc> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 3. TEI-Header del 268 <encodingDesc> <projectDesc>&progTIL;</projectDesc> <editorialDecl>&liv1EdDec;</editorialDecl> </encodingDesc> <revisionDesc> <change> <date>19 gennaio 1997</date> <respStmt> <resp>Digitalizzazione e correzione</resp><name>Giovanna Surace</name> </respStmt> <item>Digitalizzazione e correzione del testo in base alla edizione di riferimento</item> </change> <date></date> <resp>Codifica TIL livello 1</resp><name></name> <item>Codifica SGML del testo in base al livello 1 del Progetto TIL</item> <date>19/12/2000</date> <resp>Revisione testo</resp><name>Rita Pancaldo</name> <item>Revisione testo in base alla edizione critica di Contini</item> </revisionDesc> </teiHeader> <text> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Potenzialità del testo elettronico Informatica Umanistica 29/03/2017 Potenzialità del testo elettronico Cdrom LIZ (Letteratura Italiana Zanichelli) CDrom LIE (Letteratura Italiana Einaudi) BIBIT (www.bibliotecaitaliana.it) LIBER LIBER (www.liberliber.it) CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 La codifica: prassi CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi comuni: <front> Informatica Umanistica 29/03/2017 Elementi comuni: <front> Avantesto: serie di documenti che introducono un testo nelle edizioni a stampa (pagina del titolo, frontespizio, introduzioni e prefazioni) <front> contiene i materiali di avantesto che precede il testo vero e proprio </front> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi comuni: <body> Informatica Umanistica 29/03/2017 Elementi comuni: <body> Corpo del testo: è il testo così come presumibilmente è stato concepito dall’autore <body> contiene l’intero corpo del testo </body> composto di capitoli (<div></div>), paragrafi (<div></div>), capoversi (<p></p>), testo CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi comuni: <head> Informatica Umanistica 29/03/2017 Elementi comuni: <head> Titolo: ogni titolo di ogni suddivisione strutturale del testo <head> contiene il titolo di una suddivisione strutturale </head> Possono essere presenti nel testo titolazioni complesse allo stesso livello strutturale possono essere utilizzati differenti elementi <head> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi specifici della codifica dei testi - PROSA Informatica Umanistica 29/03/2017 Elementi specifici della codifica dei testi - PROSA Capoverso: (paragraph) unità testuale di tipo testuale; è la porzione di testo di senso compiuto delimitato da indentazioni e/o salti di linea <p> Contiene e delimita il testo vero e proprio in blocco distinto </p> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi specifici della codifica dei testi - PROSA Informatica Umanistica 29/03/2017 Elementi specifici della codifica dei testi - PROSA Citazione: è parte integrante di un capoverso sia come testo delimitato da caporali sia come parte distinta organizzata in blocco di testo <q> contiene una citazione di qualunque tipo </q> Per specificare la natura della citazione si utilizzano gli attributi: <q rend=‘block’> contiene una citazione organizzata in blocco di testo </q> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi specifici della codifica dei testi - PROSA Informatica Umanistica 29/03/2017 Elementi specifici della codifica dei testi - PROSA Enfasi: alcune porzioni di testo possono essere evidenziate dall’autore del testo con il corsivo <hi rend=‘italic’> contiene la porzione di testo in corsivo </hi> <emph> contiene la porzione di testo enfatizzato dall’autore </emph> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi specifici della codifica dei TESTI DRAMMATICI Informatica Umanistica 29/03/2017 Elementi specifici della codifica dei TESTI DRAMMATICI Battuta: in un testo drammatico è la porzione di testo pronunciata da uno dei personaggi <sp> contiene la battuta pronunciata da un personaggio del testo drammatico </sp> questo elemento può contenere <speaker></speaker>; <p></p> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi specifici della codifica dei TESTI DRAMMATICI Informatica Umanistica 29/03/2017 Elementi specifici della codifica dei TESTI DRAMMATICI Personaggio: il protagonista della porzione di dialogo rappresentata dalla battuta <speaker> contiene il nome del personaggio che pronuncia la battuta </speaker> Questo elemento può contenere indicazioni sul font utilizzato per la rappresentazione es: <hi rend=‘italic’></hi> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Elementi specifici della codifica dei TESTI DRAMMATICI Informatica Umanistica 29/03/2017 Elementi specifici della codifica dei TESTI DRAMMATICI Didascalie: Indicazioni di scena fornite dall’autore <stage> contiene le indicazioni di scena e le didascalie fornite dall’autore</stage> CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura

Informatica Umanistica 29/03/2017 DUBBI? http://crilet.wordpress.com alessia.scacchi@uniroma1.it Ricevimento studenti ed esercitazioni: Martedì ore 14-16 Studio “210” DSFLL - Vetrerie Sciarra CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura CRILet - Centro Ricerche Informatica e Letteratura