La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 1 Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi.

Presentazioni simili


Presentazione sul tema: "CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 1 Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi."— Transcript della presentazione:

1 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 1 Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi

2 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 2 Analisi automatica di un testo. Metodi e strumenti Informatica e Analisi del testo letterario: un binomio, non un paradosso Lezione 7

3 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 3 Il testo. Questa è la domanda… Poi che, tacendo, si mostrò spedita lanima santa di metter la trama in quella tela chio le porsi ordita. Dante Alighieri, Paradiso, XVII, vv Definizione: Dal latino textus, il cui uso in relazione al discorso linguistico viene sperimentato con Quintiliano E… il punto di vista?

4 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 4 Segre: il testo Il testo è serie di collegamenti, contenutistici e grammaticali Il testo letterario è: Comunicazione sui generis facile delimitazione (suggerita o esplicitamente indicata nella trascrizione o stampa) indeterminazione di contesto (lemittente ignora per lo più le condizioni in cui il testo sarà letto) mancanza di tratti soprasegmentali

5 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 5 Corti: il testo il testo è enunciato di natura polisemica; ipersegno (complesso di segni verbali con Eco, super-funzione segnica) unità semiotica superiore al testo = macrotesto. il testo letterario è per sua natura costruito, più che tutti gli altri testi verbali, in maniera da offrire diversi percorsi significativi e comunicativi

6 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 6 Il testo di riferimento: tradizione –il percorso dei testi dalloriginale alledizione a stampa è la tradizione < traditio < trado, consegna, insegnamento, lezione. Analisi della tradizione Scelta della fonte

7 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 7 Il testo di riferimento: fonte –i–il testo su supporto cartaceo (stampato, manoscritto…) memorizzato su supporto magnetico acquisito (tramite lo scanner o a mano) Codificato è la fonte

8 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 8 Esempio di testo di riferimento –I–Il nostro esempio, scegliere il tipo di edizione: –o–originale Vaticano Latino 3195: fonte diretta –d–del Vat 3195: edizioni meccaniche, diplomatiche, interpretative –s–scelta delledizione secondo i criteri: »a»a) valore scientifico edizione »b»b) autorevolezza e diffusione delledizione »C»Contini 1964 (a voler essere pignoli riedizione Parigi, Tallone, 1949!)

9 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 9 Storia della tradizione [abbozzi e stesure precedenti alla sistemazione] [raccolta di testi non definitivi (Vaticano latino 3196)] Vaticano latino 3195 edizione Contini del 1949 edizione Contini del 1964 testo elettronico

10 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 10 Conservazione o Perdita? ogni passaggio prevede una perdita di informazioni: –l–la lezione del testo, ovvero errori di copia nelle parole (per chi ha fatto filologia, varianti sostanziali e varianti formali) –g–gli elementi grafici che indicano la struttura del testo: titolo, sottotitolo, capitolo, paragrafo ecc. Ad esempio, landata a capo indica la fine di un verso; anticamente si usava un punto… noi useremo

11 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 11 Edizione elettronica di un testo letterario

12 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 12 Processo di scansione 1.Fotocopie del testo di riferimento 2.Lo scanner digitalizza il testo come immagine 3.LOCR (Optical Character Recognize) tramite algoritmi tenta di identificare e trasformare limmagine in carattere 4.Prima scansione: errori di impostazione dellOCR. 5.Seconda scansione con impostazioni ad hoc 6.Individuazione degli errori e correzione del testo.

13 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 13 Edizione di un testo: techné Scansione e riconoscimento caratteri tramite OCR:

14 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 14 Edizione di un testo: techné Controllo e correzione su eventuali errori di trascrizione:

15 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 15 Altri esempi di errori di riconoscimento

16 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 16 Dichiarazione di responsabilità: TEI-HEADER E la responsabilità del testo? Viene dichiarata nella TEI-HEADER 1.Individuazione del testo elettronico attraverso indicazioni bibliografiche (titolo, autore, luogo e data di edizione, etc.) 2.Certificazione della responsabilità editoriale del testo (anche nel caso in cui la codifica ha avuto diversi responsabili) 3.Indicazione della fonte del testo elettronico (edizioni di testi già editi su stampa o trascrizioni di manoscritti) 4.Documentazione accurata delle metodologie di rappresentazione dei vari fenomeni testuali, 5.Documentazione delle scelte di approcci disciplinari o teorici che permettano di interpretare correttamente i simboli usati nella codifica del testo 6.Documentazione delle eventuali correzioni e modifiche introdotte rispetto alla fonte.

17 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 17 Le parti della TEI-Header

18 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 18 Le parti della TEI-Header

19 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura TEI-Header del 268 Il canzoniere Francesco Petrarca Prima edizione elettronica TIL a cura di Liber Liber Codifica a cura di Maria Mataluno Prima Edizione TIL

20 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura TEI-Header del 268 Progetto Testi Italiani in Linea (TIL) Roma %numero di serie% &libero; %data di edizione% &liber-til; Il canzoniere Petrarca Francesco Gianfranco Contini Einaudi Torino 1964

21 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura TEI-Header del 268 &progTIL; &liv1EdDec; 19 gennaio 1997 Digitalizzazione e correzione Giovanna Surace Digitalizzazione e correzione del testo in base alla edizione di riferimento Codifica TIL livello 1 Codifica SGML del testo in base al livello 1 del Progetto TIL 19/12/2000 Revisione testo Rita Pancaldo Revisione testo in base alla edizione critica di Contini

22 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 22 Potenzialità del testo elettronico Cdrom LIZ (Letteratura Italiana Zanichelli) CDrom LIE (Letteratura Italiana Einaudi) BIBIT (www.bibliotecaitaliana.it) LIBER LIBER (www.liberliber.it)

23 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 23 La codifica: prassi

24 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 24 Elementi comuni: Avantesto: serie di documenti che introducono un testo nelle edizioni a stampa (pagina del titolo, frontespizio, introduzioni e prefazioni) contiene i materiali di avantesto che precede il testo vero e proprio

25 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 25 Elementi comuni: Corpo del testo: è il testo così come presumibilmente è stato concepito dallautore contiene lintero corpo del testo composto di capitoli ( ), paragrafi ( ), capoversi ( ), testo

26 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 26 Elementi comuni: Titolo: ogni titolo di ogni suddivisione strutturale del testo contiene il titolo di una suddivisione strutturale Possono essere presenti nel testo titolazioni complesse allo stesso livello strutturale possono essere utilizzati differenti elementi

27 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 27 Elementi specifici della codifica dei testi - PROSA Capoverso: (paragraph) unità testuale di tipo testuale; è la porzione di testo di senso compiuto delimitato da indentazioni e/o salti di linea Contiene e delimita il testo vero e proprio in blocco distinto

28 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 28 Elementi specifici della codifica dei testi - PROSA Citazione: è parte integrante di un capoverso sia come testo delimitato da caporali sia come parte distinta organizzata in blocco di testo contiene una citazione di qualunque tipo Per specificare la natura della citazione si utilizzano gli attributi: contiene una citazione organizzata in blocco di testo

29 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 29 Elementi specifici della codifica dei testi - PROSA Enfasi: alcune porzioni di testo possono essere evidenziate dallautore del testo con il corsivo contiene la porzione di testo in corsivo contiene la porzione di testo enfatizzato dallautore

30 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 30 Elementi specifici della codifica dei TESTI DRAMMATICI Battuta: in un testo drammatico è la porzione di testo pronunciata da uno dei personaggi contiene la battuta pronunciata da un personaggio del testo drammatico questo elemento può contenere ;

31 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 31 Elementi specifici della codifica dei TESTI DRAMMATICI Personaggio: il protagonista della porzione di dialogo rappresentata dalla battuta contiene il nome del personaggio che pronuncia la battuta Questo elemento può contenere indicazioni sul font utilizzato per la rappresentazione es:

32 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 32 Elementi specifici della codifica dei TESTI DRAMMATICI Didascalie: Indicazioni di scena fornite dallautore contiene le indicazioni di scena e le didascalie fornite dallautore

33 CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 33 DUBBI? Ricevimento studenti ed esercitazioni: Martedì ore Studio 210 DSFLL - Vetrerie Sciarra


Scaricare ppt "CRILet di Giuseppe Gigliozzi - Centro Ricerche Informatica e Letteratura 1 Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi."

Presentazioni simili


Annunci Google