Edizione digitale di testi epigrafici classici e medievali Daniele Fusi http://www.fusisoft.it/
Edizione digitale Obiettivi
Molteplici media e pubblici cd-rom o dvd sito web unica banca dati libri elettronici chiosco museale libri
Vari livelli di specializzazione epigrafia archeologia unica banca dati livelli di fruizione filologia e linguistica paleografia
Longevità uso di tecnologie standard indipendenza da qualsiasi particolare forma e medium di pubblicazione dei dati elevata capacità di trasformazione dei dati, intrinseca al progetto editoriale
Esempi di uso specialistico: sistemi esperti linguistico: software di flessione morfologica diacronica e sincronica; lemmatizzazione automatica metrico: software di analisi e scansione metrica di versi greci e latini; corpus metrico paleografico: algoritmi di riconoscimento neurale, corpora paleografici interattivi
Realizzazione ed espansione Principi generali
Semantizzazione dei contenuti lemma morfologia etimo traducente fraseologia opera etc ...
Semantizzazione: usi elenco alfabetico dei lemmi, diretto o inverso lemma elenco alfabetico dei lemmi, diretto o inverso morfologia elenco dei lemmi per categoria grammaticale etimo dizionario etimologico (elenco lemmi per radicale) traducente vocabolario bilingue (italiano <> greco) fraseologia ricerca per fraseologia opera elenco dei luoghi citati, elenco dei lemmi per occorrenza etc ... lemma morfologia ricerche combinate etimo opera etc ...
Peculiarità del documento epigrafico supporto: monumento e funzione contesto storico e materiale materiale, tecnica, forme testo: lingua o dialetto ortografia ed ‘errori’ Il documento epigrafico è particolare nella misura in cui è portatore di un testo giuntoci direttamente sul suo supporto originale. Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico: il testo è parte integrante di un monumento inserito in un dato contesto, ed è prezioso testimone dell’evoluzione della lingua o delle sue particolarità regionali.
Ortografia e prassi editoriali Διονύσις 1. Ἀντώνιος 2. Ἀντώνις η = ι (= υ, ει, οι, υι, ηι) 3. Ἀντώνης (m. -ης) Esempio di una delle prassi editoriali per l’ortografia: epyesen, Dionysis, is come su pietra. Il testo appare certo strano ai nostri occhi, e una scelta simile potrebbe finire per rendere il testo di difficile lettura per non specialisti; epyesen e is sono grafie “scorrette” da itacismo che un altro editore potrebbe scrivere epoiesen, eis; ma già per Dionysis la situazione è più complessa, dato che secondo un fenomeno che inizia dall’età ellenistica prob. il cambiamento nella natura dell’accento provoca la caduta della V posttonica, sicché sost. di II in -ios > -is finendo così per passare alla I declinazione come i maschili in –e:s (Antonis < Antonios). Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ion e forse influsso di -arium provoca la creazione di neutri in -in (spesso -arin) di II (μισθάριν). E’ quindi chiaro che nessuna soluzione puo’ teoricamente imporsi in modo sistematico, ma d’altronde e’ necessaria una convenzione omogenea. Il problema e’ reso piu’ acuto se si pensa poi alla costituzione di indici (se si registra epyesen chi cerca epoiesen non lo trovera’, e viceversa), ancor piu’ evidente nel caso di corpora elettronici (ricerche e indicizzazioni).
Livelli di semantizzazione del testo minimo: puro testo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT
Livelli di semantizzazione del testo medio: testo continuo marcato (es. XML) abbreviazione = Aulo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT <x>A</x> • <y>FABIO</y> • A • F • FABI- ANO • <z>EQVITI</z> ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • <n>XX</n> • A • FABIVS • TROPHIMVS PATER • FECIT titolo numerale nomen
Testo continuo marcato: vantaggi semantizzazione standardizzazione (es. XML, Unicode) testo continuo interpretabile e fungibile a diversi livelli piattaforma di scambio, trasformabilità
Testo continuo marcato: svantaggi <ln><x>A</x> • <y>FABIO<y> • A • F • FABI-</ln> <ln>ANO • <z>EQVITI</z></ln> patronimico abbreviazione = Aulo abbreviazione = Auli nomen cognomen praenomen abbreviazione = filio nidificazione e complicazione della struttura limite alla sovrapposizione di tag costrizione del dato metatestuale titolo nome completo = Aulo Fabio Auli filio Fabiano etc. ...
Banca dati non semplice testo marcato ma banca dati altamente strutturata luogo data etc. etc. apparato: [...] dati di scavo testo: [...] testo bibliogr.: [...] bibliografia dati scavo: [...] data: [......] apparato luogo: [......]
Dal testo continuo alla banca dati dati identificativi classificazione luogo intestazione data corpus bibliografia gruppi di testi iscrizioni dati di scavo abcdefg hijkl mno pqrstuv wxy z ... descr. fisica descr. paleografica media associati commento testo apparato etc. ...
Banca dati XML testo ‘amorfo’ e decomposto, massima separazione forme / contenuto struttura slegata dal testo e dettata da soli criteri semantici dato metatestuale libero di espandersi e strutturarsi secondo le sue specificità struttura aperta: espansione in pubblicazione (media e pubblici) e redazione (aggiunta di materiale e specializzazione)
Edizione elettronica trasformazione media associati diversi output per vari media e pubblici unica banca dati (repertorio) XML trasformazione incluso testo XML continuo (es. TEI) media associati indicizzazione automatica in database relazionali
Banca dati (repertorio) XML conservazione dei vantaggi di XML: standardizzazione (XML, Unicode, etc.) formato di scambio flessibilità e apertura a espansione eliminazione degli svantaggi di XML: semplificazione delle strutture (nidificazione) no limitazioni intrinseche (sovrapposizione) velocità di accesso nella pubblicazione tramite indicizzazioni automatiche in database relazionali
Trasformazione testuale (1) repertorio strutturato (2) preprocessing
Trasformazione testuale (1) repertorio strutturato (2) preprocessing (3) conversione e pubblicazione: medium e formati (HTML, PDF, DOC, SQL, TEI, etc.) risorse tipografiche (es. font) impaginazione tipografica
Esempi di realizzazione Stratigrafia testuale e ramificazione
Stratificazione del testo ... altri strati ... “in pace” strato di traduzione la pace qui va intesa... strato di commento EN EIPHNH edd. strato di apparato Epedit: layers. EIPHNH strato ortografico: istruzione H > EI HPHNH testo di base come sulla pietra
Strato ortografico: indici e ricerca doppio testo: ortografia storica (KATAKITE) e normativa (KATAKEITAI) ricerche intelligenti: effettuabili su ogni strato: KATAKITE = KATAKEITAI, EPYHSEN = EPOIHSEN parametri avanzati (es. tutte le parole con I per EI, tutte le forme di KEITAI con E per AI, tutti gli errori nelle forme di KEITAI [KITE: I=EI, E=AI], ...) creazione automatica di indici: linguistici di errori paleografici
Esempi di espansione unica struttura di banca dati, unico software distribuito (web) di data entry e trasformazione nuovi strati: nessi e legature prosopografia citazioni letterarie nuovi rami (specializzazione): paleografia descrizione fisica