Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoBernardino Galli Modificato 10 anni fa
1
Edizione digitale di testi epigrafici classici e medievali
Daniele Fusi
2
Edizione digitale Obiettivi
3
Molteplici media e pubblici
cd-rom o dvd sito web unica banca dati libri elettronici chiosco museale libri
4
Vari livelli di specializzazione
epigrafia archeologia unica banca dati livelli di fruizione filologia e linguistica paleografia
5
Longevità uso di tecnologie standard
indipendenza da qualsiasi particolare forma e medium di pubblicazione dei dati elevata capacità di trasformazione dei dati, intrinseca al progetto editoriale
6
Esempi di uso specialistico: sistemi esperti
linguistico: software di flessione morfologica diacronica e sincronica; lemmatizzazione automatica metrico: software di analisi e scansione metrica di versi greci e latini; corpus metrico paleografico: algoritmi di riconoscimento neurale, corpora paleografici interattivi
7
Realizzazione ed espansione
Principi generali
8
Semantizzazione dei contenuti
lemma morfologia etimo traducente fraseologia opera etc ...
9
Semantizzazione: usi elenco alfabetico dei lemmi, diretto o inverso
lemma elenco alfabetico dei lemmi, diretto o inverso morfologia elenco dei lemmi per categoria grammaticale etimo dizionario etimologico (elenco lemmi per radicale) traducente vocabolario bilingue (italiano <> greco) fraseologia ricerca per fraseologia opera elenco dei luoghi citati, elenco dei lemmi per occorrenza etc ... lemma morfologia ricerche combinate etimo opera etc ...
10
Peculiarità del documento epigrafico
supporto: monumento e funzione contesto storico e materiale materiale, tecnica, forme testo: lingua o dialetto ortografia ed ‘errori’ Il documento epigrafico è particolare nella misura in cui è portatore di un testo giuntoci direttamente sul suo supporto originale. Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico: il testo è parte integrante di un monumento inserito in un dato contesto, ed è prezioso testimone dell’evoluzione della lingua o delle sue particolarità regionali.
11
Ortografia e prassi editoriali
Διονύσις 1. Ἀντώνιος 2. Ἀντώνις η = ι (= υ, ει, οι, υι, ηι) 3. Ἀντώνης (m. -ης) Esempio di una delle prassi editoriali per l’ortografia: epyesen, Dionysis, is come su pietra. Il testo appare certo strano ai nostri occhi, e una scelta simile potrebbe finire per rendere il testo di difficile lettura per non specialisti; epyesen e is sono grafie “scorrette” da itacismo che un altro editore potrebbe scrivere epoiesen, eis; ma già per Dionysis la situazione è più complessa, dato che secondo un fenomeno che inizia dall’età ellenistica prob. il cambiamento nella natura dell’accento provoca la caduta della V posttonica, sicché sost. di II in -ios > -is finendo così per passare alla I declinazione come i maschili in –e:s (Antonis < Antonios). Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ion e forse influsso di -arium provoca la creazione di neutri in -in (spesso -arin) di II (μισθάριν). E’ quindi chiaro che nessuna soluzione puo’ teoricamente imporsi in modo sistematico, ma d’altronde e’ necessaria una convenzione omogenea. Il problema e’ reso piu’ acuto se si pensa poi alla costituzione di indici (se si registra epyesen chi cerca epoiesen non lo trovera’, e viceversa), ancor piu’ evidente nel caso di corpora elettronici (ricerche e indicizzazioni).
12
Livelli di semantizzazione del testo
minimo: puro testo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT
13
Livelli di semantizzazione del testo
medio: testo continuo marcato (es. XML) abbreviazione = Aulo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT <x>A</x> • <y>FABIO</y> • A • F • FABI- ANO • <z>EQVITI</z> ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • <n>XX</n> • A • FABIVS • TROPHIMVS PATER • FECIT titolo numerale nomen
14
Testo continuo marcato: vantaggi
semantizzazione standardizzazione (es. XML, Unicode) testo continuo interpretabile e fungibile a diversi livelli piattaforma di scambio, trasformabilità
15
Testo continuo marcato: svantaggi
<ln><x>A</x> • <y>FABIO<y> • A • F • FABI-</ln> <ln>ANO • <z>EQVITI</z></ln> patronimico abbreviazione = Aulo abbreviazione = Auli nomen cognomen praenomen abbreviazione = filio nidificazione e complicazione della struttura limite alla sovrapposizione di tag costrizione del dato metatestuale titolo nome completo = Aulo Fabio Auli filio Fabiano etc. ...
16
Banca dati non semplice testo marcato ma banca dati altamente strutturata luogo data etc. etc. apparato: [...] dati di scavo testo: [...] testo bibliogr.: [...] bibliografia dati scavo: [...] data: [......] apparato luogo: [......]
17
Dal testo continuo alla banca dati
dati identificativi classificazione luogo intestazione data corpus bibliografia gruppi di testi iscrizioni dati di scavo abcdefg hijkl mno pqrstuv wxy z ... descr. fisica descr. paleografica media associati commento testo apparato etc. ...
18
Banca dati XML testo ‘amorfo’ e decomposto, massima separazione forme / contenuto struttura slegata dal testo e dettata da soli criteri semantici dato metatestuale libero di espandersi e strutturarsi secondo le sue specificità struttura aperta: espansione in pubblicazione (media e pubblici) e redazione (aggiunta di materiale e specializzazione)
19
Edizione elettronica trasformazione media associati
diversi output per vari media e pubblici unica banca dati (repertorio) XML trasformazione incluso testo XML continuo (es. TEI) media associati indicizzazione automatica in database relazionali
20
Banca dati (repertorio) XML
conservazione dei vantaggi di XML: standardizzazione (XML, Unicode, etc.) formato di scambio flessibilità e apertura a espansione eliminazione degli svantaggi di XML: semplificazione delle strutture (nidificazione) no limitazioni intrinseche (sovrapposizione) velocità di accesso nella pubblicazione tramite indicizzazioni automatiche in database relazionali
21
Trasformazione testuale
(1) repertorio strutturato (2) preprocessing
22
Trasformazione testuale
(1) repertorio strutturato (2) preprocessing (3) conversione e pubblicazione: medium e formati (HTML, PDF, DOC, SQL, TEI, etc.) risorse tipografiche (es. font) impaginazione tipografica
23
Esempi di realizzazione
Stratigrafia testuale e ramificazione
24
Stratificazione del testo
... altri strati ... “in pace” strato di traduzione la pace qui va intesa... strato di commento EN EIPHNH edd. strato di apparato Epedit: layers. EIPHNH strato ortografico: istruzione H > EI HPHNH testo di base come sulla pietra
25
Strato ortografico: indici e ricerca
doppio testo: ortografia storica (KATAKITE) e normativa (KATAKEITAI) ricerche intelligenti: effettuabili su ogni strato: KATAKITE = KATAKEITAI, EPYHSEN = EPOIHSEN parametri avanzati (es. tutte le parole con I per EI, tutte le forme di KEITAI con E per AI, tutti gli errori nelle forme di KEITAI [KITE: I=EI, E=AI], ...) creazione automatica di indici: linguistici di errori paleografici
26
Esempi di espansione unica struttura di banca dati, unico software distribuito (web) di data entry e trasformazione nuovi strati: nessi e legature prosopografia citazioni letterarie nuovi rami (specializzazione): paleografia descrizione fisica
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.