Edizione digitale di testi epigrafici classici e medievali

Slides:



Advertisements
Presentazioni simili
Dizionari elettronici in glottodidattica: possibilità attuali e potenzialità future Isabella Chiari Dizionari elettronici in glottodidattica: possibilità.
Advertisements

INFORMATICA UMANISTICA MODULI B, C E D
La redazione delle circolari e della documentazione Corso di formazione interno – 10 e 17 marzo 2008 Alberto Ardizzone – Silvana Massobrio USR Lombardia.
Informatica umanistica: Moduli B, C e D
INFORMATICA UMANISTICA MODULI B, C E D Massimo Poesio (B, D) Marco Baroni (Lab D) Roberto Zamparelli (C)
DBMS (DataBase Management System)
LexLEGIS PRESENTAZIONE SOLUZIONE LexLEGIS 1.0. LexLEGIS IL PROBLEMA Redazione di corpi normativi in ottemperanza alle linee guida della presidenza della.
PHP.
BIBLIOTECAScuola Superiore Sant'Anna LA RICERCA INTEGRATA DELLE RISORSE ELETTRONICHE : metasearch e link resolver CONCETTI E STRUMENTI A cura di Maria.
Seminario di aggiornamento
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica.
CP Strumenti informatici per le discipline storico-giuridiche
La conoscenza del diritto e le scienze dellinformazione Nicola Palazzolo.
CORSO Lim-Elearning A.F
Il progetto Media Library e nuovi servizi via web Gabriele Iotti 18 novembre Biblioteca di Scandiano Conferenze di Servizio.
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Rinasco Il recupero retrospettivo degli inventari degli archivi storici comunali nella Regione Lazio Arezzo, 7 settembre 2010
Informatica.science.unitn.it Un esempio di architettura basata sulluso di XML e XSL per la pubblicazione di un sito web.
Servizio per la comunicazione e divulgazione scientifica Ricerca pubblica: accesso aperto Forum PA, Roma, 16 maggio 2012.
LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: le banche dati
E-learning e tecnologia dei learning object:
Contenuti digitali Crearli, gestirli, farne degli oggetti editoriali.
Le fonti storiche.
S ILVIO S ALZA - Università di Roma La Sapienza – Aspetti tecnologici della conservazione permanente C ONVEGNO DocArea – Bologna 20 aprile Aspetti.
1 Convegno Forum PA - 9 maggio 2005 Repertorio nazionale dei dati territoriali e collaborazione tra Stato, Regioni ed enti locali Elettra Cappadozzi CNIPA.
g.contardi1 EVOLUZIONE INDICE SBN Uninfrastruttura per i servizi catalografici.
Il Sistema Informativo Generale del Catalogo: strumento per la conoscenza, la tutela e la valorizzazione del patrimonio culturale nazionale Roma, 22 novembre.
Catalogazione e controllo di autorità Linee di evoluzione per le Regole italiane di catalogazione 21 novembre Roma, Istituto della Enciclopedia Italiana,
Lautore e il ricercatore nellambiente digitale 2. edizione 12 aprile 2007 Introduzione al Portale AIRE A cura di Cristina Capodaglio (Biblioteca del Dipartimento.
Modello Relazionale Definisce tipi attraverso il costruttore relazione, che organizza i dati secondo record a struttura fissa, rappresentabili attraverso.
Informatica giuridica Informatica e lingua del diritto Nicola Palazzolo Anno Accademico 2006/2007.
Informatica giuridica Sistemi informativi e documentazione giuridica italiana Lucio Maggio ~ Ignazio Zangara Anno Accademico 2006/2007.
Informatica giuridica Sistemi informativi e documentazione giuridica Lucio Maggio Anno Accademico 2008/2009.
Cos’è un CMS? Content Management System
1 RISORSE DISPONIBILI PER GLI UTENTI B.A.U. Orientamento bibliografico – II modulo.
A cura di Laura Prosdocimi Biblioteca del Dip.to di Filosofia La Biblioteca e le sue risorse - 27 novembre 2009 R EF W ORKS.
RefWorks A cura di Laura Prosdocimi, Mariagrazia Campello
A cura di Laura Prosdocimi Biblioteca del Dip.to di Filosofia La Biblioteca e le sue risorse - 24 marzo 2009 R EF W ORKS.
Banche dati in rete dateneo Cosa faremo: Primo giorno Introduzione alle principali banche dati umanistiche Secondo giorno Esercitazioni.
Strategie d’uso del computer nella didattica
1 una piattaforma 2.0 per la gestione multicanale di riviste Il caso studio di Vita Trentina Editrice Un progetto.
GEOFFREY LEECH A GUIDE TO GOOD PRACTICE ADDING LINGUISTIC ANNOTATION Federica Chierici.
Large linguistically-processed Web corpora for multiple languages Marco Baroni e Adam Kilgarrif in Proceedings of EACL 2006 presentazione Fantini - Inglese.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
Alma Mater Studiorum – Università di bologna
La Commissione Documentazione & Informazione Attività di studio e normazione relativa ai seguenti ambiti: - Principi, regole, caratteristiche, requisiti,
La bibliografia costituita da tutte le fonti (cartacee, multimediali, elettroniche) che si sono usate direttamente e indirettamente consente al lettore.
Crystal Reports COPYRIGHT © 2007 BUSINESS OBJECTS SA. TUTTI I DIRITTI RISERVATI. DIAPOSITIVA 2 Positioning statement - IT Crystal Reports 2008 offre.
MD Consult raggruppa e gestisce le principali risorse elettroniche disponibili in ambito medico-clinico in un unico servizio online progettato per supportare.
Stefano Di Giovannantonio ECM Consulting Solution Expert
1 w w w. g a t 4. c o m WI GAT WebIngelligence rappresenta una piattaforma funzionale e tecnologica per la creazione e gestione di un datawarehouse che.
Biblioteche oggi La ricerca on-line, gli OPAC
Biblioteche oggi La ricerca on-line, gli OPAC Anna Colotto, Elisa Fiocchi Pisa 28/11/2005.
Biblioteca come standardizzazione Daniela Fiaschi, Pisa 14/10/2005.
Editoria culturale piemontese Catalogo
1 Sharpdesk Descrizione generale Editoria ComposerRicerca Elaborazione immagini.
Creazione di pagine per Internet Brevi note a cura di Emanuele Lana
Valutazione delle pubblicazioni Il concetto di valutazione può essere di per sé ampio, ma anche ambiguo. In senso generale valutare una pubblicazione può.
Francesco Cicogna Creazione di un e-book E-book un e-Book (libro elettronico) è un libro in formato elettronico (digitale). E’ un file consultabile su.
Biblioteca Digitale Anno 2005 – 2006 GRUPPO METADATA Maestri Gianluca Dal Soglio Serena Conforti Laura Dazzi Enrico Vicini Matteo Cavicchia Daniele.
Tecnologie di InternetDocument Type Definition Dott. Nicola Dragoni Document Type Definition  Document Type Definition (DTD)  Documento XML valido 
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Regione Emilia-Romagna. Consiglio regionale, 14 febbraio la nuova società dello scambio nascita del World Wide Web (CERN Ginevra) creazione di.
RICI – Ricerca sull’Inchiesta della Congregazione dell’Indice
2 Indice Un esempio Che cosa è A cosa serve Confronto con HTML Punti di forza La sua struttura.
Elementi di statistica con R e i database Rocco De Marco rocco.demarco(a)an.ismar.cnr.it Ancona, 10 Aprile 2012.
Dal problema al programma – ciclo di sviluppo del software La scrittura del programma è solo una delle fasi del processo di sviluppo di un'applicazione.
Ministero della Giustizia Dipartimento dell’Organizzazione Giudiziaria, del personale e dei servizi Direzione Generale per i sistemi informativi automatizzati.
Transcript della presentazione:

Edizione digitale di testi epigrafici classici e medievali Daniele Fusi http://www.fusisoft.it/

Edizione digitale Obiettivi

Molteplici media e pubblici cd-rom o dvd sito web unica banca dati libri elettronici chiosco museale libri

Vari livelli di specializzazione epigrafia archeologia unica banca dati livelli di fruizione filologia e linguistica paleografia

Longevità uso di tecnologie standard indipendenza da qualsiasi particolare forma e medium di pubblicazione dei dati elevata capacità di trasformazione dei dati, intrinseca al progetto editoriale

Esempi di uso specialistico: sistemi esperti linguistico: software di flessione morfologica diacronica e sincronica; lemmatizzazione automatica metrico: software di analisi e scansione metrica di versi greci e latini; corpus metrico paleografico: algoritmi di riconoscimento neurale, corpora paleografici interattivi

Realizzazione ed espansione Principi generali

Semantizzazione dei contenuti lemma morfologia etimo traducente fraseologia opera etc ...

Semantizzazione: usi elenco alfabetico dei lemmi, diretto o inverso lemma elenco alfabetico dei lemmi, diretto o inverso morfologia elenco dei lemmi per categoria grammaticale etimo dizionario etimologico (elenco lemmi per radicale) traducente vocabolario bilingue (italiano <> greco) fraseologia ricerca per fraseologia opera elenco dei luoghi citati, elenco dei lemmi per occorrenza etc ... lemma morfologia ricerche combinate etimo opera etc ...

Peculiarità del documento epigrafico supporto: monumento e funzione contesto storico e materiale materiale, tecnica, forme testo: lingua o dialetto ortografia ed ‘errori’ Il documento epigrafico è particolare nella misura in cui è portatore di un testo giuntoci direttamente sul suo supporto originale. Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico: il testo è parte integrante di un monumento inserito in un dato contesto, ed è prezioso testimone dell’evoluzione della lingua o delle sue particolarità regionali.

Ortografia e prassi editoriali Διονύσις 1. Ἀντώνιος 2. Ἀντώνις η = ι (= υ, ει, οι, υι, ηι) 3. Ἀντώνης (m. -ης) Esempio di una delle prassi editoriali per l’ortografia: epyesen, Dionysis, is come su pietra. Il testo appare certo strano ai nostri occhi, e una scelta simile potrebbe finire per rendere il testo di difficile lettura per non specialisti; epyesen e is sono grafie “scorrette” da itacismo che un altro editore potrebbe scrivere epoiesen, eis; ma già per Dionysis la situazione è più complessa, dato che secondo un fenomeno che inizia dall’età ellenistica prob. il cambiamento nella natura dell’accento provoca la caduta della V posttonica, sicché sost. di II in -ios > -is finendo così per passare alla I declinazione come i maschili in –e:s (Antonis < Antonios). Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ion e forse influsso di -arium provoca la creazione di neutri in -in (spesso -arin) di II (μισθάριν). E’ quindi chiaro che nessuna soluzione puo’ teoricamente imporsi in modo sistematico, ma d’altronde e’ necessaria una convenzione omogenea. Il problema e’ reso piu’ acuto se si pensa poi alla costituzione di indici (se si registra epyesen chi cerca epoiesen non lo trovera’, e viceversa), ancor piu’ evidente nel caso di corpora elettronici (ricerche e indicizzazioni).

Livelli di semantizzazione del testo minimo: puro testo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT

Livelli di semantizzazione del testo medio: testo continuo marcato (es. XML) abbreviazione = Aulo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT <x>A</x> • <y>FABIO</y> • A • F • FABI- ANO • <z>EQVITI</z> ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • <n>XX</n> • A • FABIVS • TROPHIMVS PATER • FECIT titolo numerale nomen

Testo continuo marcato: vantaggi semantizzazione standardizzazione (es. XML, Unicode) testo continuo interpretabile e fungibile a diversi livelli piattaforma di scambio, trasformabilità

Testo continuo marcato: svantaggi <ln><x>A</x> • <y>FABIO<y> • A • F • FABI-</ln> <ln>ANO • <z>EQVITI</z></ln> patronimico abbreviazione = Aulo abbreviazione = Auli nomen cognomen praenomen abbreviazione = filio nidificazione e complicazione della struttura limite alla sovrapposizione di tag costrizione del dato metatestuale titolo nome completo = Aulo Fabio Auli filio Fabiano etc. ...

Banca dati non semplice testo marcato ma banca dati altamente strutturata luogo data etc. etc. apparato: [...] dati di scavo testo: [...] testo bibliogr.: [...] bibliografia dati scavo: [...] data: [......] apparato luogo: [......]

Dal testo continuo alla banca dati dati identificativi classificazione luogo intestazione data corpus bibliografia gruppi di testi iscrizioni dati di scavo abcdefg hijkl mno pqrstuv wxy z ... descr. fisica descr. paleografica media associati commento testo apparato etc. ...

Banca dati XML testo ‘amorfo’ e decomposto, massima separazione forme / contenuto struttura slegata dal testo e dettata da soli criteri semantici dato metatestuale libero di espandersi e strutturarsi secondo le sue specificità struttura aperta: espansione in pubblicazione (media e pubblici) e redazione (aggiunta di materiale e specializzazione)

Edizione elettronica trasformazione media associati diversi output per vari media e pubblici unica banca dati (repertorio) XML trasformazione incluso testo XML continuo (es. TEI) media associati indicizzazione automatica in database relazionali

Banca dati (repertorio) XML conservazione dei vantaggi di XML: standardizzazione (XML, Unicode, etc.) formato di scambio flessibilità e apertura a espansione eliminazione degli svantaggi di XML: semplificazione delle strutture (nidificazione) no limitazioni intrinseche (sovrapposizione) velocità di accesso nella pubblicazione tramite indicizzazioni automatiche in database relazionali

Trasformazione testuale (1) repertorio strutturato (2) preprocessing

Trasformazione testuale (1) repertorio strutturato (2) preprocessing (3) conversione e pubblicazione: medium e formati (HTML, PDF, DOC, SQL, TEI, etc.) risorse tipografiche (es. font) impaginazione tipografica

Esempi di realizzazione Stratigrafia testuale e ramificazione

Stratificazione del testo ... altri strati ... “in pace” strato di traduzione la pace qui va intesa... strato di commento EN EIPHNH edd. strato di apparato Epedit: layers. EIPHNH strato ortografico: istruzione H > EI HPHNH testo di base come sulla pietra

Strato ortografico: indici e ricerca doppio testo: ortografia storica (KATAKITE) e normativa (KATAKEITAI) ricerche intelligenti: effettuabili su ogni strato: KATAKITE = KATAKEITAI, EPYHSEN = EPOIHSEN parametri avanzati (es. tutte le parole con I per EI, tutte le forme di KEITAI con E per AI, tutti gli errori nelle forme di KEITAI [KITE: I=EI, E=AI], ...) creazione automatica di indici: linguistici di errori paleografici

Esempi di espansione unica struttura di banca dati, unico software distribuito (web) di data entry e trasformazione nuovi strati: nessi e legature prosopografia citazioni letterarie nuovi rami (specializzazione): paleografia descrizione fisica