Lo spazio alpino tra plurilinguismo e omogeneità

Slides:



Advertisements
Presentazioni simili
Lalpeggio un mestiere antichissimo che risale alla preistoria.
Advertisements

PRESENTAZIONE DEGLI INDIRIZZI
Rete Tematica: Un contesto favorevole alle Lingue Roma, 7 dicembre 2005.
Rete di eccellenza dell’italiano istituzionale (REI)
Benvenuti !.
VERSO UN CURRICOLO PLURILINGUE, il “P. E. L
INDAGINE SULLUSO DELLE-BOOK PRESSO LE FACOLTÀ DI LETTERE E FILOSOFIA E DI INGEGNERIA DELLUNIVERSITÀ DEGLI STUDI DI PARMA Relatrice: Prof.ssa ANNA MARIA.
ISTITUTO COMPRENSIVO CAVALESE- SCUOLA SECONDARIA DI I GRADO AREA DI APPRENDIMENTO: LINGUE COMUNITARIE – LINGUA TEDESCA a.s. 2011/2012 Curricolo sperimentale.
Storia Moderna Le fonti
Introduzione filologia: edizione di testi
Una bussola per le scuole
Valorizzazione della diversità culturale, linguistica e religiosa Partecipazione Conoscenza Accoglienza e ascolto Voce degli studenti Competenze in lingua.
Università della Calabria Corso di laurea: Scienze della Formazione Primaria anno accademico Università della Calabria Corso di laurea: Scienze.
ITC TOSI, Busto Arsizio 23 aprile 2012
La semantica Introduzione alla scienza del significato.
Istituzioni di linguistica
IL CENTRO EUROPEO FORMAZIONE E ORIENTAMENTO
Corso di Informatica per Giurisprudenza
Sociologia dei Processi Culturali
Il lessico Lessico: insieme delle parole di una lingua (astratto)
Seminario Ambasciatori eTwinning LAquila settembre 2012.
Progetto EDUCAMBIENTE
Tabella di marcia e calendario
INFORMATICA E TECNOLOGIA DELLA COMUNICAZIONE IN RETE MODULO 2
ISFOL - Struttura di supporto alla cooperazione transnazionale FSE Roma, 18 maggio 2010 Prima mappatura delle esperienze progettuali per linclusione.
La radio digitale Il futuro di un mezzo senza età Roma 20 ottobre 2010.
Indicazioni nazionali per il curricolo della scuola dellinfanzia e del primo ciclo distruzione.
Presentazione a cura diSlide n.1 AVIPA 1. Presentazione generale dell'ambiente software Viterbo, 10 Dicembre 2008.
Comitato metodologie 9 luglio 2010 Costituzione di una rete per linnovazione metodologica nella produzione statistica.
Un futuro da tecnico delle costruzioni
IL NOME Orsola Buono e Melanie Pacini Classe 1° L
Strategie d’uso del computer nella didattica
13 maggio 2005I nuovi domini.eu: profili giuridici e prospettive per gli imprenditori 1 Il quadro internazionale dei nomi a dominio Stefano Trumpy CNR.
Riccardo Ridi - Università Ca Foscari, Venezia Giornata di studio ISKO / CTA Organizzare la conoscenza in musei, teatri e archivi multimediali Roma - 10.
Note per il corso di Informatica per le discipline umanistiche Biblioteche in rete 2 Marco Lazzari Università di Bergamo Facoltà di Lettere e Filosofia.
Seminario provinciale POSEIDON-ELLE Ravenna, 2-3 aprile 2012 Ore Aula Magna ITG Morigia.
Espressione polirematica
Liceo Scientifico “Galileo Galilei”
Quadro Orario settimanale
Il Servizio Nazionale di Valutazione come risorsa per il Dirigente scolastico: quadri di riferimento, lettura dei dati e percorsi di lavoro Lutilizzo dei.
I suoni delle lingue: fonetica e fonologia. 15 e 17 ottobre 2007
Rilevazione esiti formativi primo quadrimestre CLASSI SECONDE
I NUOVI LICEI DELLISTITUTO M. IMMACOLATA I NUOVI LICEI DELLISTITUTO M. IMMACOLATA ANNO SCOLASTICO
Approfondisce la conoscenza del sistema sociale, attraverso lo studio della sociologia, dellantropologia, del diritto e dell economia Introduce linformatica.
Progetto Alcotra 15 febbraio Obiettivo Cooperazione territoriale europea Italia-Francia (Alpi) Misura 3.4 Coopération enne France-Italie.
Settore di inserimento I-VI edizione Altro 5% Cinema 13% Web 3% Settore Comunicazione (Aziende, Banche, Istit. Pubb, Priv. o non Profit) 47% TV 22% Free.
UNIVERSITE DE FRIBOURG
Letteratura e teologia lez Ist. S'Ilario - Parma 1 Letteratura e teologia Lezione 4: metafora.
LA COMUNICAZIONE EFFICACE
Volterra 16 dicembre 2008 “La SISL del GAL Etruria” Riflessioni sulla passata programmazione : punti di forza e criticità a cura di M.Cristina Galli.
1 5' Incontro ISKO Italia Venezia : 1 aprile 2011 Sviluppi del Nuovo soggettario e integrazione con l'Opac della Bncf Isolina Baldi, Anna Lucarelli Biblioteca.
IL LINGUAGGIO VERBALE.
IN CHE COSA CONSISTE? TEMPI PROGETTO COMUNE PROGRAMMA GLI INTERESSATI COSTI OBIETTIVI SCAMBIO A.S. 2014/15 FOTOGALLERY.
Profilo in uscita Il corso liceale linguistico trae la sua peculiarità dalla presenza di tre Lingue straniere e dall'analisi della cultura europea nelle.
Università di Bologna Dipartimento di Filosofia e comunicazione Corso di Filosofia del linguaggio LM 2014/15.
“ La Responsabilità dell’Accompagnamento in Montagna ” Programma di Giornate di Studio Alpinismo Giovanile, Escursionismo, Esc. Senior 1° Edizione PALAMONTI.
Valorizzazione delle Esperienze e dei prodotti Turistici Transfrontalieri delle medie ed Alte quote PROGETTO VETTA Valorizzazione delle Esperienze e dei.
Gorgia toscana.
Letteratura e teologia lez Ist. S'Ilario - Parma 1 Letteratura e teologia Lezione 4: metafora.
Come costruire sistemi di elaborazione del linguaggio naturale Fornire le conoscenze necessarie per elaborare dati linguistici –Acustico-fonetiche (input.
Atlante Linguistico ed Etnografico del Piemonte Occidentale Dalla sistemazione in archivio all’interrogazione degli archivi: i dati etnolinguistici dell’ALEPO.
Istituzioni di linguistica
LICEO SCIENTIFICO SPORTIVO
SISTEMI INFORMATIVI AZIENDALI I° biennioII° biennioultimo anno 1^2^3^4^5^ Lingua e letteratura italiana44444 Lingua inglese33333 Storia, Cittadinanza.
MENTALITÀ, ISTITUZIONI CULTURALI, INTELLETTUALI E PUBBLICO
Giornate di informazione sull’offerta di istruzione del II ciclo PROVINCIA DI RAVENNA Ufficio X - Ambito Territoriale di Ravenna Il percorso di istruzione.
Immagini e carte tematiche utilizzate per le lezioni in classe
Referente per l’orientamento Prof. Elisabetta Anti ISTITUTO STATALE ISTRUZIONE SUPERIORE “L. Calabrese - P. Levi” ISIS “L.Calabrese- P.Levi” indirizzi.
Che cos’è la linguistica?
Transcript della presentazione:

Lo spazio alpino tra plurilinguismo e omogeneità La géolinguistique dans les Alpes au XXe siècle : méthodes, défis et perspectives CONFERENCE ANNUELLE DU CENTRE D'ÉTUDES FRANCOPROVENÇALES RENÉ WILLIEN, Saint-Nicolas, 23/11/2013 Lo spazio alpino tra plurilinguismo e omogeneità Thomas Krefeld | Stephan Lücke

1a parte 1. Per una stratigrafia dell'arco alpino 2. Percorsi esemplari 2.1. Tracce di sostrato (prelatino e romanzo) 2.2. Processi semantici Folien zu: © Thomas Krefeld | Stephan Lücke 2013 2

Delimitazione dello spazio progettuale: il perimetro della Convenzione Alpina http://www.alpconv.org/pages/default.aspx tedesco rom. lad. friul. slov. italiano francoprov. occitano 3

atlanti linguistici rilevanti (romanzi e non) SAO SBS BSA KBS VALTS SAT SDS TSA ASV ALD SLA ASLEF AIS ALJAN ALI ALL ALEPO ALP 4

compilare complettare

punti già georeferenziati LEMMA

esempio idealizzato: camoscio stratigrafia alpina esempio idealizzato: camoscio ? ? lomb. camoss strato germanico strato slavo frpr. tsamuh eng. chamuotsch ted. Gams ecc. etc. sl. gamsi sl. gamsi ? ? strato latino-romanzo camox, acc. camocem sostrato prelatino B sostrato prelatino C *CAMOX sostrato prelatino A ? ? 7 *c a m ox

esempio concreto – la semiotica dell'atlante: informazioni georeferenziate composte AIS 1192

le componenti dell‘informazione AIS 1192 le componenti dell‘informazione concetti n-x lessotipi n forme n parole (tokens)

pianta di una cascina di montagna posto da bestiame (pantune) AIS 1192a pianta di una cascina di montagna p. 19 Zernez (Grigioni) cose cantina da latte cantina da formaggio caldera luogo, dove si produce il f. caldera foco- lare AIS 1210

un insieme intricato parole cose concetti

caratteristiche delle cose (dei referenti) o tratti semantici delle parole? stalla d'alpe esempio: lessotipo corte in due punti vicini "di pietra, con fienile sopra" "posto all'aperto attorno alla cascina, da mungere e da dormire"

scomporre gli atlanti separare le tre dimensioni semiotiche del materiale concetti e tradizioni cose parole

complessità delle dimensioni forme tipizzare  lessotipi (lemmi) secondo le varietà standard la diffusione geolinguistica il significato strati etimologici prerlatino romanzo postromanzo

concetti tassonomia reti

ALPEGGIO rete onomasiologica (elementare) (2) EDIFICI (1) TERRENO STALLA FIENO CANTINA DA FORMAGGIO DA LATTE PASCOLO CASCINA INALPARE ALPEGGIO PASTORE DISALPARE MANDRA (3) PERSONE CACIAIO (5) BESTIAME FORMAGGIO LATTICINI ALP. PRIVATO BURRO ATTREZZI COOPERATIVO (4) LAVORAZIONE DEL LATTE

Ricomporre la cartografia in modo interattivo alcune domande guide quali concetti sono lessicalizzati e dove? quanti lessotipi (lemmi) concorrono e dove? quali lessotipi attraversano i confini delle famiglie linguistiche (romanzo-germanico-slavo)? quanti significati sono collegati a un lessotipo (o a una base lessicale)? quale è l'estensione degli strati diacronici?

1a parte 1. Per una stratigrafia dell'arco alpino 2. Percorsi esemplari 2.1. Tracce di sostrato (prelatino e romanzo) 2.2. Processi semantici Folien zu: © Thomas Krefeld | Stephan Lücke 2013 18

AIS 1192 CASCINA DI MONTAGNA tipo tegia < celt. tipo malga < prelatino tipo baita < prelatino tipo barga, bargun, margun < prelatino ted. Käser < rom. casera

dialetti tedeschi dialetti romanzi diffusione del lessotipo °casera 'cascina' http://www.verba-alpina.gwi.uni-muenchen.de/?karte=true

dialetti tedeschi dialetti romanzi diffusione del lessotipo °tegia CUCINA DI FORM. CASCINA diffusione del lessotipo °barga FIENILE D'ALP. STALLA D'ALP. http://www.verba-alpina.gwi.uni-muenchen.de/?karte=true

dialetti tedeschi dialetti romanzi diffusione del lessotipo °casera 'cascina' http://www.verba-alpina.gwi.uni-muenchen.de/?karte=true

1a parte 1. Per una stratigrafia dell'arco alpino 2. Percorsi esemplari 2.1. Tracce di sostrato (prelatino e romanzo) 2.2. Processi semantici Folien zu: © Thomas Krefeld | Stephan Lücke 2013 23

significati di °malga e derivati 1 2 34 5678 1 ALPEGGIO 2 INALPARE ammalgare 3 DISALPARE dismalgare 4 SCENDERE DALL'ALP malgare 5 MANDRA 6 MANDRA DI VACCHE 7 CACIAO (margaro-, -ese) 8 CASCINA

orizzonte semantico di malga e dei suoi derivati

La prospettiva informatica di VerbaAlpina 2a parte La prospettiva informatica di VerbaAlpina spiegazioni di carattere generale registrazione dei dati: sistematizzazione e sistema di trascrizione strutturazione e analisi dei dati Signore e signori, qui di seguito vogliamo illustrare il progetto verbaAlpina dal punto di vista informatico. Mi pare utile riprendere alcuni esempi già usati dal signor krefeld, ma in prospettiva differente. © Thomas Krefeld | Stephan Lücke 2013 26

Tabella dei progetti di Krefeld e Lücke Iniziato nel progetto internet 2006 ASiCa online www.asica.gwi.uni-muenchen.de 2009 Audioatlas Siebenbürgisch-Sächsischer Dialekte (ASD) www.asd.gwi.uni-muenchen.de 2010 Atlante digitale del‘Italia e della Svizzera meridionale (AdIS) www.adis.gwi.uni-muenchen.de 2011 Metropolitalia www.metropolitalia.org 2012 VerbaAlpina www.verba-alpina.gwi.uni-muenchen.de [Storia del progetto, informazioni generali su tecnica e organizzazione] Bisogna innanzitutto dire che verbaAlpina è l’ultimo nato di una serie di progetti sviluppati in collaborazione con Thomas Krefeld. La collaborazione ha avuto inizio nell’anno 2006 con l’Atlante sintattico della Calabria, ASiCa, un progetto geolinguistico sull’analisi di un corpus audio con registrazioni di dialetto calabrese sullo sfondo di mobilità migratoria. Già allora venne sviluppato il concetto tecnico e informatico, che ha poi trovato applicazione in tutti gli altri progetti, generalmente geolinguistici, quali l’Atlante audio di dialetti sassoni della Transilvania (ASD), o l‘Atlante digitale del‘Italia e della svizzera meridionale (AdIS) e adesso anche verbaAlpina. © Thomas Krefeld | Stephan Lücke 2013 27

concetto client/server PHP MySQL PHP Javascript/AX Le caratteristiche di base sono:   - un lavoro effettuato soprattutto con dati strutturati in banche dati relazionali. Come sistema di gestione di banca dati usiamo, finora, esclusivamente MySQL - tutti i progetti si basano su una tecnologia web indipendente da piattaforme e sul principio client-server. - la maggior parte dei nostri progetti è stata ed è realizzata nei linguaggi di programmazione PHP e javascript l’omogeneità dell’architettura software così come la produttività delle singole componenti garantisce una grande efficienza che permette di minimizzare le spese finanziarie e personali. L’utilizzo di un sistema coerente di banca dati relazionale porta a una raccolta dati sempre più ampia che consente analisi dati anche attraverso i limiti di singoli progetti, quindi collegandoli. Ai dati linguistici si aggiungono sempre più dati non linguistici, quali riferimenti geografici, dati storici, infrastruttua, etnografia ecc., che possono poi essere relazionati con con i dati linguistici e tra essi stessi. PHP © Thomas Krefeld | Stephan Lücke 2013 28

Ludwig-Maximilians-Universität München Quadro istitutionale Ludwig-Maximilians-Universität München Krefeld Facoltà di scienze umanistiche Facoltà 1: teologia cattolica Facoltà 2: teologia evangelica Facoltà 9: storia e arte Facoltà 10: filosofia Facoltà 12: scienze culturali Facoltà 13: lingue e letterature ITG (gruppo per l‘applicazione del‘informatica nel campo delle scienze umanistiche) 15 anni di esperienza nel campo delle „Digital Humanities“ (DH) 14 impiegati, di cui 7 a tempo indeterminato Ca. 30 server, 50 TB storage 80 banche dati, 40 progetti (fra l‘altro VerbaAlpina) www.itg.lmu.de Si noti ancora che tutti i progetti sono realizzati all’interno di un’infrastruttura professionale IT, con il sostegno delle facoltà di scienze umanistiche dell'università di Monaco. Così vengono garantite l'esistenza a lungo termine dei dati e il funzionamento del portale del progetto. Questa struttura e sempre di più una importante condizione per domande di finanziamento di progetti futuri. Lücke © Thomas Krefeld | Stephan Lücke 2013 29

Base dei dati: Atlanti e Dizionari Dopo queste spiegazioni di carattere generale sui precedenti e le condizioni tecniche, informatiche e istituzionali, passiamo adesso al progetto verbaAlpina. Il signor Krefeld ha già illustrato l'orizzonte linguistico così come alcuni aspetti a esso relativi. Io parlerò invece dell'elaborazione dati, sebbene mi concentri nel mio lavoro soprattutto sulla registrazione e strutturazione di dati, e procederò a spiegare alcuni dei procedimenti grazie all'aiuto di esempi.   Una parte centrale della banca dati di verbaAlpina è costituita, oltre che da dizionari contenenti materiale linguistico con riferimenti geografici, soprattutto da diversi atlanti linguistici, la cui area di indagine ricopre parzialmente o totalmente la zona di validità della convenzione alpina. ########################### SELECT abkuerzung sigla, replace(CONCAT(LEFT(`basiserfassung`, 100), '...'),'\r\n',' ') as bibliografia FROM `bibliographiekurz` where abkuerzung in ('all','ais','sds','valts','ald','sla','sao','alepo'); © Thomas Krefeld | Stephan Lücke 2013 30

AIS VALTS ALEPO ATLANTI: 1a fase della registrazione dei dati XXX … ALEPO ALD Informanti Stimuli La registrazione dei dati è fortemente sistematizzata: si procede innanzitutto estraendo da ogni atlante la lista degli stimoli, dei luoghi di indagine e/o degli informatori. Nella maggior parte dei casi è possibile trasformare, tramite OCR, queste liste in testo elettronico leggibile poi nella banca dati. Come detto prima, lavoriamo esclusivamente con dati cosidetti strutturati in banche dati relazionali. Ciò significa che tutti i dati vengono, prima d'ogni altra cosa, suddivisi in varie 'entità' ognuna con caratteristiche proprie. Ciò significa, concretamente, che stimoli e informatori vengono considerati come grandezze separate e perciò sistemate in tabelle diverse della banca dati. Nelle tabelle ogni voce della lista viene poi scritta in una propria linea e il contenuto della linea suddiviso così che le informazioni di ogni tipo stiano in colonne separate. ############################## select distinct abkuerzung from bibliographie; SELECT erhebung as atlante, nummer as numero_stimolo, stimulus as stimolo FROM `stimuli` where (stimulus like '%cascina%' or stimulus like '%sennhütte%' or stimulus like '%salamand%') and nummer not in ('1192a_1','1192a_2','3369') order by erhebung, cast(nummer as unsigned); (SELECT erhebung as atlante, ais_nr as numero_informante, ortsname as provenienza FROM `informanti` where sachaufnahmen = 0 and erhebung = 'AIS' limit 3) union (SELECT erhebung as atlante, ais_nr as numero_informante, ortsname as provenienza FROM `informanti` where erhebung = 'ASLEF' limit 3) (SELECT erhebung as atlante, ais_nr as numero_informante, ortsname as provenienza FROM `informanti` where erhebung = 'VALTS' limit 3) © Thomas Krefeld | Stephan Lücke 2013 31

X ATLANTI: 2a fase della registrazione dei dati prodotto cartesiano Vediamo qui un esempio tratto dal AIS: gli stimoli si trovano sulla colonna di sinistra, mentre il nome degli atlanti, il numero dello stimolo così come lo stimolo stesso si trovano in colonne separate. Allo stesso modo i dati sugli informatori si trovano sulla tabella di destra. Le due tabelle vengono collegate l'una all'altra in modo che ogni stimolo venga associato a ogni informante. In questo modo si viene a creare una nuova tabella che permette una registrazione automatica di tutte le espressioni. Le espressioni sono racchiuse nella casella enunciato. #################### SELECT s.erhebung as atlante, nummer as numero_stimolo, s.stimulus as stimolo, ais_nr as numero_informante, CASE WHEN a.aeusserung != '' or a.aeusserung is not null THEN a.aeusserung ELSE '[ancora da trascrivere]' END as beleg FROM `stimuli` s join informanti i using (erhebung) join aeusserungen a on (s.erhebung=a.erhebung and s.nummer=a.stimulus_nr and i.ais_nr=a.informant_nr) where nummer in ('IV_73' , '456_1') and s.va_relevant='1' order by s.erhebung, cast(nummer as unsigned); SELECT s.erhebung as atlante, nummer as numero_stimolo, s.stimulus as stimolo, ais_nr as numero_informante, '[trascrizione]' as beleg FROM `stimuli` s join informanti i using (erhebung) join aeusserungen a on (s.erhebung=a.erhebung and s.nummer=a.stimulus_nr and i.ais_nr=a.informant_nr) where nummer in ('IV_73' , '456_1') and s.va_relevant='1' order by s.erhebung, cast(nummer as unsigned); select *, " " as enunciato from (SELECT erhebung AS atlante, nummer AS numero_stimolo, stimulus AS stimolo FROM `stimuli` WHERE `nummer` LIKE '1192\_1' OR nummer LIKE '456\_1') q1 join (SELECT erhebung AS atlante, ais_nr AS numero_informante, ortsname AS località FROM `informanti` WHERE erhebung = 'AIS' AND ais_nr IN (1,122)) q2 using (atlante) © Thomas Krefeld | Stephan Lücke 2013 32

Sistema di trascrizione IPA Smarrimento di informazione Trasformazione automatica Registrato nella banca dati „Beta-Code“ la1 te?-/g)/a1 Regole di trascrizione Senza smarrimento di informazione Nella trascrizione sorge un problema: AIS ci fornisce un ottimo esempio – molto spesso gli atlanti utilizzano un sistema di trascrizione molto specifico. I caratteri utilizzati sono difficilmente digitabili dalle tastiere europee standard.  Molto spesso sono caratteri che non risultano nemmeno codificati nello standard unicode. Per questo motivo abbiamo deciso di adottare una soluzione pragmatica e al tempo stesso robusta: tutti i caratteri speciali vengono scritti come successione dei cosiddetti caratteri ASCII Come vedete dall'esempio "la tegia" dalla carta AIS 1192 (millecentonovantadue), informatore numero cinque: viene fatta una divisione tra caratteri base e diacritici. Si scrivono innanzitutto i caratteri base e poi i corrispettivi diacritici in una successione prestabilita, ovvero dal basso verso l'alto e da sinistra verso destra. I caratteri base non latini vengono altresì transcodificati: dall'alfa viene fuori una a latina seguita da un 1.   Questo procedimento ha diversi vantaggi: - le trascrizioni possono essere effettuate anche da persone che non conoscono il significato dei singoli caratteri. - la trascrizione non permette perdite di dati dal momento che ogni diacritico viene registrato con un carattere proprio. - il pericoli di mutilazione dei dati è molto limitato, diversamente dalle codifiche UNICODE utf8 Il procedimento appena descritto può essere utilizzato praticamente con qualsiasi sistema di trascrizione e notazione usato da atlanti linguistici e dizionari. È importante solo avere una documentazione approfondita delle analogie tra caratteri, proprie di ogni atlante. tramite semplici procedure di ostituzione è possibile utilizzare i caratteri trascritti praticamente in qualsiasi altro sistema di trascrizione. enunciato: Böhmer-Ascoli 33 33

select concetto from tokens where lemma = 'malga‘: 1 n Prospettiva semasiologica select lemma from tokens where concetto = ‘Sennhütte‘: n 1 Passiamo adesso al tema della strutturazione dei dati. Il concetto base di verbaAlpina appare a prima vista molto semplice: distinguiamo tra definizioni, da un lato, e concetti dall'altro. Così la parola italiana "malga" può descrivere praticamente il concetto “Sennhütte". Molto spesso le parole possiedono più di un significato ragione per cui la parola "malga" può descrivere, in alcuni contesti, anche il concetto "mandria“, “Herde” in tedesco. Capovolgendo questa prospettiva semasiologica e osservando il concetto "sennhütte" da un punto di vista onomasiologico, è possibile osservare che esiste una grande quantità di definizioni per questo concetto. La ricerca di un lemma e dei sui diversi concetti, e viceversa, è molto semplice. Nella lingua della banca dati sarebbe ad esempio: select concetto from tokens where lemma = 'malga'; E in prospettiva onomasiologica si formulerebbe: select lemma from tokens where concetto = ‘Sennhütte‘; Quest‘ultima consultazione presenta i vari lemmi che signifcano il concetto „SENNHÜTTE“ (cascina di montagna) ################################ SELECT concat(erhebung," ",stimulus_nr," ",informant_nr) as quelle, token, token_ipa, lemma, konzept FROM `tokens` WHERE `lemma` LIKE 'malga‚ SELECT concat(erhebung," ",stimulus_nr," ",informant_nr) as quelle, token, token_ipa, lemma, konzept as concetto FROM `tokens` WHERE `konzept` LIKE 'sennhütte' and lemma in ('malga','tegia') order by lemma Prospettiva onomasiologica © Thomas Krefeld | Stephan Lücke 2013 34

unità polirematiche AIS 456: la salamandra Negli atlanti si trovano però anche strutture ben più complesse. La carta AIS 456 è dedicata alla salamandra. L'informatore numero 27, proveniente dalla città di  Latsch in Graubünden definisce la salamandra "tsearp da katar plecas", in italiano sarebbe "serpente da quattro piedi". Ecco qui un caso di un’unità polirematica, ovvero il concetto viene definito con più di una parola o token. Lo schema così presentato non si adatta a mappare il contenuto dell'informazione di un’unità polirematica. Come si può vedere i due campi „lemma“ e „concetto“ sono occupati dai rispettivi attributi delle singole parole. Con le possibilità che offre una banca dati relazionale è possibile risolvere questo problema solo dividendo lemma e concetto in più tabelle e producendo le rispettive relazioni con l’utilizzo di numeri di identificazione, i cosidetti ID. ######################## SELECT concat(erhebung,' ',stimulus_nr,' ',informant_nr) as quelle, group_concat(token order by id_token separator ' ') as enunciato FROM `tokens` where erhebung = 'AIS' and stimulus_nr = '456_1' and informant_nr = '27' group by id_aeusserungen_ais SELECT concat(erhebung,' | ',stimulus_nr,' | ',informant_nr) as origine, token, lemma, upper(konzept) as `concetto (tedesco)` FROM `tokens` where erhebung = 'AIS' and stimulus_nr = '456_1' and informant_nr = '27' © Thomas Krefeld | Stephan Lücke 2013 35

Esempio: codifica di „unità polirematiche“ Tabella tokens Tabella intermedia Tabella concetti SALAMANDRA SERPENTE PELLE potete vedere qui sulla sinistra la tabella dei tokens con i corrispettivi IDs. Sulla destra troviamo la tabella dei concetti, nella quale gli elementi sono anch’essi contrassegnati con un ID. Nel centro troviamo una tabella intermedia che ha come funzione quella di combinare gli ID dei tokens con quelli dei concetti. il sistema che abbiamo presentato permette l’associazione ripetuta di un token con vari concetti. Viceversa anche i concetti possono essere assegnati a più tokens o gruppi di tokens. ################ SELECT id_token, erhebung, stimulus_nr, informant_nr, group_concat(distinct token_ipa separator ' ') tokens, group_concat(distinct lemma separator ' ') lemmata, group_concat(distinct konzept separator ' ') konzepte, x.*, k.* FROM `tokens` t left join vtbltokenkonzept x using (id_token) left join konzepte k using (id_konzept) WHERE `erhebung` LIKE 'AIS' AND `stimulus_nr` LIKE '456\\_1' AND (`informant_nr` LIKE '27' /* or informant_nr like '13' or informant_nr like '352' */ ) group by t.erhebung, t.stimulus_nr, t.informant_nr, k.id_konzept SELECT /* t.erhebung, t.stimulus_nr, t.informant_nr, stimulus, token, lemma, t.typus, v.typus, konzept, konzept_D */ t.konzept FROM `tokens` t left join vtbltokenkonzept v using (id_token) left join konzepte k using (id_konzept) left join stimuli s on (t.erheb SELECT x.id_token, x.id_konzept -- k.id_konzept, k.konzept_D /* id_token, erhebung, stimulus_nr, informant_nr, group_concat(distinct token_ipa separator ' ') tokens, group_concat(distinct lemma separator ' ') lemmata, group_concat(distinct konzept separator ' ') konzepte, x.*, k.* */ FROM `tokens` t left join vtbltokenkonzept x using (id_token) left join konzepte k using (id_konzept) -- WHERE `erhebung` LIKE 'AIS' AND `stimulus_nr` LIKE '456\\_1' AND (`informant_nr` LIKE '27' /* or informant_nr like '13' or informant_nr like '352' */ ) where /* konzept_D like 'salamander' and */ t.id_token in (46747,46748,46768,46769,46770,46771,46772,47089,47090) group by t.erhebung, t.stimulus_nr, t.informant_nr -- , k.id_konzept order by id_tokenung=s.erhebung and t.stimulus_nr=s.nummer) where k.id_konzept is null and t.konzept != '' and s.va_relevant = '1' group by t.konzept ORDER BY `t`.`id_token` ASC select * from vtbltokenkonzept where id_token in (46747,46748,46768,46769,46770,46771,46772,47089,47090)

Esempio: uso del concetto „Schlange“ („serpente“) per designare una salamandra Così è possibile, ad esempio, rinvenire l’utilizzo di *un* concetto per la descrizione di *un altro concetto*. Nel nostro esempio si possono, per esempio, rintracciare tutte le espressioni del parlante che si avvicinano al concetto „serpente“ nella definizione di una salamandra. La relativa sintassi di ricerca appare essere alquanto complessa, decisiva è però l’elevata velocità con cui vengono filtrati i dati corrispondenti dai circa 75000 tokens finora presenti. La ricerca dura solo un millesimo di secondo. © Thomas Krefeld | Stephan Lücke 2013 37

Convergenza dei dati: dissoluzione dei limiti geografici e linguistici Famiglia lessicale sovralinguistica  categoria „famiglia“ ? Potete vedere qui una lista di tutti i lemmi finora registrati per SALAMANDRA. Da notare che questa lista racchiude sia lessemi singoli che di più parole come i «siarp da quattro piedi». I dati sono, poi, spartiti su tutti gli atlanti, essendo stato superato l’isolamento iniziale dei singoli dati in aree di sondaggi separate e costituendo così il paesaggio linguistico alpino come un tutto. L’esempio mostra come diventano evidenti problemi, che sono invisibili a prima vista. Si vede per esempio, che sarebbe vantaggioso o anzi necessario definire un altra categoria interlinguale “famiglia” per collegare le parole “salamander” e “salamandra”. Sorge anche la domanda a che tipo di salamandra gli informanti del AIS pensavano quando erano domandati della parola per quello concetto. Inoltre, l’utilizzo di banche dati relazionali permette di effettuare analisi oltre i limiti dei confini linguistici e anche collegamenti di dati linguistici con fatti extralinguistici, settori quali storia, etnografia, infratture e così via. ################################ Feuersalamander: salamndra pezzata ### das vorliegende beispiel zeigt ausserdem, wie die arbeit mit strukturierten daten zunächst verborgene Probleme ans Tageslicht befördern kann. So wird hier deutlich, dass die einrichtung einer Kategorie «familie» sinnvoll wäre, um offenkundig miteinander verwandte lemmata aus unterschiedlichen sprachen miteinander verbinden zu können. Ferner kommt hier die frage auf, welche Art des Salamanders die AIS-Informanten gemeint haben, die als Bezeichnung des Salamanders «Tattermandl» angegeben haben. Es wäre zu prüfen, ob sie, wie die VALTS-Informanten, bei der Beantwortung der Frage konkret den schwarzen Alpensalamander vor Augen hatten. ### -- select upper(konzept_D) as `designazione tedesca del concetto`, `lemma(ta)` as lemmata, case when length(group_concat(erhebung, '-', informant_nr order by erhebung, informant_nr)) >= 50 then concat(left(group_concat(erhebung, '-', informant_nr order by erhebung, informant_nr), 50), '...') else group_concat(erhebung, '-', informant_nr order by erhebung, informant_nr) end as `lista degli informanti` from (SELECT konzept_D, erhebung, informant_nr, CASE WHEN lemma = '' THEN t.typus ELSE group_concat(distinct lemma order by id_token separator ' ') END as `lemma(ta)` FROM `tokens` t join vtbltokenkonzept v using (id_token) join konzepte k using (id_konzept) where konzept_D like '%salamander%' group by id_aeusserungen_ais) q group by `lemma(ta)` © Thomas Krefeld | Stephan Lücke 2013 38

enunciati, concetti – e tipi Esempio VALTS: enunciati, concetti – e tipi tegia Le diverse concezioni dei vari atlanti linguistici comportano sempre nuove sfide quando si tratta di portare le informazioni codificate analogamente negli atlanti ad una struttura compatibile con le banche dati, e che inoltre sia compatibile con le strutture dei dati provenienti da altri atlanti. Questo si vede molto chiaramente nelle cartine dell’ „Atlante linguistico vorarlberghese“, VALTS. Mentre l’AIS, che segue la tradizione romanistica, rinuncia a una tipizzazione linguistica e presenta direttamente le espressioni dei parlanti, le cartine del VALTS presentano il modello delle cosidette cartine a punto e a simbolo, le quali non documentano normalmente le rispettive espressioni dei parlanti, ma sono piuttosto estrazioni delle parole dei parlanti presentate come simboli sulle mappe. Potete vedere qui la leggenda della mappa VALTS IV 73 “Sennhütte, Sennereiraum". Il titolo della cartine mostra già di suo che qui vengono amalgamate più cose insieme: da un lato la definizione della SENNHÜTTE bzw. des sennereiraumes che di per se è già due cose diverse; secondo la nostra sistematica: due concetti diversi. Inoltre la cartina si occupa del suono e del significato di Tieje, ovvero Taje, anche se a prima vista non si capisce molto bene a quale concetto si riferiscano. Questa mappa intende con „tipo“ un qualcosa che la struttura della banca dati dell’AIS non prevede: non si tratta nè di lemmi nè di concetti, si tratta piuttosto di un gruppo di varianti con caratteristiche comuni. Sia il tipo „Tieje“ e il tipo „taje“ rappresentano comunque lo stesso lemma, senza che questo però venga citato in modo esplicito nella leggenda. Le trascrizioni fonetiche, invece, si riferiscono a espressioni concrete dei parlanti anche se rimane comunque poco chiaro di quale parlante si tratti esattamente.    Inoltre è possibile notare che in alcuni casi vengono documentati dei significati specifici: così la definizione „tieje“ può descrivere o una capanna primitiva su un alpeggio inferiore *o* una cucina SENN *o* una cantina per formaggi, ovvero concetti diversi. La documentazione di questi significati non ricopre però delle aree nella cartina, ma si limita a pochi luoghi di rilevazione. Così non ci è permesso sapere, ad esempio, quale sia la definizione di una cantina per formaggi nella località di Stanzach in Tirolo (T8). Tali o simili inconsistenze possono presentarsi in tutti gli atlanti linguistici o dizionari. Anche comparando degli atlanti o dei dizionari possono sorgere simili inconsistenze con conseguenze per l’omogeneità della documentazione dell’area (con riferimento a tutta l’area alpina). Le situazioni qui descritte comportano che lo schema della banca dati debba essere sempre adattato a nuove varianti dei dati, almeno nella fase iniziale. Inoltre si sviluppa una matrice dei dati per l’area alpina, all’interno della quale le inconsistenze sono subito visibili in forma di spazi vuoti. Questi spazi vuoti possono poi essere riempiti in modo mirato e sistematico con rilevazioni posteriori. Queste rilevazioni possono effettuarsi nei tempi del web 2.0 anche tramite utilizzo di social software. Abbiamo provato approcci simili già in dei progetti passati e pianifichiamo di fare altrettando con verbaAlpina. Stanzach (T8) © Thomas Krefeld | Stephan Lücke 2013 39

www.verba-alpina.gwi.uni-muenchen.de -> DOKUMENTE Link & contatto Lettura scaricabile da: www.verba-alpina.gwi.uni-muenchen.de -> DOKUMENTE thomas.krefeld@lmu.de luecke@lmu.de Grazie per la vostra attenzione © Thomas Krefeld | Stephan Lücke 2013