La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER

Presentazioni simili


Presentazione sul tema: "INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER"— Transcript della presentazione:

1 INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER
Teorie psicologiche del lessico e del significato lessicale

2 DEFINIZIONI NEI DIZIONARI
GENUS horse noun 1 a solid-hoofed plant-eating domesticated mammal with a flowing mane and tail, used for riding, racing, and to carry and pull loads New Oxford Dictionary of English DIFFERENTIAE

3 DEFINIZIONI NEI DIZIONARI
contascàtti: Dispositivo installato a richiesta presso l’utente per la documentazione del traffico telefonico (Zingarelli 1995) maneggevole: Che si puo’ maneggiare facilmente || Fig. trattabile, arrendevole || T. mar. del vento, quando permette l’esecuzione di qualsiasi manovra (Palazzi-Folena, 1992)

4 PROBLEMI CON LE DEFINIZIONI GENUS-DIFFERENTIA
happen vs occur vs befall vs transpire happen vs occur vs befall vs transpire

5 EVIDENZA IN LESSICOGRAFIA
Su che base vengono Identificate le accezioni di una parola? Sviluppate le definizioni? WordNet: Un tentativo di fondare la ricerca lessicografica su basi psicologica Questa settimana: Evidenza psicologica Evidenza da corpora

6 RAPPRESENTAZIONE LESSICALE IN PSICOLOGIA E NEI CORPORA
La psicologia e la linguistica dei corpora sono arrivate ad idee simili per quel che riguarda il significato lessicale Queste idee possono essere utili Per sviluppare lessici piu’ accessibili Per sviluppare metodi automatici per la scoperta delle accezioni

7 EVIDENZA PSICOLOGICA SUL SIGNIFICATO
Semantic priming Teorie dei concetti in psicologia: Reti semantiche Teoria dei prototipi Disambiguazione lessicale

8 SEMANTIC PRIMING Uno degli effetti fondamentali rilevati dalla ricerca psicolinguistica a partire dagli anni ’60 Per esempio, Schvaneveldt & Meyer 1971 Udire una parola (o vedere un’immagine) ATTIVA parole / concetti associati

9 SEMANTIC PRIMING: ESEMPIO (SCHVANEVELDT & MEYER)

10 ASSOCIAZIONI TRA PAROLE (O CONCETTI)
I risultati di Schvaneveldt ed altri portarono allo sviluppo di teorie del lessico basate sull’associazione Ed alla compilazione di liste di parole associate sulla base di dati psicologici

11 LISTE DI ASSOCIAZIONE

12 RETI SEMANTICHE: RISULTATI DALLA PSICOLOGIA COGNITIVA
Collins & Quillian, 1969: tempi per decidere se un oggetto ha una certa proprieta’ aumentano a seconda della ‘distanza’ A canary is yellow A canary has feathers A canary eats food Haviland & Clark 1974, Sanford & Garrod 1979: I looked around the house. The lounge was very spacious.

13 LE RETI SEMANTICHE

14 RETI SEMANTICHE E LESSICO
Evidenza per relazioni di iponimia

15 TEORIE DEI CONCETTI IN PSICOLOGIA: PROTOTIPI
La teoria dominante dei concetti in Psicologia e’ la teoria dei PROTOTIPI proposta da Rosch negli anni ’70

16 IL PROBLEMA DI PLATONE For many concepts, there simply aren’t any definitions” (LM p.14) A theory that correctly describes the behavior of perhaps three hundred words has been asserted to correctly describe the behavior of the tens of thousands of general names (Putnam)

17 WITTGENSTEIN: ‘GAME’ What is common to all games?
Are they all ‘amusing’? Cfr. chess Or is there always winning and losing? Counterex: child throwing his ball at the wall Look at the parts played by skill and luck “I can think of no better expression that FAMILY RESEMBLANCE” ‘games form a family’

18 PUTNAM the term ‘lemon’ not definable by simply conjoining its ‘definining characteristics’ yellow color / tart taste / a certain kind of peel Abnormal members (green lemon) Three legged tiger (Also: three-legged chair, see below)

19 CONCLUSIONE Le definizioni genus+differentia non riflettono la nostra conoscenza lessicale sui concetti

20 EVIDENZA PER TEORIA DEI PROTOTIPI
Typicality effects Is a tomato a vegetable or a fruit? ‘Is this art?’ Failures of transitivity If A is a B and B is a C, is A a C?

21 ‘Fuzzy’ or ‘graded’ categorization
A necessary and sufficient definition should pick up all the category members and none of the non-members But this is not what happens: Hampton (1979): no clear division between members and non-members of 8 categories Kitchen utensils: SINK? SPONGE? Vegetables: TOMATOES? GOURDS? Agreement on typicality judgments (‘think of a fish, any fish’) Rosch (1975): very high correlation (.97) between subjects’s typicality rankings for 10 categories

22 Typicality effects The ease with which people judge CATEGORY MEMBERSHIP depends on typicality Rips, Shoben and Smith (1973): Fast to affirm that a robin is a bird; not so fast to affirm that a chicken is a bird Posner & Keele: similarity to visual pattern Learning: typical items learned before atypical ones (Rosch Simpson & Miller 1976) Learning is faster if subjects are taught on typical items Typicality affects speed of inference Rips 1975: Garrod & Sanford 1977: faster reading time for “The bird came in through the front door” when ROBIN than when GOOSE

23 La teoria in breve Manteniamo rappresentazioni dei concetti sulla base delle loro ‘features’ (TRATTI) Per ogni classe di oggetti esistono dei rappresentanti piu’ TIPICI Per decidere se un oggetto e’ una sedia od una poltrona calcoliamo la SOMIGLIANZA tra questo oggetto e la ‘tipica sedia’ e la ‘tipica poltrona’

24 FEATURE NORMS Psychologists have been collecting concept features from subjects at least since Rosch and Mervis (1975) Different methodologies used (from free association to very tightly controlled) Three such databases currently available Garrard et al (2001) - GA Vinson and Vigliocco (2004) - VV McRae et al (2005) – MCRA - the largest, also classified

25 SPEAKER-GENERATED FEATURES (VINSON AND VIGLIOCCO)

26 SPEAKER-GENERATED FEATURES (MCRAE)

27 FEATURE NORMS (GARRARD)

28 What makes an item typical? Rosch & Mervis 1975
Items are typical when they have HIGH FAMILY RESEMBLANCE with members of the category: Typical items have many of the attributes of members Do not have properties of nonmembers Irrespective of frequency: ORIOLE vs CHICKEN Evidence 1: checked that subjects agree on typicality for several natural categories Asked subjects to list attributes (actually, check) Weighed each attribute by how many items it occurred with within the category ‘SCORE’ indicates how many common features Found that score highly predictive of typicality ( ) Five most typical ‘furniture’ (CHAIR, SOFA, TABLE, DRESSER, DESK) have 13 features in common Five least typical (CLOCK, PICTURE, CLOSET, VASE, TELEPHONE) had 2 attributes in common Cfr. Wittgenstein

29 Rosch and Mervis 1975 (2) Evidence 2: non-typical elements have more features in common with other categories Evidence 3: speed of learning with artificial stimuli belonging to 2 classes Items with more features in common with family easier to learn Items with more features in common with contrast category harder to learn

30 CONCETTI COME ‘CLUSTER’
CHICKEN GOOSE ORIOLE ROBIN Focus of the research in this area almost entirely on the ML side; we believe there is room for improvements on the REPRESENTATION side – and that work like that discussed at this conference can help OSTRICH

31 FEATURE NORMS & DIZIONARI
Questi dati sui tratti tipici di concetti raccolti da soggetti potrebbero essere utili per guidare lo sviluppo di definizioni o delle relazioni semantiche in un dizionario tipo WordNet

32 FEATURE NORMS PER ELDIT
Un progetto congiunto European Academy Bolzano / UniTN (CIMEC) per raccogliere feature norms su parole in Italiano e Tedesco

33 METODI Dati raccolti da studenti nelle scuole di Bolzano
~70 studenti di lingua madre Italiana e 70 di lingua madre tedesca Raccolto dati su 50 concetti

34 RISULTATI ~200 paia concetto / attributo in comune tra tutti e 70 i soggetti tedeschi ed altrettante per gli Italiani Tipi di proprieta’ piu’ importanti: Iponimia ( il cane e’ un animale ) Parte ( il cane ha le zampe) Qualita’ esterna ( le fragole sono rosse) Comportamento ( il cane abbaia )

35 EVIDENZA PSICOLOGICA SULLE ACCEZIONI
Molta ricerca psicologica a partire dagli anni ’70 si e’ occupata del problema della DISAMBIGUAZIONE LESSICALE Questo tipo di ricerca puo’ aiutare a risolvere il problema della distinzione tra OMONIMIA (gru) e POLISEMIA (bocca)

36 DISAMBIGUAZIONE LESSICALE: OMONIMI

37 DISAMBIGUAZIONE LESSICALE: POLISEMIA

38 RICERCA SULLA DISAMBIGUAZIONE E LESSICOGRAFIA
Questo tipo di ricerca potrebbe offrire la possibilita’ di identificare le accezioni su base scientifica

39 CONCLUSIONI I risultati della ricerca psicologica potrebbero aiutare nello sviluppo di nuovi dizionari Aiutando ad identificare le accezioni Assicurando che le definizioni contengano le proprieta’ di un concetto che i parlanti della lingua trovano piu’ significative

40 LETTURE


Scaricare ppt "INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER"

Presentazioni simili


Annunci Google