La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Metodologia della ricerca e analisi dei dati in (psico)linguistica 22-26 Giugno 2015 Bognanco (VB) Mirta Vernice Università Milano-Bicocca

Presentazioni simili


Presentazione sul tema: "Metodologia della ricerca e analisi dei dati in (psico)linguistica 22-26 Giugno 2015 Bognanco (VB) Mirta Vernice Università Milano-Bicocca"— Transcript della presentazione:

1 Metodologia della ricerca e analisi dei dati in (psico)linguistica Giugno 2015 Bognanco (VB) Mirta Vernice Università Milano-Bicocca

2 Cosa ci aspetta? 5 giorni, 10 lezioni con altrettante esercitazioni, vostre presentazioni personali. Basi di statistica descrittiva e inferenziale; Familiarizzazione con Excel e R; Accenno a tecniche di analisi statistica con R.

3 Obiettivo della summer school Pensare in modo più consapevole agli esperimenti (già condotti o da condurre); Possibilità di approfondire autonomamente tecniche di analisi dei dati più complesse.

4 Le nostre giornate 9:15-10:45Lezione teorica 11:00-13:00Esercitazione 13:00-14:30Pausa 14:30-16:00Lezione teorica 16:00-17:45Esercitazione/talk 18:00-19:00Passeggiata

5 Sito del corso Cliccare sul link Summer school. Troverete tutto il materiale rilevante.

6 Quali testi?

7

8 Analizzare dati linguistici con R /baayenCUPstats.pdf /baayenCUPstats.pdf

9 Nota bene Richiedono una (seppur minima) pregressa conoscenza statistica!

10 Come contattarmi https://sites.google.com/site/mirtavernice/

11 1^ giornata Mattina: Metodologia della ricerca Misurare Manipolare Cenni sui diversi disegni sperimentali Pomeriggio: Esplorare i dati Predisporre un file dati per l’analisi Metodi per indagare come si distribuiscono

12 2^ giornata Mattina: Statistica descrittiva Frequenza Misure di tendenza centrale e dispersione Pomeriggio: Distribuzioni teoriche di probabilità Punti z; Distribuzione binomiale.

13 3^ giornata Mattina: Introduzione ad R Familiarizzazione con Rstudio; Dalle variabili ai data frame; Dai comandi alle funzioni. Pomeriggio: Prime funzioni in R Impostare un file dati per l’analisi in R; Installare e caricare pacchetti.

14 4^ giornata Mattina: GLM Cross tabulazione Introduzione ai modelli di Analisi della varianza; Pomeriggio: GLM in R Regressione semplice; Calcolare il fit di un modello; Interpretazione di un output.

15 5^ giornata Mattina: Regressione multipla in R Interpretazione di un output Pomeriggio: Modelli misti in R Effetti random Reference level

16 Domande?

17 Metodologia della ricerca Individuare un oggetto di indagine – Lettura/produzione sintattica/accesso lessicale/ e un paradigma sperimentale – Self paced reading/masked priming/ecc. Disegnare un esperimento Costruirlo Testare partecipanti Analizzare i dati

18 Da una ipotesi… Per esempio? Da cosa si parte?

19 Ipotesi sperimentali Parole bisillabiche lette più velocemente di parole trisillabiche. Parole acquisite prima lette più velocemente di parole meno frequenti. (punto critico: come definiamo AoA?)

20 Burani et al., 2002 Parole morfologicamente complesse lette più velocemente di parole non complesse, a parità di numero di lettere e frequenza. CAMMELLO RT > CASSIERE Ma solo in popolazioni a sviluppo atipico (es. dislessici).

21 Hp sperimentale Deve essere verificata. Come si procede? 1.Prevedere che tipo di risultato si otterrebbe assumendo che l’Hp sperimentale sia valida; 2.Prevedere che tipo di risultato si otterrebbe assumendo che l’Hp sperimentale NON lo sia.

22 Hp sperimentale vs. Hp nulla Nel caso di Burani et al., 2002? Definiamo Hp sperimentale e Hp nulla.

23 Hp Nulla: importante No: Non esiste relazione tra i due eventi (complessità morfologica delle parole/velocità lettura/popolazione a sviluppo atipico vs. tipico) Bensì: le eventuali variazioni riscontrate negli eventi considerati sono dovute al CASO.

24 Hp sperimentale Predice una relazione tra due o più eventi (complessità morfologica di una parola/velocità di lettura); Assume che questo si verifichi in una popolazione a sviluppo atipico. Come chiamiamo questi eventi?

25 Variabili dipendenti/indipendenti Variabile dipendente: quella che misuro. Variabile indipendente: quella che manipolo. Indipendente: Causa Dipendente: Effetto

26 Variabile indipendente Che significa manipolare? Variare. Condizioni sperimentali: diverse “versioni” in cui può comparire un item nell’esperimento (es. parole complesse vs. non complesse).

27 Variabile dipendente Quella che posso misurare. Su cui conduco l’analisi dei dati. La natura della variabile dipendente determina il tipo di analisi.

28 Variabile dipendente Variabile categorica – corretto/sbagliato – attivo/passivo – SVO/OVS Variabile continua – Tempo di lettura (Reading time) – RTs (Reaction time)

29 Una Hp sperimentale… Permette di predire chiaramente sia quello che avverrà, sia ciò che non avverrà.

30 Statistica Permette di verificare se l’Hp sperimentale è verificata oppure no. Quando Hp sperimentale non è verificata, non è detto che Hp nulla lo sia. Si dirà semplicemente che bisogna rigettare Hp sperimentale.

31 Dan Navarro “Statistics is deeply intertwined with research design. If you want to be good at designing psychological studies, you need to understand the basics of stats.”

32 Un esempio

33 Carminati, 2002; 2005 Esperimento Self paced reading Position of Antecedent Strategy (PAS): In contesti anaforici osserva che: Pronomi nulli sono assegnati a un antecedente in Spec IP (in genere, il soggetto). Pronomi espliciti sono assegnati (di solito) a un antecedente non-soggetto.

34 Carminati, 2002; a.Quando Vanessa ha visitato Giovanna in ospedale, lei le ha portato un mazzo di fiori. 1b.Quando Vanessa ha visitato Giovanna in ospedale, Ø le ha portato un mazzo di fiori. 1c.Quando Vanessa ha visitato Giovanna in ospedale, lei era già fuori pericolo. 1d.Quando Vanessa ha visitato Giovanna in ospedale, Ø era già fuori pericolo.

35 Self Paced Reading Quando ____ ____ ____ ___ ___ ____ ___ ___ ____

36 Self Paced Reading ____Vanessa ____ ____ ___ ___ ____ ___ ___ ____

37 Self Paced Reading ____ ____ ha ____ ___ ___ ____ ___ ___ ____

38 Self Paced Reading ____ ____ ____visitato ___ ___ ____ ___ ___ ____ ___

39 Disegno fattoriale Manipolazione 2x2 2(Pronoun: overt vs. null) x 2 (Semantically plausible co-referent: object vs. subject). Manipolazione within items e within subjects. Cosa significa?

40 Carminati, 2002; a.Quando Vanessa ha visitato Giovanna in ospedale, lei le ha portato un mazzo di fiori. 1b.Quando Vanessa ha visitato Giovanna in ospedale, Ø le ha portato un mazzo di fiori. 1c.Quando Vanessa ha visitato Giovanna in ospedale, lei era già fuori pericolo. 1d.Quando Vanessa ha visitato Giovanna in ospedale, Ø era già fuori pericolo.

41 Lista latin square Soggetto 1 Item 1 condizione a Item 2 condizione b Item 3 condizione c Item 4 condizione d Item 5 condizione a ….

42 Lista latin square Soggetto 2 Item 1 condizione b Item 2 condizione c Item 3 condizione d Item 4 condizione a Item 5 condizione b ….

43 Latin square Vetrata commemorativa in onore di Ronald Fisher Caius College, Cambridge

44 Manipolazione Può essere: – Entro item (within-items) – Tra item (between-items) – Entro soggetti (within-subjects) – Tra soggetti (between-subjects)

45 Between/within items Manipolazioni “between-” richiedono MOLTI partecipanti. Necessario manipolare ordine di occorrenza dei trial tra soggetti. Manipolazioni “within-” richiedono un numero più limitato di partecipanti perché controllano variabilità soggetti/item.

46 Pilot study/Norming Nella costruzione item sperimentali controllare: – Frequenza verbi/NP – Accettabilità – Familiarità – AoA (age of acquisition)

47 E i filler? Necessari. “Assorbono” la manipolazione degli item sperimentali. Almeno 3 volte il numero degli item sperimentali.

48 Partecipanti Adulti Popolazioni specifiche? Bambini? Bilingui? SLI? Quali criteri di inclusione? Impatto sul disegno dell’esperimento. Importante: somministrare un questionario sul background linguistico-culturale

49 Partecipanti Quanti ce ne vogliono? Dipende dal nostro studio. È within o between subjects? Quante condizioni sperimentali abbiamo? NB: in genere minimo 6 partecipanti per ogni lista latinsquare.

50 Partecipanti Mai lasciarli a sé stessi… Istruzioni possono fare la differenza. – Rating di accettabilità scala -5 punti: A. “….basa le tue risposte sulla tua intuizione di parlante nativo” B. “…credi che un professore di italiano accetterebbe questa espressione?”

51 Metodologia e statistica nel paper

52 Introduzione Breve introduzione dell’area di indagine Cenni su qualche ricerca condotta in precendenza Scopo dello studio Breve descrizione dei metodi Ipotesi

53 Nell’introduzione Dopo aver brevemente spiegato il metodo, introdurre l’ipotesi Ipotesi: – A) “Ci si aspetta una differenza tra condizione X e Y” oppure: – B) “Ci si aspetta una performance migliore nella condizione X rispetto a Y”

54 Che differenza tra queste due ipotesi? Hp direzionale; Hp non direzionale; Avrà delle implicazioni sull’analisi statistica che condurremo.

55 Metodo Sottosezioni: – Participanti: Chi? – Materiali: Cosa è stato usato? Descrivere gli item. – Disegno: Quale manipolazione sperimentale è stata attuata? – Procedura: Come si è svolto l’esperimento?

56 Partecipanti 20 studenti (3 M) dell’Università X hanno preso parte al nostro studio. Tutti i partecipanti avevano una vista nella norma.

57 Materiali Indicare: Item sperimentali utilizzati (quanti erano, come erano) Eventuali filler Supporti tecnici usati per la somministrazione (foglio di risposta, computer)

58 Disegno Variabile dipendente Variabile indipendente Com’è stata manipolata var indipendente? Within- (entro) o between-(tra) participants?

59 Procedura Tipo di somministrazione (individuale o collettiva?) Come si è svolto l’esperimento? Che tipo di istruzioni hanno ricevuto?

60 Metodo: Importante Chi lo legge deve essere in grado di replicare al dettaglio l’esperimento!

61 Risultati 2 informazioni Statistica descrittiva (punteggi grezzi, misure di tendenza centrale, di dispersione, frequenze, percentuali); Statistica inferenziale (valori ottenuti dall’applicazione di un test statistico).

62 La statistica descrittiva elabora dati per descrivere fenomeni; La statistica inferenziale stima le caratteristiche di un fenomeno che si riferisce a una popolazione a partire dall’analisi delle caratteristiche di un campione.

63 Popolazione e campione Popolazione – L’insieme di unità (persone, piante, città, ecc.) su cui vogliamo generalizzare un certo risultato (o un modello statistico). Campione – Un insieme più piccolo di unità (ma idealmente rappresentativo) estratte da una popolazione, usato per determinare delle caratteristiche circa quella popolazione.

64  = 10

65 Caveat Dati descrittivi sono puramente speculativi! (non si può concludere granché a partire da una media o da una percentuale...) Solo statistica inferenziale permette di confermare che l’Hp sperimentale sia valida (o meglio che non sia valida l’Hp nulla…).

66 Caveat 2 Entrambe indispensabili; La descrittiva precede l’inferenziale; offre informazioni cruciali per esplorare i dati. L’inferenziale stabilisce generalizzabilità risultati all’intera popolazione.

67 Risultati Descrittivi NB: se i dati (medie e dev standard) sono riportati nelle Tavole, non occorre ripeterle nel testo. Altrimenti, nel testo bisogna includere i numeri esatti.

68 Tavole Tavola 1: Proporzione di risposte corrette tra partecipanti di genere maschile e femminile. Condizione 1Condizione 2 MSDMSD Donne Uomini Importante: in genere si mette sempre media (M), e Deviazione Standard (DS) (oppure, se non DS, Errore Standard, SE).

69 Risultati Statistica inferenziale “L’analisi ha permesso di rilevare una significativa differenza tra la condizione X e Y.”

70 Tipi di studi

71 Ricerca sperimentale – Una o più variabili manipolate sistematicamente per osservare l’effetto (da solo o combinato) che causano su una ulteriore variabile. – È possibile stabilire un rapporto di causa-effetto tra variabili. – Si applica alla maggioranza degli studi in psicolinguistica.

72 Ricerche Cross-sectional – I dati sono raccolti da partecipanti di diverse età (es. 6 mesi, 12, 18 mesi), ogni gruppo di età è costituito da partecipanti diversi. – ≠Studi longitudinali – Stesso partecipante testato in diverse età della sua vita.

73 Studi correlazionali – Osservare quello che avviene senza interferire sperimentalmente (manipolare una variabile). – Indagare relazione tra abilità in prove diverse di uno o più gruppi di partecipanti. – Es. Accuratezza in lettura e accuratezza ortografica in scrittura.

74 Altre nozioni utili

75 Nozione di Causa-Effetto 1.Abituarsi a pensare all’indipendente come causa e la dipendente come effetto. 2.Devono essere contigue (nel tempo). 3.L’effetto non deve occorrere in presenza della causa.

76 I “Confounding” – Una variabile (che in genere non abbiamo controllato), diversa dalla nostra indipendente, che potenzialmente può avere un effetto sulla dipendente; – Es. La relazione tra età e competenza morfosintattica potrebbe essere influenzato da SES.

77 Eliminare i confounding Ruling out confounds (Mill, 1865) – Un effetto deve essere presente quando la causa è presente. Quando la causa è assente anche l’effetto deve essere assente. – Condizione di controllo: la causa è assente.

78 Paradigmi sperimentali – Repetition task/continuation task – Priming (si adatta ad esperimenti di produzione/comprensione/accesso lessicale) – Self paced reading – Eye tracking (reading, visual word paradigm) – Tecniche neuro…

79 Paradigmi sperimentali per lo studio della comprensione

80 Decisione lessicale Ascolta la parola e decidi: è una parola reale? Var. dipendente: RT e accuratezza.

81 Linger Software gratuito per esperimenti self-paced reading.

82 Software per condurre esperimenti

83 Software commerciali Presentation E-prime preparare lo script in e-prime e condurre l'esperimento con e-run (free).

84 PsyScope Disegnato per condurre tutti i tipi di esperimenti psicolinguistici. Misura RTs. NB: solo su Mac.

85 DMDX mdx.htm mdx.htm Adatto a diversi tipi di esperimenti di psicolinguistica. Misura i RTs rispetto a stimoli visivi e uditivi. NB: solo su PCs. Poco flessibile.

86 Praat Ottimo per esperimenti di identificazione o discriminazione di stringhe di suoni. Speech analysis/synthesis. MA non misura RTs.

87

88 Mechanical turk

89

90 Un esempio

91 Per oggi  Avere una domanda di ricerca sensata.  Mantenere costante tutto quello che non interessa indagare.  Sapere come “gestire” bias e altre variabili difficilmente controllabili.  Costruire un esperimento bilanciato.  Conoscere i propri dati descrittivi prima delle analisi statistiche.


Scaricare ppt "Metodologia della ricerca e analisi dei dati in (psico)linguistica 22-26 Giugno 2015 Bognanco (VB) Mirta Vernice Università Milano-Bicocca"

Presentazioni simili


Annunci Google