La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009.

Presentazioni simili


Presentazione sul tema: "1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009."— Transcript della presentazione:

1 1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti

2 2 Lezione Analisi monovariata Corbetta, capitolo 12

3 3 Lanalisi monovariata Lanalisi monovariata costituisce la forma più semplice di analisi del fenomeno indagato. Essa consiste in unanalisi descrittiva focalizzata su una sola variabile.

4 4 LAnalisi Monovariata Tratta lo studio della distribuzione dei dati osservati sugli stati di una variabile. Distribuzione di frequenza Serve ad avere una prima impressione sul fenomeno preso in esame e soprattutto a verificarne la plausibilità ed eventuali squilibri. Essa costituisce lanalisi più elementare e serve anche a facilitare agli altri studiosi la lettura di analisi più complesse.

5 5 La distribuzione di frequenza La prima è più elementare delle analisi è la distribuzione di frequenza. Essa consiste in un banale conteggio delle modalità di una variabile.

6 6 LA MATRICE DEI DATI: CASI PER VARIABILI

7 7 Distribuzioni di frequenza: il genere Il conteggio dei casi osservati

8 8 Distribuzioni di frequenza Le quote percentuali delle modalità

9 9 Distribuzioni di frequenza Le percentuali sui casi validi, al netto dei casi mancanti

10 10 Distribuzioni di frequenza Le quote percentuali delle modalità

11 11 Distribuzioni di frequenza Le percentuali sui casi validi, al netto dei casi mancanti

12 12 Distribuzioni di frequenza Le percentuali cumulative

13 13

14 Rappresentazioni grafiche di distribuzioni di frequenza DIAGRAMMA A BARRE

15 Rappresentazioni grafiche di distribuzioni di frequenza DIAGRAMMA A TORTA

16 16 Le distribuzioni di frequenza come distribuzioni di probabilità Le proporzioni delle modalità possono essere interpretate come probabilità. MaschiPmPm 0,486 FemminePfPf 0,514 TotaleP m+f 1,000

17 17 Una probabilità può variare tra 0 e 1 Un evento è certo quando ha probabilità 1 Un evento è irrealizzabile quando ha probabilità 0 La somma delle probabilità di tutti gli eventi possibili è uguale a 1 Nellesempio abbiamo che la probabilità di estrarre a caso una femmina dal nostro campione è 0,514. La probabilità di estrarre un maschio è di 0,486. Estraendo a caso un soggetto dal nostro campione abbiamo più probabilità di estrarre una femmina che non un maschio. Siamo certi (probabilità uguale ad 1) di estrarre o un maschio o una femmina. MaschiPmPm 0,486 FemminePfPf 0,514 TotaleP m+f 1,000

18 18 Lanalisi monovariata: le statistiche Le statistiche servono a dare una descrizione sintetica del fenomeno. Esse si applicano in modo diverso secondo la scala di misurazione con la quale sono rilevate le variabili.

19 19 Lanalisi monovariata: le statistiche Esistono misure di tendenza centrale che sintetizzano linformazione contenuta nella variabile in un valore caratteristico. Esistono misure di dispersione che indicano la varietà delle informazioni presenti in una variabile.

20 20 Le misure di tendenza centrale su variabili NOMINALI LA MODA: E la modalità più frequente.

21 21 MODA in una distribuzione di frequenza

22 22 Le misure di tendenza centrale su variabili ORDINALI LA MEDIANA: E la modalità che occupa il posto di mezzo nella distribuzione ordinata dei casi secondo quella modalità.

23 23 Le misure di tendenza centrale su variabili ORDINALI Dato un elenco ordinato di N casi, la mediana è la modalità che si trova in corrispondenza del caso (N+1)/2 quando N è dispari. Se invece N è pari le mediane sono le modalità in corrispondenza del caso (N/2) e del caso (N/2 +1).

24 24 MEDIANA (N dispari) Graduatoria di 5 competitori. 1° 2° 3° 4° 5° La mediana è la modalità relativa al caso in TERZA posizione.

25 25 MEDIANA (N pari) Graduatoria di 6 competitori. 1° 2° 3° 4° 5° 6° La mediana è rappresentata da due modalità: sono le modalità relative ai casi in TERZA e QUARTA posizione.

26 26 MEDIANA, N dispari in una variabile ordinale 50% MEDIANA = stato 4

27 27 MEDIANA, N pari in una variabile metrica 50% MEDIANA = 19,5

28 28 Le misure di tendenza centrale su variabili CARDINALI LA MEDIA ARITMETICA: Equivale alla somma dei valori di tutti i casi diviso il numero dei casi. N= numero dei casi X i =i-esimo caso

29 29 ETA MEDIA 5 studenti con età differenti Letà media degli studenti è 25 anni x1x1 x2x2 x3x3 x4x4 x5x5

30 30 MEDIA su una distribuzione di frequenza EtàFreq. Numerosità N=5 x1.f1x1.f1 Modalità k=4 x2.f2x2.f2 x3.f3x3.f3 x4.f4x4.f4

31 31 In una variabile dicotomica, dove i valori sono 0 e 1 la media corrisponde alla proporzione dei casi sulla modalità 1 xf N=100

32 32 Proprietà della MEDIA La somma degli scarti dalla media è uguale a ZERO.

33 33 Proprietà della MEDIA La somma degli scarti dalla media è uguale a ZERO. ISCRITTI scarti media

34 34 VALORI CARATTERISTICI

35 35 Se la distribuzione è asimmetrica la media risente dei valori estremi. In questi casi il valore caratteristico preferibile è la mediana. ESEMPIO: il reddito. n Reddito Valori estremi Media Mediana 2400

36 36 Le misure di dispersione su variabili NOMINALI Lindice di omogeneità

37 Indice di omogeneità Misura la dispersione in una variabile nominale Dove k è il numero di modalità e p i è la proporzione di casi che si trovano nella categoria i-esima. Lindice di omogeneità O è dato quindi dalla somma dei quadrati delle frequenze proporzionali. Indice di eterogeneità

38 Indice di omogeneità È massimo (=1) quando tutti i casi assumono la stessa modalità. È minimo (=1/k) quando la distribuzione è massimamente eterogenea, i casi si distribuiscono ugualmente nelle diverse modalità. 1/2 1 O p 10 ESEMPIO con due modalità (p,1- p) O min = 0, ,50 2 = 0,50 O max = = 1 1/2

39 39 Maggiore è questo indice più è la concentrazione dei contenuti del rispettivo dominio: elevata omogeneità in Spagna e Germania, dove spiccano poche categorie, ed una minore in Francia, dove invece i contenuti sono dispersi tra più categorie. Video di Faidate presenti su youtube e categoria tematica

40 Indice di omogeneità relativa Per confrontare distribuzioni con un diverso numero di modalità. Varia tra 0 (minima omogeneità) ed 1 (massima omogeneità).

41 41 Le misure di dispersione su variabili ORDINALI La differenza interquartile

42 42 Quartili Corrispondono ai valori/modalità che occupano nella distribuzione ordinata dei casi la posizione al 25%, al 50%(la mediana) e al 75% dei casi

43 43 QUARTILI

44 La differenza interquartile Misura la dispersione in una variabile ordinale Dove Q 3 è il terzo quartile e Q 1 è il primo. Nellesempio precedente:

45 45 Le misure di dispersione su variabili CARDINALI Campo di variazione Scostamento semplice medio Deviazione standard e Varianza

46 46 Campo di variazione (o Range) Semplicemente offre una misura della variazione in una distribuzione calcolando la differenza tra il valore massimo ed il valore minimo.

47 47 CAMPO DI VARIAZIONE (o RANGE)

48 48 Lo scostamento semplice medio Lo scostamento semplice medio, si calcola attraverso la somma degli scarti assoluti dalla media.

49 49 La deviazione standard La deviazione standard costituisce una misura della variabilità della distribuzione. Equivale alla somma degli scarti dalla media al quadrato.

50 50 La varianza La varianza costituisce la misura statistica più importante. Per le sue proprietà essa costituisce una sintesi dellinformazione presente nella distribuzione della variabile.

51 VARIANZA su una distribuzione di frequenza EtàFreq. N=5

52 52 La varianza campionaria Quando si lavora su campioni la stima statisticamente più corretta per calcolare la varianza del campione si trova: NB: S è la deviazione standard campionaria.

53 53 TRASFORMAZIONE DELLE VARIABILI CARDINALI Esistono alcune procedure che trasformano le variabili cardinali: - normalizzazione - standardizzazione

54 54 QUALSIASI DISTRIBUZIONE CONTINUA PUO ESSERE NORMALIZZATA La nuova variabile x 01 varierà tra 0 ed 1. Valore osservato i-esimo

55 55 DUE SCALE CON DIVERSO RANGE POSSONO ESSERE RESE COMPARABILI Minimo 36 Massimo 60 Voto vecchio di maturitàVoto nuovo di maturità Minimo 60 Massimo 100 NB: la distanza relativa tra i casi rimane la stessa ,5

56 56 QUALSIASI DISTRIBUZIONE CONTINUA PUO ESSERE STANDARDIZZATA Una distribuzione standardizzata ha media uguale a 0 e deviazione standard (o varianza) uguale a 1. Z può variare tra meno e più infinito

57 DUE DISTRIBUZIONI POSSONO ESSERE COMPARATE IN TERMINI DI PUNTI STANDARD, A PARITA DI MEDIA E DI DISPERSIONE. Si standardizza rispetto ad un contesto di riferimento. Media 23 Dev.std 3,8 Voto corso AVoto corso B Media 22 Dev.std 6,9 NB: la distanza relativa tra i casi cambia. Nelle nuove distribuzioni la varianza = 1, la media = 0.


Scaricare ppt "1 Teoria e metodi della ricerca sociale e organizzativa Corso di Laurea in Scienze dellOrganizzazione Facoltà di Sociologia Università Milano-Bicocca 2009."

Presentazioni simili


Annunci Google