L’analisi Monovariata

Slides:



Advertisements
Presentazioni simili
LA MEDIA STATISTICA di Zappa Giacomo.
Advertisements

- le Medie la Moda la Mediana
LA VARIABILITA’ IV lezione di Statistica Medica.
Le rappresentazioni grafiche
STATISTICA DESCRITTIVA
La divulgazione della statistica
“Teoria e metodi della ricerca sociale e organizzativa”
LA STATISTICA By prof. Pietro Rossi.
Lez. 3 - Gli Indici di VARIABILITA’
Descrizione dei dati Metodi di descrizione dei dati
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
STATISTICA DESCRITTIVA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
Analisi della varianza (a una via)
La logica della regressione
Introduzione alla statistica per la ricerca Lezione I
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
Applicazioni del foglio elettronico
Applicazioni del foglio elettronico
Analisi delle corrispondenze
Complementi al Corso di Ecologia - Approfondimenti di statistica
Misurazione Le osservazioni si esprimono in forma di misurazioni
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
DATI E PREVISIONI Marzo 2011.
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
I principali tipi di grafici
Le rappresentazioni grafiche
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simone Mosca & Daniele Zucchini 4Bi.
L’analisi monovariata
Lez. 3 - Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
Le rappresentazioni grafiche
La statistica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
Accenni di analisi monovariata e bivariata
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
ORIENTAMENTO CONSAPEVOLE
Elementi di statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
Istituto Comprensivo Rignano-Incisa Tirocinante TFA: G. Giuliani
INDICATORI E RICERCA VALUTATIVA Lezione del 4 e 11 dicembre 2014.
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
EPG di Metodologia della ricerca e Tecniche Multivariate dei dati A.A
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
STATISTICA ASSISTITA Esercitazione dott.ssa Clelia Cascella.
Le rappresentazioni grafiche delle distribuzioni.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
RAPPRESENTAZIONE DATI LA RAPPRESENTAZIONE PUÒ ESSERE UTILIZZATA A SCOPO DI ANALISI, INTERPRETAZIONI E COMUNICAZIONI. PER RAGGIUNGERE QUESTI OBIETTIVI È.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
DEFINIZIONE. La statistica è la disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del.
Gli Indici di VARIABILITA’
Transcript della presentazione:

L’analisi Monovariata «…l’analisi monovariata è un passaggio obbligato per chi voglia porre in relazione queste variabili tra loro […] è una condizione per impostare ed eseguire efficacemente le successive analisi più complesse» Marradi, 1993, L’analisi Monovariata, FrancoAngeli, p. 11 Funzioni dell’analisi monovariata Controllare la plausibilità dei valori Individuazione di dati anomali (wild codes) (già vista nella lez. 3 di lab.) 2. Segnalare squilibri nella distribuzione e valutare opportunità di aggregazione Individuazione di squilibrio nella distribuzione Individuazione modalità da aggregare (che vedremo nell’ultima parte della lezione) Organizzazione in classi (solo per variabili cardinali) (“) 3. Preparazione ad analisi più approfondite Calcolo di nuove variabili Costruzione di indici (lez. 5-6 aprile) Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Funzioni dell’analisi monovariata 4. Garantire la possibilità di leggere criticamente i rapporti di ricerca Marradi (1993) definisce questa funzione come «democratica», permettendo in tal modo al lettore di recepire criticamente, anziché passivamente, le considerazione e le conclusioni di chi ha analizzato i dati» (p. 27) La distribuzione di frequenza rappresenta il primo risultato empirico del lavoro di ricerca, «le fondamenta elementari dell’intero edificio analitico» (ibidem). «..il momento della lettura delle distribuzioni di frequenza è paragonabile alla raccolta die primi frutti dopo la semina avvenuta tempo addietro» Corbetta, 1999, Metodologia e tecniche della ricerca sociale , il Mulino, p. 487 Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

L’analisi monovariata è un’analisi puramente descrittiva L’analisi monovariata è un’analisi puramente descrittiva. Attraverso le distribuzioni di frequenza il ricercatore può vedere come i fenomeni si presentano nel campione studiato e rispondere ai suoi primi interrogativi circa la popolazione oggetto di indagine. Inciso: diverso è il caso dei sondaggi d’opinione in cui le distribuzioni di frequenza costituiscono l’obiettivo stesso dell’indagine L’analisi monovariata fornisce già di per se risultati interessanti che saranno poi inseriti e commentati nel rapporto di ricerca. Un’attenta lettura dei dati permetterà anche la nascita di nuove ipotesi, non prese in considerazione dal ricercatore durante le fasi iniziali della ricerca. Tali ipotesi potranno essere successivamente controllate con le analisi successive maggiormente approfondite (bi-tri e multivariate) Non bisogna pertanto sottovalutare (o dimenticare) l’importanza di tali analisi preliminari. Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Come si presenta l’output di Spss Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Valori caratteristici della distribuzione L’analisi monovariata è dunque un analisi puramente descrittiva (e completa) di come una variabile si distribuisce all’interno di una popolazione. Le distribuzioni delle variabili possono essere riportate integralmente (come nelle tabelle appena presentate e/o sotto forma di grafici) o attraverso misure sintetiche. I valori caratteristici della distribuzione non sono altro che indici, espressi in forma numerica, utili ad una rappresentazione sintetica della distribuzione stessa di una variabile Le principali caratteristiche che descrivono una distribuzione di dati sono due: Le misure di tendenza centrale Le misure di variabilità Tali misure differiscono in relazione al “tipo” di variabile che si sta descrivendo Mentre le misure di tendenza centrale mirano ad individuare quale numero sintetizza meglio la distribuzione, le misure di variabilità ci dicono il modo in cui le altre modalità si collocano attorno a questo valore “sintetico” Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Variabili nominali Misura di tendenza centrale Moda Misura di variabilità Indici di omogeneità/eterogeneità p = frequenze relative al totale a 1 (proporzioni) k = modalità Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Variabili ordinali Misura di tendenza centrale Mediana e 1 100 50 25 75 Q1 Q2 Q3 Q4 Misura di variabilità Le differenza interquartile È una misura analoga al campo di variazione ma tiene conto solo dell'ampiezza della fascia di "centrale" dei valori osservati, non essendo influenzata dai valori estremi. Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Variabili cardinali - 1 Misura di tendenza centrale Media aritmetica Poiché in una distribuzione di frequenza abbiamo per ogni valore di Xi della variabile la frequenza con la quale esso si presenta, possiamo calcolare la media sommando prodotti fra valori e le rispettive frequenze Con k =modalità Xi = valori fi = frequenza Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Variabili cardinali - 2 Misura di variabilità Scostamento semplice medio È la misura di variabilità più semplice per le variabili cardinali. Il valore assoluto serve ad evitare che il risultato dell’operazione sia zero in quanto è caratteristica propria della media aritmetica il fatto che la somma degli scarti dei singoli valori dalla media dia come risultato zero Deviazione standard e varianza Procedura alternativa alla precedente. L’elevare al quadrato gli scarti dalla media dei singoli valori permette di conferire un peso maggiore agli scarti maggiori, oltre che l’annullamento dei valori negativi Quadrato della deviazione standard, più utilizzata in analisi bi e multivariate, quando cioè l’analisi dei dati ruota attorno al concetto di varianza spiegata, e in campo probabilistico (es. legge della varianza totale) Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Rappresentazioni grafiche Utilizzabili sia per quanto riguarda le frequenze assolute che le frequenze relative Non aggiungono ulteriori informazioni rispetto alle rappresentazioni tabellari ma sono sicuramente di maggiore efficacia comunicativa Diagramma a settori circolari (o diagramma a torta o pie chart) È costituito da un cerchio i cui settori (archi) sono proporzionali alle frequenze (assolute e relative) Molto utilizzato soprattutto per la sua forte comunicatività, è spesso criticato per il fatto che, se non accompagnato da espliciti valori (assoluti o percentuali) è difficile distinguere archi di dimensioni simili tra loro Più adatto per le variabili nominali, spesso viene utilizzato anche per le variabili ordinali proprio per la sua efficacia comunicativa Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Diagrammi a barre (bar chart) Ancora un modo semplice (ed efficace dal punto di vista comunicativo) di rappresentare graficamente una distribuzione di frequenza La creazione del grafico consiste nell’inserire i valori di ciascuna modalità della variabile in un piano cartesiano la cui asse delle ordinate (y) rappresenti la frequenza (o la percentuale) di tale modalità e sull’asse delle ascisse (x) le modalità della variabile. Accorgimento: poiché le variabili sono nominali o ordinali, per non suggerire continuità le barre del diagramma devono essere separate ed equidistanti fra loro Variante: diagramma a nastri. Vengono invertiti gli assi cartesiani Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Istogramma Diagramma a linee Qualora la variabile da rappresentare graficamente sia cardinale Come per il grafico a barre si utilizza il piano cartesiano Se la variabile è raggruppata in classi (es. classi di età sull’asse delle ascisse), le frequenze saranno costituite da rettangoli di area (non altezza) proporzionali Diagramma a linee Utilizzati per rappresentare grandezze continue, è utilizzato maggiormente quando si deve raffigurare una serie storica. Sull’asse orizzontate si troverà la variabile temporale (giorni, mesi, anni) e sull’asse delle ordinate i valori che rappresentano la misura della grandezza oggetto di studio Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

La trasformazione del dataset Operazioni di ricodifica Possono essere seguite due strategie operative: La modifica delle variabili già esistenti, alterando i valori ad esse assegnati La creazione di nuove variabili compiuta mediante la manipolazione di quelle esistenti Ci occuperemo oggi del primo punto, rimandando la creazione di nuove variabili alle lezioni sugli indici matematici (lezione 5) e tipologici (lezione 6) Le operazioni di ricodifica delle variabili possono essere volte a: Modificare i valori di una variabile Aggregare le modalità in categorie più ampie Tutte e due le procedure possono essere effettuate: Modificando la variabile originaria Creando una nuova variabile Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata

Esercitazione in classe Descrivere il campione in base alle variabili di base (sesso, tipo di scuola, titolo di studio ed occupazione dei genitori) con l’ausilio di grafici Descrivere le caratteristiche delle distribuzioni dei punteggi assegnati agli item della domanda 24 (percezione pericolosità) Teoria e pratica della valutazione Laboratorio – Lezione IV L’’analisi monovariata