Descrizione dei dati Metodi di descrizione dei dati Tabelle Tabelle di frequenza Tabelle con statistiche descrittive Tabelle con statistiche inferenziali Grafici Distribuzioni di frequenza (o di probabilità) Grafico di dispersione Grafici lineari Grafici a barre Grafici a serie temporale
Tabella di frequenza
Tabella delle statistiche descrittive La tabella riporta indici di dispersione (varianza, dev. standard, quartili, percentili,ecc…) e indici di tendenza centrale (media, mediana, moda). Inoltre, può riportare numerosità, valori minimi e massimi, asimmetria e curtosi dei dati.
Tabella delle statistiche inferenziali La tabella riporta gli indici dei test statistici (t di Student, chi quadro, F) e la loro significatività. In aggiunata possono essere riportati altri indici (errori di misura, somme dei quadrati, gradi di libertà, ecc…) Tabella per l’analisi di varianza:
Tabella per l’analisi fattoriale:
Tabella delle correlazioni bivariate:
È possibile creare tabelle miste (con statistiche descrittive e inferenziali):
Rappresentazioni grafiche dai dati (grafici). Le rappresentazioni grafiche dei dati, in generale, vengono riportate su un diagramma cartesiano, composto da due assi, l’ascissa (asse orizz.) e l’ordinata (asse verticale). Sull’ascissa si riportano i livelli o valori della var. indipendente; sull’ordinata si riportano i valori (frequenze, proporzioni, percentuali, grandezze) della var. dipendente.
Distribuzioni di frequenza (o di probabilità) Sull’ascissa abbiamo i valori della var. indipendente e sull’ordinata le frequenze (o proporzioni o percentuali). Istogramma: Poligono delle frequenze:
Distribuzione cumulativa delle frequenze:
Distribuzione normale delle frequenze:
Grafico di dispersione Il grafico di dispersione riporta la relazione tra due variabili. Sull’ascissa si riportano i valori della prima variabile e sull’ordinata i valori della seconda variabile.
Grafici lineari I grafici lineari vengono usati per rappresentare le relazione o funzione che lega la var. dipendente alla var. indipendente. Si usano quando sia la var. indipendente, sia la var. dipendente sono misurate su scale quantitative.
Grafico a barre: si usa quando la var Grafico a barre: si usa quando la var. indipendente è qualitativa (categorie o gruppi). Non si dovrebbe usare una grafico a linee per rappresentare le relazione tra var. dip. e var. indip. quando quest’ultima è qualitativa, poiché non sono ammissibili valori della var. indip. intermedi. Grafico a linea scorretto: Grafico a linea corretto:
Grafici a serie temporale Questi grafici rappresentano le variazioni dei valori della var. dipendente in funzione del tempo. Variazione del valore dei titoli della borsa di Milano:
Rappresentazione della varianza dei dati nei grafici Grafici con barre di errore box-and-wisker plot
Struttura di una matrice di dati La matrice di dati è una tabelle dove per riga abbiamo le singole osservazioni (soggetti) e per colonna le variabili dipendenti e indipendenti. Solitamente, le variabili dip. sono dette “misure” e sono i valori usati per l’analisi statistica, mentre le var. indipendenti sono dette “fattori” e specificano quali livelli della variabile vengono messi a confronto. misura fattori
Controllo della matrice dei dati dati non validi: sono dati errati perché inseriti scorrettamente. Una volta individuati è necessario correggerli dati mancanti (od omessi): sono dati che mancano perché il soggetto non ha risposto. Se la percentuale di dati mancanti è troppo alta, il soggetto viene escluso dall’analisi. dati isolati: sono dati anomali improbabili, dovuti a qualche effetto estraneo intervenuto durante il test. Un criterio abbastanza seguito è quello di eliminare i dati che hanno 3 o più deviazioni standard lontano dalla media.