Statistica descrittiva

Slides:



Advertisements
Presentazioni simili
Misurazione Le osservazioni si esprimono in forma di misurazioni
Advertisements

© 2015 Giorgio Porcu - Aggiornamennto 01/12/2015 I STITUTO T ECNICO SECONDO BIENNIO T ECNOLOGIE E P ROGETTAZIONE Rappresentazione dell’ Informazione Sistemi.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
1 Corso di Analisi Statistica per le Imprese Rappresentazione dei dati Prof. L. Neri a.a
Organizzazione dei dati AnnoQ [m 3 /s]
Statistica I Grafici Seconda Parte.
LA STATISTICA DESCRITTIVA
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
Analisi monovariata: frequenze
Modalità rappresentazione dei dati Tabelle, percentuali, grafici …
DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE
Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Misure dei valori centrali
Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill
PEDAGOGIA SPERIMENTALE
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
L’analisi monovariata
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Esercitazione finale Esemplificazione testo esame
Corso di Laurea in Scienze e Tecniche Psicologiche
Excel 1 - Introduzione.
Confronto tra diversi soggetti:
Accenni di analisi monovariata e bivariata
La Statistica si occupa dei modi
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
Ripasso dei concetti fondamentali
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Fisica: lezioni e problemi
Esercitazione di Statistica Economica
L’analisi monovariata
I 7 strumenti della qualità
Esercitazione di Statistica Economica
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese Rappresentazione dei dati
Organizzazione dei dati
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercitazioni psicometria
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
Cosa ci dicono i dati sugli apprendimenti
Confronto tra diversi soggetti:
Statistica.
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
I partecipanti imparano tutto sul dado.
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
Esercizio 1 La seguente distribuzione riporta i punteggi di ansia misurata prima dell’esame di psicometria: a) Costruire una tabella di frequenza, indicando:
Compito 1: 1) La seguente distribuzione riporta i punteggi di depressione su individui con disturbo post-traumatico da stress:
Interpretare la grandezza di σ
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Riduzione dei Dati.
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Compito 1: La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: Costruire una tabella di frequenza, indicando: f, fc, %, %c.
Compito 1: La seguente distribuzione riporta il numero di errori di un gruppo di bambini con ritardo mentale in un test di lettura: Costruire una tabella.
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Mobilità internazionale e conversione dei voti Maria Sticchi Damiani febbraio
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: Costruire una tabella di.
Associazione tra due variabili
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Associazione tra variabili qualitative
Frequenza a) Compilare una tabella classificando i compagni di classe secondo lo sport che preferiscono b) Compilare una tabella classificando i compagni.
Modalità rappresentazione dei dati Grafici, percentuali, tabelle …
EserciZI di Statistica
Risultati e statistiche
Transcript della presentazione:

Statistica descrittiva Obiettivo: riassumere e descrivere le caratteristiche di un insieme di dati in modo chiaro e sintetico (Es. la media universitaria è un indice riassuntivo dei voti ottenuti negli esami sostenuti). Tra le tecniche utilizzate: - Distribuzioni e grafici di frequenza: servono a semplificare la lettura dei dati.

Voto esame psicometria La matrice dei dati Unità Genere Voto scuola media Voto esame psicometria Numero di Bocciature Alice F Suff. 30 Giulia Distinto 28 Marco M Ottimo 27 Marta 25 1 Giuseppe Buono 2 Elisa Franca 22 Rita 18 Paolo

1) Distribuzioni di frequenza Distribuzione: insieme dei punteggi o delle modalità relative ad una variabile. Esempio: F F M F M F F F M Frequenza: numero di volte con cui è presente un punteggio o una modalità. Calcolo della frequenza semplice: Conteggio del numero di volte con cui è presente ciascun punteggio o modalità. Calcolo della frequenza cumulata: Somma delle frequenze semplici immediatamente successive.

Costruire la tabella di freq (genere: 1=F; 2=M) Unità Genere Voto scuola media Voto esame psicometria Numero di Bocciature Alice 1 30 Giulia 3 28 Marco 2 4 27 Marta 25 Giuseppe Elisa Franca 22 Rita 18 Paolo

Tabella di frequenza semplice: variabile genere X (punteggio o modalità) F (frequenza) Fc (frequenza cumulata) 1 6 2 3 9 Adesso tocca a voi: Costruire una tabella di frequenza rispetto alla variabile “Voto esame Psicometria”

COME costruire una tabella di frequenza… Fare un elenco su un foglio di ogni possibile valore (cioè un numero o punteggio), dal minore al maggiore. Nel voto esame psicometria, l’elenco va da 18 (il minore valore possibile) a 30 (il maggiore valore possibile). Inserire anche i valori fra 18 e 30 che non sono usati. 2) Scorrere uno a uno i punteggi, spuntando ciascun valore nell’elenco. 3) Costruire una tabella che riporta quante volte ciascun valore dell’elenco viene usato.

X F Fc 18 19 20 21 22 23 24 25 26 27 28 29 30

X F Fc 18 1 ? 19 20 21 22 23 24 25 26 27 28 2 29 30 3

COME costruire una tabella di frequenza cumulata… La costruzione di una Distribuzione di frequenza cumulata inizia da una distribuzione di frequenza semplice. Bisogna formare una nuova colonna di frequenze cumulate in cui inserire, partendo dal punteggio più basso, la somma progressiva delle frequenze osservate.

X F Fc 18 1 19 20 21 22 2 23 24 25 3 26 27 4 28 6 29 30 9

Rappresentazioni grafiche Per rendere ancora più semplice la lettura dei dati, è possibile riportare le frequenze su alcuni grafici. In particolare vi sono: Grafici a barre Istogrammi a barre Poligoni di frequenza semplice Poligoni di frequenza cumulata

Grafici e istogramma a barre Grafici e istogrammi a barre sono molti simili I grafici a barre sono indicati per variabili nominali e ordinali: le barre sono separate l’una dall’altra Gli istogrammi a barre sono indicati per variabili intervallo/rapporto: le barre sono contigue fra loro Ogni frequenza è rappresentata da una barra La lunghezza di ogni barra è proporzionale alla frequenza: barre più lunghe indicano frequenze più elevate Negli istogrammi anche l’area di una barra è proporzionale alla frequenza

Grafico a barre Quando si usa: Si usa per rappresentare le variabili discrete. Costruzione di un grafico a barre Disporre le frequenze sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si costruiscono delle barre in corrispondenza di ciascuna X, con altezza pari alla frequenza. N.B. Le barre non sono adiacenti

COME costruire un grafico a barre… Costruire la tabella di frequenza. 2) Mettere i valori (Es. VOTO ESAME PSICOMETRIA) lungo la parte bassa del foglio (da sinistra a destra, dal minore al maggiore, quindi 18,19,20,21 -> 30). 3) Creare una scala delle frequenze (0,1,2,3,4) lungo il margine sinistro del foglio (andando da 0 in basso, fino alla frequenza maggiore). 4) Disegnare un rettangolo (la barra) per ogni valore (con un’altezza uguale alla frequenza di quel valore).

Grafici a barre: var. discrete

Istogrammi a barre Quando si usa: Si usa per rappresentare le variabili continue. Costruzione degli istogrammi a barre Disporre le frequenze sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si costruiscono delle barre in corrispondenza di ciascuna X, con altezza pari alla frequenza. N.B. Le barre sono adiacenti

Istogrammi a barre: var. continue

COME costruire una distribuzione di frequenza per classi… Non elencare ciascun singolo punteggio nello spazio dei punteggi (Es. 18,19,20,21,…) Scegliere l’ampiezza dell’intervallo (Es. 3 punti), in modo da raggruppare i punteggi in intervalli di classe sempre uguale (Es. 18,19,20,5 - 21,22,23,5 - …) fino a che l’intero spettro dei punteggi ottenuti non è coperto. 3) Riferire le frequenze ai suddetti intervalli. N.B. La distr. di freq. per classi non fornisce la frequenza esatta di ciascun punteggio. Utile quando i dati sono >15.

Rappresentazioni grafiche Per rendere ancora più semplice la lettura dei dati, è possibile riportare le frequenze su alcuni grafici. In particolare vi sono: Grafici a barre Istogrammi a barre Poligoni di frequenza semplice Poligoni di frequenza cumulata

Poligoni di frequenza semplice e cumulata Quando si usano: Si usano per variabili discrete o continue. Costruzione del poligono di frequenza semplice Disporre le frequenze semplici sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si segnano i punti in corrispondenza della frequenza di ciascuna X. Si uniscono i punti delle X adiacenti.

Poligono di frequenza semplice

Poligoni di frequenza cumulata Quando si usano: Si usano per variabili discrete o continue. Costruzione del poligono di frequenza semplice Disporre le frequenze cumulate sull’asse verticale e le X sull’asse orizzontale (in ordine crescente). Si segnano i punti in corrispondenza della frequenza cumulata di ciascuna X. Si uniscono i punti delle X adiacenti.

Poligono di frequenza cumulata

RIEPILOGO… La statistica descrittiva serve per rappresentare e riassumere un insieme di dati. Un “valore” è un numero o una categoria; una variabile è una caratteristica che può avere diversi valori. Una tabella di frequenza organizza, in uno schema, i punteggi di ciascuno dei possibili valori con la frequenza dei punteggi con quel valore. Quando ci sono molti valori diversi (>15) è utile una tabella in classi di frequenza. L’andamento delle frequenze in una distribuzione può essere rappresentato graficamente.

Es: costruire una tabella di frequenza È stato richiesto agli studenti di un corso di psicologia di tenere un diario contenente le proprie interazioni sociali per una settimana. Ogni volta che un partecipante (ogni studente) aveva una interazione sociale che durava almeno 10 minuti doveva compilare una scheda. La scheda conteneva domande riguardanti diversi aspetti della conversazione e riguardo il partner della conversazione.

Es: costruire una tabella di frequenza Il numero di interazioni sociali di almeno 10 minuti in una settimana per questi studenti è stato: 48, 15, 33, 3, 21, 19, 17, 16, 44, 25, 30, 3, 5, 9, 35, 32, 26, 13, 14, 14, 47, 47, 18, 11, 5, 19, 24, 17, 6, 25, 8, 18, 29, 1, 18, 22, 3, 22, 29, 2, 6, 10, 29, 10, 29, 21, 38, 41, 16, 17, 8, 40, 8, 10, 18, 7, 4, 4, 8, 11, 3, 23, 10, 19, 21, 13, 12, 10, 4, 17, 11, 21, 9, 8, 7, 5, 3, 22, 14, 25, 4, 11, 10, 18, 1, 28, 27, 19, 24, 35, 9, 30, 8, 26.

COME costruire una tabella di frequenza… 1) Fare un elenco su un foglio di ogni possibile valore (cioè il numero di interazioni), dal minore al maggiore. In questo campione (N=94), il numero minimo di interazioni è 0 e il numero massimo di interazioni è 48. 2) Scorrere uno a uno i punteggi, spuntando ciascun valore nell’elenco. 3) Costruire una tabella che riporta quante volte ciascun valore dell’elenco viene usato.

1) e 2) 17 34 1 18 35 2 19 36 3 20 37 4 21 38 5 22 39 6 23 40 7 24 41 8 25 42 9 26 43 10 27 44 11 28 45 12 29 46 13 30 47 14 31 48 15 32 16 33

3) Tabella di frequenza numero di interazioni sociali in una settima di 94 studenti universitari Punteggio Frequenza 17 4 34 1 2 18 5 35 19 36 3 20 37 21 38 22 39 6 23 40 7 24 41 8 25 42 9 26 43 10 27 44 11 28 45 12 29 46 13 30 47 14 31 48 15 32 16 33

COME costruire una tabella in classi di frequenza Scegliere l’ampiezza dell’intervallo (Es. 2,3,5 o 10 punti), che crei da 5 a 15 intervalli circa, in modo da raggruppare i punteggi in intervalli di classe sempre uguale fino a che l’intero spettro dei punteggi ottenuti non è coperto. Quando si costruisce effettivamente la tabella, assicurarsi di aver stabilito l’inizio di ogni intervallo a un multiplo dell’ampiezza dell’intervallo e il limite superiore di ogni intervallo appena sotto l’inizio dell’intervallo successivo.

COME costruire una tabella in classi di frequenza In questo caso si è scelto di utilizzare 10 intervalli con un’ampiezza di intervallo di 5. Gli intervalli sono: 0-4, 5-9, 10-14, 15-19 ecc. Il limite superiore di ogni intervallo (4,9,14,19, ecc.) è il numero appena sotto l’inizio dell’intervallo successivo (5,10,15,20 ecc.

Tabella in classi di frequenza Intervallo Frequenza 0-4 12 5-9 16 10-14 15-19 20-24 10 25-29 11 30-34 4 35-39 3 40-44 45-49

Esercitazione M Licenza media 24 F Laurea 25 Licenza superiore 30 27 Genere Titolo di studio Età M Licenza media 24 F Laurea 25 Licenza superiore 30 27 28 35 Per le prime due variabili, costruire tutti i grafici adeguati.

Esercitazione: Genere e titolo di studio: Grafici a barre Poligoni di frequenza (semplice e cumulata) Età in classi: Istogrammi a barre

Genere (1=F; 2=M) Tabella di frequenza X F Fc 1 4 2 8

Genere (1=F; 2=M): poligono semplice

Genere (1=F; 2=M): poligono cumulata

Titolo di studio (1=media; 2=superiore; 3=laurea) Tabella di frequenza X F Fc 1 2 4 6 3 8 X= 1) LICENZA MEDIA 2) LICENZA SUPERIORE 3) LAUREA

Titolo di studio: Poligono frequenza semplice

Titolo di studio: Poligono frequenza cumulata