“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.

Slides:



Advertisements
Presentazioni simili
STATISTICHE DESCRITTIVE
Advertisements

INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Introduzione all’uso degli indicatori di valutazione ed ai metodi di valutazione Dott.ssa Gabriella Giuliano Direttore Sanitario CREAS-IFC-CNR giugno.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Organizzazione dei dati AnnoQ [m 3 /s]
Precorso di Statistica per le Lauree Magistrali
LA STATISTICA DESCRITTIVA
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
Elaborazione dei dati Indici di posizione centrale
Distribuzioni limite La distribuzione normale
Analisi delle risposte
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Misure dei valori centrali
Bergamini, Trifone, Barozzi – La matematica del triennio
PEDAGOGIA SPERIMENTALE
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
L’analisi monovariata
Confronto fra 2 popolazioni
DISTRIBUZIONI TEORICHE DI PROBABILITA’
L'ABC della statistica LA MEDIA ARITMETICA
APPUNTI DI STATISTICA INFERENZIALE
Confronto tra diversi soggetti:
Accenni di analisi monovariata e bivariata
Precorso di Statistica per le Lauree Magistrali
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Rapporti e proporzioni
L’analisi monovariata
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Problema Immaginate di aver ottenuto un punteggio di 35 al test di ammissione alla Lumsa. Il massimo che si potesse ottenere era 60. Com’è stato il vostro.
Esercitazione di Statistica
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercitazioni psicometria
Un esempio Una casa farmaceutica dichiara che un nuovo antidolorifico che sta per immettere sul mercato fa effetto mediamente in un tempo pari a 12,75.
Statistica descrittiva
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
Confronto tra diversi soggetti:
Statistica.
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
Intervalli di confidenza
PEDAGOGIA SPERIMENTALE
Esercizio 1 La seguente distribuzione riporta i punteggi di ansia misurata prima dell’esame di psicometria: a) Costruire una tabella di frequenza, indicando:
Compito 1: 1) La seguente distribuzione riporta i punteggi di depressione su individui con disturbo post-traumatico da stress:
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Esercitazione 1: Rispetto alla scala di pregiudizio sociale (Media=12; σ=3), calcolare: Quale percentuale della popolazione di adulti italiani otterrà.
Test per campioni appaiati
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Precorso di Statistica per le Lauree Magistrali
Compito 1: La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: Costruire una tabella di frequenza, indicando: f, fc, %, %c.
Compito 1: La seguente distribuzione riporta il numero di errori di un gruppo di bambini con ritardo mentale in un test di lettura: Costruire una tabella.
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: Costruire una tabella di.
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
Esercizio 1 Il voto medio della popolazione degli studenti della Lumsa al primo esonero di psicometria è pari a 26 (σ=3). Gli studenti hanno sempre svolto.
PEDAGOGIA SPERIMENTALE
Associazione tra due variabili
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Test per campioni indipendenti
Associazione tra variabili qualitative
Frequenza a) Compilare una tabella classificando i compagni di classe secondo lo sport che preferiscono b) Compilare una tabella classificando i compagni.
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
EserciZI di Statistica
Transcript della presentazione:

“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”. Henry Ford “I hear and I forget. I see and I remember. I do and I understand”. Confucius

CONCETTI CHIAVE… La VARIABILE è ciò che si intende misurare nei casi (unità) e può avere diversi valori. Un VALORE è un numero o una categoria. Il valore della risposta di ogni unità è il PUNTEGGIO. Variabile -> Stress Valore -> Da 0 a 10 Punteggio -> 6

Statistica descrittiva Distribuzioni, tabelle e grafici di frequenza Indici di: tendenza centrale, di posizione e di variabilità Punti z e distribuzione normale

Indici di tendenza centrale Un indice di tendenza centrale è un valore che descrive e riassume il centro di una distribuzione di dati.

Indici di tendenza centrale Un gruppo di punteggi può essere descritto attraverso un valore rappresentativo (o tipico). Un valore rappresentativo esprime la tendenza centrale di un gruppo di punteggi. Un valore rappresentativo è un modo semplice di descrivere con un unico numero, un gruppo di punteggi.

Indici di tendenza centrale Sono dei singoli numeri che descrivono la posizione del punto centrale di una distribuzione. Gli indici di tendenza centrale sono: Moda -> valore con la frequenza maggiore -> Mo Media -> valore medio di un gruppo di punteggi -> Mediana -> valore che occupa la posizione centrale -> Mdn N.B. Ogni misura di tendenza centrale usa un proprio metodo specifico per trovare un singolo numero che rappresenti il centro di un gruppo di punteggi.

Indice di tendenza centrale: Moda La moda (Mo) di una distribuzione di dati rilevati su una variabile, è il valore che si presenta con la frequenza maggiore in una distribuzione. Distribuzione: 1 1 1 2 2 2 2 3 3 3 Mo= 2

Moda La moda (Mo) è il valore che ha la frequenza maggiore in X f 18 1 19 20 21 22 23 24 25 26 27 28 2 29 30 3 La moda (Mo) è il valore che ha la frequenza maggiore in una tabella di frequenza. È l’unico indice per le variabili nominali.

Moda Una distribuzione può avere anche 2 X f 18 1 19 20 21 22 23 24 25 26 27 28 2 29 3 30 Una distribuzione può avere anche 2 o più mode, dato che è possibile che due punteggi vengano ottenuti con la stessa frequenza. Se c’è una sola moda, la distribuzione si dice Unimodale; Se sono 2, Bimodale; Se sono più di 2, Multimodale.

Mo= 2 (ma non ha molto senso) Moda Se ci sono molte categorie, oppure poche categorie con frequenze simili, la moda non ha molto senso. 1 1 1 2 2 2 2 3 3 3 Mo= 2 (ma non ha molto senso)

Qual è la Moda? Rispetto alla variabile “NUMERO DI SOGNI in una in una settimana 7 8 3 1 9 6 Qual è la Moda? Rispetto alla variabile “NUMERO DI SOGNI in una settimana”, la moda è la modalità 8 a cui è associata una frequenza di 3.

Qual è la Moda? Rispetto alla variabile “Numero di figli”, la Codice mamma Numero di figli 1 2 3 4 5 6 7 8 9 10 11 12 Rispetto alla variabile “Numero di figli”, la moda è la modalità 0 a cui è associata una frequenza di 5.

Indice di tendenza centrale: Media La media di una distribuzione di dati rilevati su una variabile, è il valore dato dalla somma di tutti i valori, diviso per il numero di unità statistiche (N). La media si indica con il simbolo N.B. Per indicare la media, quando ci si riferisce a popolazioni, piuttosto che a campioni, si usa la lettera greca μ (mi ) al posto di

X sta per tutti i valori nella distribuzione della variabile X. Media campionaria È l’indice di tendenza centrale più utilizzato. Formula: MEDIA DEL CAMPIONE SOMMA DEI PUNTEGGI NUMERO TOTALE DEI CASI (Sigma) sta per somma di… Significa sommare tutti i punteggi che seguono. X sta per tutti i valori nella distribuzione della variabile X. N sta per numero totale.

Es. calcolo della Media (10; 15; 16; 18; 20; 24; 32; 35; 38; 40)=24.8 10+15+16+18+20+24+32+35+38+40=248/10

Caratteristiche principali: Media campionaria Caratteristiche principali: Considera tutti i punteggi; È “sensibile” ai valori estremi; È sempre interna; Può essere calcolata solo per scale a intervalli e a rapporti equivalenti.

Calcolare la media Esercizio* 1, 2, 3, 4, 5 Soluzione* (1+2+3+4+5)/5=15/5= 3 Esercizio** 3, 4, 5, 6, 7 Soluzione** (3+4+5+6+7)/5=25/5= 5 Esercizio*** 2, 4, 6, 8, 10 Soluzione*** (2+4+6+8+10)/5=30/5= 6

Es. Calcolare la media della variabile “stress” Ad un gruppo di studenti universitari, è stato chiesto di rispondere ad una domanda per indagare il loro livello di stress nella prima settimana del corso di psicometria. D: “Usando una scala da 0 a 10, con zero equivalente a per nulla stressato e dieci equivalente a più stressato possibile, quanto ti sei sentito stressato nelle ultime due settimane?”

Esempio: Calcolare la media della variabile “stress” N = 30 8, 7, 4, 10, 8, 6, 8, 9, 9, 7, 3, 7, 6, 5, 0, 9, 10, 7, 7, 3, 6, 7, 5, 2, 1, 6, 7, 10, 8, 8 8 + 7 + 4 + 10 + 8 + 6 + 8 + 9 + 9 + 7 + 3 + 7 + 6 + 5 + 0 + 9 + 10 + 7 + 7 + 3 + 6 + 7 + 5 + 2 + 1 + 6 + 7 + 10 + 8 + 8 = 193 193 / 30 = 6.43

Es. Calcolare la media della variabile “voto esame psicometria” Unità Genere Voto scuola media Voto esame psicometria Numero di Bocciature Alice 1 30 Giulia 3 28 Marco 2 4 27 Marta 25 Giuseppe Elisa Franca 22 Rita 18 Paolo

Calcolo della Media attraverso la tabella di frequenza Formula: Ossia: Moltiplicare ciascuna X con la relativa frequenza; Sommare i prodotti; Dividere per N.

Calcolo della Media attraverso la tabella di frequenza Punteggi rappresentati sotto forma di una distribuzione di frequenza: 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3 = 1.9 X f fX 1 3 2 6 12 11 21 Tabella dove per ogni valore (X) indichiamo a fianco la frequenza (f) con cui compare. 21 = = 1.9 11

Esempio Distribuzione: 18 22 25 27 28 28 30 30 30 Voto Frequenza 18 1 18 22 25 27 28 28 30 30 30 Voto Frequenza 18 1 22 25 27 28 2 30 3 Somma f X 18 22 25 27 56 90 238 Media 238/9 26,44

Media ponderata La “media ponderata” o “pesata” si utilizza quando i punteggi (X) hanno un peso (P) diverso. Il calcolo consiste nel: Moltiplicare ciascun punteggio per il relativo peso; Sommare i prodotti; Dividere per la somma dei pesi.

Media ponderata Esempio: Calcolare la media ponderata, sapendo che i voti sono 30, 25 e 28 con crediti rispettivamente di 12, 10 e 6. La media corretta è 27,79 (e non 27,66 che non considera i pesi). Voto Crediti 30 12 25 10 28 6 Voto x crediti 360 250 168 Somma 28 778 Media ponderata 778/28 27,79

Proprietà 1) Aggiungendo o sottraendo una costante (k), la media sarà uguale alla media originaria più (o meno) la costante. ES: distribuzione 3 4 8 = 5; se sommiamo K=2 alle X iniziali, avremo 3+2, 4+2; 8+2 Ossia 5 6 10 con media uguale a ? = 5+2

Utilità delle proprietà 1 Es 1 Calcolare la media della seguente distribuzione senza calcolatrice 11352 11356 11346 11354 Sottraggo il punteggio più basso (11346) a tutti i punteggi ottenendo: 6 10 0 8 Calcolo “nuova” media: 24/4 = 6 Calcolo la media originale sommando 6 al numero che avevo precedentemente sottratto: 6 + 11346= 11352

Proprietà 2) 2) Moltiplicando o dividendo per una costante (k), la media sarà uguale alla media originaria per (o diviso) la costante. ES: distribuzione 3 4 8 = 5; se moltiplichiamo K=2 alle X iniziali: 3*2, 4*2; 8*2 Ossia 6 8 16 con media uguale a ? = 5*2

Utilità delle proprietà 2 Es 2 Trasformare la media ponderata in voto di laurea? Voto laurea = *110/30 ES media errata: VL (27,66) = 27,66*110/30=101,42 voto 101 ES media corretta: VL (27,79) = 27,79*110/30=101,90 voto 102

Proprietà 3) 3) La somma delle deviazioni (scarti o differenze) dei punteggi dalla media è uguale a 0. X 1 2 3 8 = 3 1 - 3 2 - 3 3 - 3 8 - 3 X-3 -2 -1 5

Proprietà 3) Federico Sabrina Paolo Euro 22.0 Sara TOTALE A TESTA 18 + 16.5 + 22.0 + 17.5 = 74 74 / 4 = 18.5 Ovvero 18.5 * 4 = 74

Proprietà 3) Qualcuno paga di più e qualcuno di meno, ma, alla fine, il “di più” si annulla con il “di meno”. = 18.5 X X - Federico 18.0 18 - 18.5 = 0.5 Sabrina 16.5 16.5 - 18.5 = 2.0 Paolo 22.0 22.0 - 18.5 = -3.5 Sara 17.5 17.5 - 18.5 = 1.0 TOTALE 74.0 74.0 - 74.0 = 0

Proprietà: Tabella di frequenza Anche per le tabelle di frequenza la somma delle deviazioni dei punteggi dalla media è uguale a 0. In questo caso è necessario moltiplicare le deviazioni per le frequenze. X f 1 2 3 8 X-3 1-3 = -2 2-3 = -1 3-3 = 0 8-3 = 5 f(X-3) -2*2 = -4 -1*1= -1 0*0 = 0 5*1 = 5 -4 + -1 + 0 + 5 = 0

Esercitazione Verificare che la somma degli scarti dei punteggi dalla media è uguale a 0. Voto Frequenza 2 1 3 4 5 X-4 -2 -1 1 f (X-4) -2 4

Indice di tendenza centrale: Mediana La mediana di una distribuzione di dati ordinati (in ordine crescente) rilevati sulla variabile X, è il dato che occupa la posizione centrale rispetto alla distribuzione dei dati. La mediana si indica con il simbolo Mdn. È un indice di tendenza centrale che consente di suddividere la distribuzione in due parti uguali, ossia di individuare il punteggio sotto il quale si colloca il 50% del campione. La mediana non è influenzata da valori estremi.

Calcolo della mediana Assicurarsi che le variabili siano su scala ad intervalli. La distribuzione dei punteggi deve essere ordinata dal valore minore a quello maggiore. Se N (numerosità totale) è dispari la Mdn è il valore in posizione centrale, corrispondente a (N+1)/2 Se N (numerosità totale) è pari la Mdn è calcolata facendo la semisomma tra i due punteggi centrali cioè N/2 e N/2+1.

Calcolo della mediana punteggi dispari Voto di 5 studenti esame di psicometria 18; 28; 19; 18; 22 Ordinare i punteggi dal più piccolo al più grande: 18, 18, 19, 22, 28 Calcolare la posizione mediana del dato corrispondente alla mediana utilizzando la formula -> N+1/2 = 5+1/2 = 3 Posizione mediana = 3 Mdn = 19

Calcolo della mediana punteggi pari Se N è pari la Mdn è il valore fra le 2 posizioni centrali. Se i due valori sono uguali, quello è il valore della Mdn. Voto di 6 studenti esame di psicometria 24; 29; 30; 22; 22; 26 Ordinare i voti dal più piccolo al più grande: 22; 22; 24; 26; 29; 30 Calcolare le posizioni centrali utilizzando la formula -> N/2 e N/2 +1 = 6/2= 3 e 6/2 + 1= 4 La Mdn dei dati è compresa tra 24 e 26.

Calcolo della mediana punteggi pari Se N è pari e i dati oltre che ordinali sono anche continui è possibile stimare la Mdn attraverso l’interpolazione lineare. Calcolare la Mdn utilizzando la seguente formula -> Mdn= Xinf + Xsup /2 Voto di 6 studenti esame di psicometria 22; 22; 24; 26; 29; 30 Mdn= 24+26/2= 50/2= 25 La Mdn è 25.

Mediana: uso della frequenza (n dispari) Posizione Mediana: (n+1)/2 = (7+1) / 2 = 8/2 = 4 4 è la posizione che occupa il punteggio, ma non è la mediana!!! X f fc 1 3 2 4 5 6 39 7 mediana posizione

Mediana: uso della frequenza (n pari) Posizione Mediana: (n+1)/2 = (8 + 1) / 2 = 9/2 = 4,5 Significa che la mediana si trova tra le fc 4 e 5: bisogna calcolare la media dei punteggi corrispondenti alla 4° e 5° posizione. X f fc 1 3 2 4 5 6 39 8 posizione mediana: 2+3/2=2,5

Mediana: uso della percentuale Calcolare la percentuale dei punteggi della seguente distribuzione: 18 22 25 27 28 28 30 30 30 X f fc 18 1 22 2 25 3 27 4 28 6 30 9 Calcolo della percentuale: %X= (f/N)100 %18=(1/9) 100= 11,11

Calcolo della mediana: % cumulata X f fc % 18 1 11,11% 22 2 25 3 27 4 28 6 22,22% 30 9 33,33% %c 11,11% 22,22% 33,33% 44,44% 66,66% 100,0% la mediana è il punteggio sotto il quale si trova il 50% della distribuzione

Calcolo della mediana: % cumulata Calcolare la mediana, attraverso la percentuale cumulata, sulla seguente distribuzione: 1 1 2 4 X f fc % 1 2 50% 3 25% 4 %c 50% 75% 100% Se si raggiunge esattamente il 50% è necessario calcolare la media dei due punteggi Posizione=(N+1)/2= (4+1)/2=2,5 Mdn si trova tra le posizioni 2 e 3 di fc Mdn=(1+2)/2=1,5

Calcolare la Mediana Esercizio* 3, 5, 7, 9, 11 Soluzione* N=5; pos Mdn=3; Mdn=7 Esercizio** 2,3,5,7,9,11,12 Soluzione** N=7; pos Mdn=4 Mdn=7 Esercizio*** 3,4,5,6,7,8 Soluzione*** N=6; pos Mdn=3 e 4 Mdn=5;6 (5.5)

Scale e indici di tendenza centrale Moda Mediana Media Nominale Si Ordinale Intervalli Rapporti Applicabilità degli indici a seconda della scala di misura

Esercitazione Moda, Media e Mediana Scrivere la formula per la media e definire ognuno dei simboli. Calcolare la Media dei seguenti punteggi: 2, 3, 3, 6, 6 ( X )/N (2+3+3+6+6)/5= 4 Per i seguenti punteggi, trovare Moda, Media e Mediana 5, 3, 2, 13, 2 Mo= 2; Media= 5; Mdn= 3