Interpretare la grandezza di σ

Slides:



Advertisements
Presentazioni simili
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Advertisements

La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
LA STATISTICA DESCRITTIVA
DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE
Distribuzioni limite La distribuzione normale
Variabili casuali a più dimensioni
Esercizio 1 Prezzo in euro libri
RICHIAMI DI INFERENZA:
Analisi delle risposte
Funzioni crescenti e decrescenti
Analisi dati scuola secondaria di I grado
Esercitazioni su testi d’esame
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Confronto fra 2 popolazioni
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Il calcolo della probabilità
Equazioni differenziali
Insiemi di punti: altre caratteristiche
22) Funzioni (prima parte)
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Confronto tra diversi soggetti:
SEC. I GRADO - I.C. BELLA CLASSE III GRAFICI.
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
Analisi dati scuola secondaria di I grado
Potenza in corrente alternata monofase
Potenza in corrente alternata monofase
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Appunti di analisi matematica: Integrale Definito
L’analisi monovariata
INCONTRO CON LA MATEMATICA IN MEMORIA DI CLARA BOZZOLO
Limite di una funzione appunti.
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Elaborazione statistica di dati
Un esempio Una casa farmaceutica dichiara che un nuovo antidolorifico che sta per immettere sul mercato fa effetto mediamente in un tempo pari a 12,75.
Statistica descrittiva
La standardizzazione dei punteggi
Confronto tra diversi soggetti:
Università degli Studi di Modena e Reggio Emilia
32 = 9 x2 = 9 x = 3 32 = 9 √9 = 3 L’estrazione di radice
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
PROCEDURA per la misura e la relativa stima
Esercizio 1 La seguente distribuzione riporta i punteggi di ansia misurata prima dell’esame di psicometria: a) Costruire una tabella di frequenza, indicando:
Compito 1: 1) La seguente distribuzione riporta i punteggi di depressione su individui con disturbo post-traumatico da stress:
Lettura dei dati di Istituto
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
ANALISI DI REGRESSIONE
Esercitazione 1: Rispetto alla scala di pregiudizio sociale (Media=12; σ=3), calcolare: Quale percentuale della popolazione di adulti italiani otterrà.
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Dip. Economia Politica e Statistica
Precorso di Statistica per le Lauree Magistrali
Capitolo 1 Introduzione alla fisica
Compito 1: La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: Costruire una tabella di frequenza, indicando: f, fc, %, %c.
Compito 1: La seguente distribuzione riporta il numero di errori di un gruppo di bambini con ritardo mentale in un test di lettura: Costruire una tabella.
RICHIAMI DI INFERENZA:
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: Costruire una tabella di.
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
RICHIAMI DI INFERENZA:
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Corso di Analisi Statistica per le Imprese
Test per campioni indipendenti
Associazione tra variabili qualitative
Corso di Analisi Statistica per le Imprese
Dip. Economia Politica e Statistica
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Transcript della presentazione:

Interpretare la grandezza di σ Abbiamo visto che lo scarto quadratico medio è interpretabile come distanza tipica delle osservazioni dalla media. Supponiamo che la distribuzione dei voti di un esame espresso in una scala da 0 a 100 abbia media pari a 77. Un valore di σ= 0 è estremamente improbabile da osservare, in quanto richiederebbe che ogni studente abbia ottenuto un voto esattamente pari a 77. Anche un valore di σ=50 improbabile come distanza tipica dalle osservazioni dalla media, mentre appaiono più realistici per σ valori pari a 8 o 12.

Regola empirica Un modo più preciso per interpretare la grandezza di σ richiede una maggiore conoscenza della forma della distribuzione di frequenze. Se l’istogramma della distribuzione ha una forma approssimativamente campanulare, allora: circa il 68% delle osservazioni assume valori compresi tra µ-σ e µ+σ; circa il 95% per cento delle osservazioni assume valori compresi tra µ- 2σ e µ+2σ; la quasi totalità delle osservazioni assume valori compresi tra µ-3σ e µ+3σ;

Esempio n.1 Il test di attitudine scolastica è articolato in 3 sezioni: lettura critica, matematica e scrittura. Per ciascuna sezione la distribuzione dei punteggi è grossomodo campanulare con µ=500 e σ=100. In ciascuna sezione, seguendo la regola empirica, si ha il 68% dei punteggi che ricade tra 400 e 600, il 95% circa che ricade tra 300 e 700 e il restante 5% dei punteggi è al di sotto di 300 e al di sopra di 700.

Esempio n.2 sulla familiarità con vittime dell’AIDS Nella slide successiva vi mostro una distribuzione di frequenze del numero di persone conosciute colpite da Aids. Per meglio comprendere l’esempio, vi ho calcolato le frequenze cumulate. Osservate con attenzione la tabella e il commento.

Distribuzione di frequenze del numero di persone conosciute colpite dall’Aids FREQUENZE PERCENTUALI FREQUENZE CUMULATE P. 1214 76.0 1 204 12.8 88.8 2 85 5.3 94.1 3 49 3.1 97.2 4 19 1.2 98.4 5 13 0.8 99.2 6 0.3 99.5 7 8 0.5 100.0 0.1 100.1 Totale N=1598 Media=0,47, Scarto q.m.:1,09

L’88,8% delle osservazioni ricade in corrispondenza di questi 2 valori (media e s.q.m.) oppure entro l’intervallo (media± s.q.m.). Tale quantità è considerevolmente maggiore del 68% previsto dalla regola empirica La regola empirica non si applica a tale distribuzione in quanto non è campanulare ma fortemente asimmetrica positiva: il valore più piccolo che si osserva (0) è a meno di una deviazione standard dalla media; il valore più elevato è a circa sette deviazioni standard più in alto della media.

Lo z-score Un altro modo per misurare una posizione in una distribuzione è di contare a quanti σ dalla media ricade una certa osservazione. Il numero di σ che separano un’osservazione di una distribuzione dalla media della stessa è chiamato z-score che è uguale a : Z= 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑧𝑖𝑜𝑛𝑒 −𝑚𝑒𝑑𝑖𝑎 𝑠𝑐𝑎𝑟𝑡𝑜 𝑞𝑢𝑎𝑑𝑟𝑎𝑡𝑖𝑐𝑜 𝑚𝑒𝑑𝑖𝑜

Distribuzione normale Ciascuna distribuzione normale è specificata da due parametri:µ e σ. Per ciascun valore reale di µ e per ciascun valore non negativo di σ, esiste una distribuzione normale avente quella media e quello scarto quadratico medio. Ad esempio le altezze delle donne adulte dell’Italia meridionale hanno, all’incirca, una distribuzione normale con µ=165 e σ=3,5. La probabilità che una donna scelta a caso abbia un’altezza compresa tra µ-3σ=165- 3(3,5)=154,5 e µ+3σ=165+3(3,5)=175,5 è vicina a 1.0.

Tavola delle probabilità sottese alle code di una distribuzione normale In una distribuzione normale, per ciascun fissato valore z, la probabilità che un’osservazione ricada attorno alla media più o meno z volte lo scarto quadratico medio, dipende dal valore di z. Tale probabilità è data dall’area sottesa alla curva normale compresa tra µ -zσ e µ+zσ. Per una distribuzione normale, la probabilità concentrata entro zσ da µ è la stessa per tutte le curve normali anche se z non è un numero intero. La tavola delle probabilità contiene i valori delle probabilità per diversi insiemi di valori. Essa riporta la probabilità per valori che cadono nella coda destra, almeno z volte il σ oltre la media. La colonna sul margine sinistro indica i valori per z a una cifra decimale, la seconda cifra decimale di z è indicata sopra nell’intestazione delle colonne.

Z-score dei punteggi al test di ammissione all’Università Esempio. I punteggi al test di attitudine scolastica somministrato in un esame di ammissione all’Università hanno, in genere, una distribuzione pressoché normale con µ=500 e σ=100. Il punteggio al test pari a x=650 ha uno z- score=1,50 e cioè x= 650 = µ+zσ = 500+z(100).

Esempio Se la media e lo s.q.m dei redditi di un gruppo di famiglie sono rispettivamente di 4 milioni e di 0,8 milioni, potremo affermare che nell’intervallo µ±2σ≡(4±2∙0,8)≡(2,4−5,6) è compreso almeno il 75% delle famiglie e nell’intervallo µ±3σ≡(4±3∙0,8)≡(1,6−6,4) è compreso almeno l’88 % delle famiglie.

Sempre per lo stesso esempio, fissato l’intervallo simmetrico intono alla media da 3 a 5 milioni, dalla µ−zσ=3 oppure dalla µ+zσ=5, sostituendo i valori con µ=4 e di σ=0,8 si ricava z=1,25. Per il valore di z=1,25 guardiamo le tavole nella prossima slide e otteniamo 0,1826 che moltiplicato per 2 darà più o meno il 36% delle famiglie.

La frequenza dell’intervallo da 3 a 5 milioni, pertanto, non potrà essere inferiore a 1− 1 1,25 2 =0,36=36%. Volendo determinare l’intervallo nel quale deve essere compresa almeno una certa frequenza p di casi occorrerà preliminarmente risolvere per z l’equazione 1− 1 𝑧 2 = p e sostituire il valore di z trovato. Nel nostro caso volendo l’intervallo in cui è compreso almeno l’80% delle famiglie si ha 1− 1 𝑧 2 = 0,80, da cui z = 2,236 e quindi l’intervallo cercato sarà (µ± zσ)≡(4±2,236∙0,8) ≡(2,21-5,79).