ANALISI DELLE DISTRIBUZIONI STATISTICHE

Slides:



Advertisements
Presentazioni simili
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Advertisements

Le misure di tendenza centrale informano sul centro della distribuzione 4 - Le medie a.a Le medie a.a
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
I Polinomi Prof.ssa A.Comis.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
NUMERI RELATIVI I numeri relativi comprendono i numeri positivi, negativi e lo 0 Esempio: +10, -5, +3, 0, -2 I numeri relativi si possono trovare all’interno.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Precorso di Statistica per le Lauree Magistrali
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Le funzioni matematiche e il piano cartesiano
Proporzioni Nella giusta misura!.
= 2x – 3 x Definizione e caratteristiche
Elaborazione dei dati Indici di posizione centrale
Distribuzioni limite La distribuzione normale
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Misure dei valori centrali
Bergamini, Trifone, Barozzi – La matematica del triennio
Bergamini, Trifone, Barozzi – La matematica del triennio
GLI STRUMENTI AUSILIARI
PEDAGOGIA SPERIMENTALE
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
Le primitive di una funzione
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Il concetto di derivata
L'ABC della statistica LA MEDIA ARITMETICA
Richiami di Algebra Matriciale
x : variabile indipendente
Indici di variabilità Gli indici di variabilità misurano
Equazioni differenziali
- Catene di rapporti - Proporzioni continue - Funzioni matematiche
La statistica A cura di: Manuela Mangione.
MATEMATICA I.
Alcuni modelli probabilistici
Precorso di Statistica per le Lauree Magistrali
misure di eterogeneità
Bergamini, Trifone, Barozzi – La matematica del triennio
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Appunti di analisi matematica: Integrale Definito
Statistica descrittiva bivariata
L’analisi monovariata
Rapporti e proporzioni
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Organizzazione dei dati
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
I numeri relativi DEFINIZIONE. Si dicono numeri relativi tutti i numeri interi, razionali e irrazionali dotati di segno (positivo o negativo). ESEMPI Numeri.
Statistica.
PROCEDURA per la misura e la relativa stima
Le espressioni algebriche letterali
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
PEDAGOGIA SPERIMENTALE
Le primitive di una funzione
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
I RADICALI ARITMETICI.
ANALISI DI REGRESSIONE
Precorso di Statistica per le Lauree Magistrali
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercizio 1 Prezzo in euro libri
Integrale Definito Integrale Indefinito Integrale Definito
Statistica descrittiva bivariata
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
I radicali Esercitazioni Dott.ssa Badiglio S..
Transcript della presentazione:

ANALISI DELLE DISTRIBUZIONI STATISTICHE L’Analisi delle Distribuzioni Statistiche consiste nell’elaborazione matematica dei dati statistici. Lo scopo è quello di ricavare tutte le informazioni sintetiche più importanti che riguardano i dati raccolti. Indici di Posizione: Medie Algebriche Def. Media secondo Chisini Dato un insieme di dati statistici x1,…,xn, ed una funzione obiettivo f (x1,..,xn) , si chiama valore medio M qualunque valore tale che f (x1,..,xn) =f (M,…M) Oss. Sostituendo a ciascun dato statistico il valore M abbiamo che il valore assunto dalla funzione obiettivo non cambia, resta cioè invariato Consideriamo nelle seguenti definizioni un insieme statistico di dati nella forma x1,…,xn Proprietà Generali della Media Conservazione unità di misura : stessa u.d.m. del dato statistico Monotonia: se due distribuzioni sono una minore dell’altra termine a termine allora le medie devono stare nello stesso ordine Consistenza : se una distribuzione è fatta da termini costanti allora la media deve essere uguale a tale costante Internalità: la media deve essere compresa tra il minimo ed il massimo

Indici di Posizione: Medie Aritmetiche Def. Media Aritmetica Semplice Funzione obiettivo: Def. Media Aritmetica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

Indici di Posizione: Medie Aritmetiche Def. Scarti dalla Media Oss. Possono essere positivi, nulli, negativi Teo. La somma degli scarti dalla media è sempre nulla Dim.(*) Teo. La somma degli scarti dalla media al quadrato è minima (rispetto alla media) Dim.(*) Sia M la media aritmetica ed M’ un altro valore diverso da M. Allora definiti: Dobbiamo mostrare che: (*) Come esercizio mostrare la validità dei teoremi per le medie aritmetiche pesate

Indici di Posizione: Medie Aritmetiche Dim. (cont.) Sia d=M-M’, da cui Essendo c.v.d. Calcolo della media aritmetica (ponderata) nel caso di una distribuzione per classe (variabili continue) Classi di età Numero persone 20-25 10 25-30 15 30-35 20 35-40 11 40-45 3 45-50 1 totale 60 Basta considerare per ciascuna classe il termine centrale

Indici di Posizione: Medie Aritmetiche Classi di età Numero persone 20-25 10 25-30 15 30-35 20 35-40 11 40-45 3 45-50 1 totale 60 Classi di età Valore Centrale(x_i) Frequenze (f_i) x_i*f_i Pesi (p_i) x_i*p_i 20-25 22,5 10 225 0,1667 3,75 25-30 27,5 15 412,5 0,2500 6,875 30-35 32,5 20 650 0,3333 10,833 35-40 37,5 11 0,1833 40-45 42,5 3 127,5 0,0500 2,125 45-50 47,5 1 0,0167 0,7917 somma   60 1875 31,25 Media

Trasformazione di Variabili Statistiche Sia data la variabile statistica X da essa è possibile creare, mediante operazioni algebriche, le seguenti variabili statistiche: X+k aX aX+k Xn Es. (Excel)

Trasformazione di Variabili Statistiche e Media Aritmetica Per quanto detto sinora, se consideriamo lo scarto come variabile statistica S= X-M abbiamo da quanto precedentemente enunciato che la media aritmetica degli scarti è zero. Indichiamo questo fatto con: m(S)=0. In generale allora m(X) sarà il valor medio della variabile statistica X. Se abbiamo una costante sarà m(k)=k. Il fatto che m(S)=0 può essere visto come m(X-M)=0, la qual cosa lascia intuire la possibilità di un comportamento “lineare” del valor medio aritmetico: m(X-M)=m(X)-m(M)=M-M=0 Proprietà della Media Aritmetica E quindi:

Trasformazione di Variabili Statistiche e Media Aritmetica Proprietà della Media Aritmetica Dim. con Proprietà della Media Aritmetica Dim. Def. Momenti ( di una variabile statistica) Momento di ordine k:

Momenti di una variabile statistica Oss. Indichiamo i momenti di ordine k con mk Il momento di ordine 1, m1 è la media aritmetica. Importanti sono il momento di ordine 2 e 3 , m2 ed m3 In particolare si ha sempre: m2- (m1)2≥0 Es. (excel- 02a) x_i f_i x_i*f_i x_i^2 f_i*x_i^2 x_i^3 f_i*x_i^3 1 3 2 4 8 16 32 9 27 81 5 20 80 64 320 25 125 625 totali 65 55 251 225 1061 m_1 3,25   m_2 12,55 m_2-(m_1)^2 1,988 m_3 53,05

Indici di Posizione: Medie Geometriche Def. Media Geometrica Semplice Funzione obiettivo: Def. Media Geometrica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

Indici di Posizione: Medie Quadratiche Def. Media Quadratica Semplice Funzione obiettivo: Def. Media Quadratica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

Indici di Posizione: Medie Armonica Def. Media Armonica Semplice Funzione obiettivo: Def. Media Armonica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

Indici di Posizione: Medie di Potenza k Def. Media di Potenza k Semplice Funzione obiettivo: Def. Media di Potenza k Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

Medie Algebriche Oss. M1  media aritmetica M2  media quadratica M3  media cubica M-1  media armonica Si dimostra che; Per le medie algebriche abbiamo la seguente relazione: Es. Excel (02-a)

Teoremi sulla Medie Teo Dim.

Teoremi sulla Medie Teo Dim. poiché

Teoremi sulla Medie Teo Dim. Oss

Teoremi sulla Medie Teo Dim. Oss

Medie: andamento Grafico

Indici di Posizione: Moda Def. Si chiama Moda o Valore Modale di una distribuzione il valore a cui corrisponde la massima frequenza. Se tale valore non è unico si parla di distribuzione plurimodale. Distribuzione in classi: Se tutte le classi hanno la stessa ampiezza si parla di classe (o classi) modale. Se le classi hanno ampiezze diverse ( si deve dividere la frequenza per l’ampiezza della classe) per cui la classe ( o le classi) modale è quella a cui corrisponde il maggior rapporto frequenza/ampiezza. Classi Freq Ampiezza Freq/ampiezza 0-100 5000 100 50 100-200 6500 65 200-400 12300 200 61,5 400-600 14200 71 600-1000 18400 400 46 classe Modale 400-600

Indici di Posizione: Mediana Def. Si chiama Mediana il termine che occupa il posto centrale nella distribuzione quando i dati sono disposti in ordine crescente. Se non esiste il termine centrale perché i dati sono in numero pari, si prende la media aritmetica dei due centrali. Es. 3,6,8,15,21  mediana 8 Es. 2,7,21,32,45,48  mediana (21+32)/2 = 26.5 Se le distribuzioni sono ponderate, si utilizzano le frequenza cumulate. Si guarda il termine la cui frequenza cumulata supera la semisomma delle frequenze. Ad esso corrisponde la mediana. Termini Freq Freq. Cum. 20 12 21 32 22 18 50 23 7 57 26 2 59 30 1 60 totale Mediana

Indici di Posizione: Mediana Se le distribuzioni sono per classi (supponendo tutte le classi con la medesima ampiezza, in caso contrario si considerano i rapporti frequenza/ampiezza al posto della sola frequenza) si individua la classe mediana mediante le frequenze cumulate e poi mediante una proporzione si stabilisce qual’è il termine mediano. Classi Freq. Freq. Cumulate 20-30 60 30-40 92 152 40-50 114 266 50-60 86 352 60-70 40 392 70-80 8 400 La classe mediana è 40-50. Il termine mediano sarà 40+x, dove x soddisfa alla proporzione: x:10=(200-152):114 10= ampiezza classe 200= ½ somma freq. 152= freq. cumulata classe precedente 114= freq. classe mediana Ne consegue x=4,21 e quindi mediana = 44,21. Proprietà Mediana La somma dei valori assoluti degli scarti dalla mediana è minima

Indici di Posizione: Mediana In generale vale la formula: Con: l1 = limite inferiore della classe mediana N = frequenza cumulata complessiva F = frequenza cumulata fino alla classe mediana f = frequenza (non cumulata) della classe mediana a = ampiezza della classe mediana

Dipendenza Indici Statistici dalla modalità di presentazione dei dati I raggruppamenti dei dati in classi comportano una perdita di informazione e quindi uno spostamento degli indici di posizione: Es: x_i f_i 1 1-11 5 3   4 media= 6 11

Indici di Posizione: Quartili e Percentili I quartili ,data una serie di dati statistici ordinati, sono quattro e dividono i dati esattamente in quattro parti egualmente numerose. Indicati con Q1 , Q2, Q3, Q4 Q1 é il valore per cui ¼ dei dati (25%) sono inferiori a Q1 Q2 é il valore per cui ½ dei dati (50%) sono inferiori a Q2 (coincide con la mediana) Q3 é il valore per cui ¾ dei dati (75%) sono inferiori a Q3 Q4 coincide con xn Il concetto di percentile generalizza quello di mediana :  se p è un numero tra 0 e 100, il percentile di ordine p (o p-esimo percentile, se p è intero) è il dato che delimita il primo p% dei dati (ordinati) dai rimanenti dati. Il 25-esimo percentile coincide con il primo quartile Il 50-esimo percentile coincide con il secondo quartile (e quindi con la mediana) Il 75-esimo percentile coincide con il terzo quartile Il 100-esimo percentile coincide con il quarto quartile (e quindi con xn ) Nota: nel caso di distribuzioni con classi si procede come per la determinazione della mediana, mediante l’utilizzo di proporzioni.

Indici di Posizione: Quantili In generale si chiamano quantile di ordine α un valore xα della distribuzione statistica tale i valori minori di xα siano almeno α [o (α*100)% ] e quelli alla destra almeno (1- α) [o (1- α)*100%]. La mediana coincide con il quantile di ordine ½ Il primo quartile con il quantile di ordine ¼ Il 30-esimo percentile con il quantile di ordine 0.3. Quindi: PERCENTILI = QUANTILI*100 DECILI = QUANTILI con α=0.1 CENTILI = QUANTILI con α=0.01 QUARTILI = QUANTILI con α=0.25