Elementi di statistica descrittiva Prof.ssa Nadia Andreuzzi

Slides:



Advertisements
Presentazioni simili
LA MEDIA STATISTICA di Zappa Giacomo.
Advertisements

- le Medie la Moda la Mediana
Che cosa vuol dire Statistica?
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
____________________
Le rappresentazioni grafiche
STATISTICA DESCRITTIVA
La divulgazione della statistica
STATISTICA descrittiva
LA STATISTICA By prof. Pietro Rossi.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Popolazione, campione, parametri e stimatori
Statistica descrittiva
STATISTICA DESCRITTIVA
COSA VUOL DIRE FARE STATISTICA
La statistica Elementi di statistica descrittiva
Progetto di statistica “SIAMO TUTTI STATISTICI”
Progetto PON SIAMO TUTTI STATISTICI
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Rappresentazione dei dati statistici
Misurazione Le osservazioni si esprimono in forma di misurazioni
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Elementi di STATISTICA DESCRITTIVA
Cai Lin Lin Michela & Guidetti Emanuela presentano:
DATI E PREVISIONI Marzo 2011.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Di Capuano,Colucci e Panunzi Valori medi I valori medi.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
I principali tipi di grafici
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simone Mosca & Daniele Zucchini 4Bi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
STATISTICA La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di un "collettivo". Studia i modi (descritti attraverso formule.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
La statistica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
Accenni di analisi monovariata e bivariata
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Martina Serafini Martina Prandi
ORIENTAMENTO CONSAPEVOLE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Potenziamento di matematica Scoperta di un nuovo mondo.
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
Accenni di analisi monovariata e bivariata
Il diagramma cartesiano
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
analisi bidimensionale #2
1 STATISTICA. 2 Perché la Statistica Nei fenomeni collettivi, cioè in quei fenomeni, in senso generale, in cui gli elementi coinvolti sono molti, non.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Statistica sociale Modulo A A.A Prof.ssa Barbara Baldazzi Dottore Mario Mastrangelo Facoltà di Lettere e Filosofia Università di Tor Vergata.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
RAPPRESENTAZIONE DATI LA RAPPRESENTAZIONE PUÒ ESSERE UTILIZZATA A SCOPO DI ANALISI, INTERPRETAZIONI E COMUNICAZIONI. PER RAGGIUNGERE QUESTI OBIETTIVI È.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
DEFINIZIONE. La statistica è la disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del.
Gli Indici di VARIABILITA’
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Transcript della presentazione:

Elementi di statistica descrittiva Prof.ssa Nadia Andreuzzi La statistica Elementi di statistica descrittiva Prof.ssa Nadia Andreuzzi

Sai ched'è la statistica Sai ched'è la statistica? È na' cosa che serve pe fà un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che se spósa. Ma pè me la statistica curiosa è dove c'entra la percentuale, pè via che, lì,la media è sempre eguale puro co' la persona bisognosa. Me spiego: da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo all'anno: e, se nun entra nelle spese tue, t'entra ne la statistica lo stesso perch'è c'è un antro che ne magna due. Trilussa

STATISTICA Si definisce statistica la scienza cha ha per oggetto la raccolta, l’analisi e la descrizione di fenomeni collettivi. In generale si distingue tra: Statistica descrittiva Statistica induttiva o inferenza statistica

La statistica descrittiva ha lo scopo di raccogliere ed elaborare dati per descrivere fenomeni collettivi o di massa La statistica induttiva si occupa di stimare le caratteristiche di un fenomeno collettivo a partire dall’analisi delle caratteristiche di un campione.

Unità statistiche Definiamo unità statistica il più piccolo elemento su cui si operano le rilevazioni. A sua volta l’unità statistica può essere suddivisa in : Unità statistica semplice se corrisponde ad un solo elemento (persone, automobili etc.) Unità statistica composta se corrisponde ad un insieme di elementi (famiglie, categorie sociali etc.)

DATI E POPOLAZIONE Definiamo dato statistico il dato ottenuto da una rilevazione operata sulle unità statistiche. All’insieme sul quale viene svolta l’indagine si dà il nome di popolazione statistica . La popolazione statistica può essere un Universo statistico se costituita da tutti gli elementi oggetto di rilevazione Campione statistico se costituita da un certo numero di elementi estratti dalla popolazione.

Caratteri L’indagine statistica si indirizza su una o più caratteristiche comuni di una popolazione. Tali caratteristiche prendono il nome di caratteri statistici. Gli aspetti secondo i quali i caratteri si manifestano si chiamano modalità. Esse possono essere: Qualitative se sono espresse da attributi (colore dei capelli, marche etc.) Quantitative se sono espresse da numeri (altezze, reddito, pesi etc.)

FASI DELL’INDAGINE STATISTICA Pianificazione Raccolta dei dati Spoglio Rappresentazione Elaborazione Interpretazione

Sistemazione dei dati Tabella a semplice entrata: È costituita da due colonne: nella prima sono riportate le modalità del carattere qualitativo o le varie intensità del carattere quantitativo. Nella seconda colonna sono riportate le frequenze (ossia il numero di unità statistiche che possiedono quella modalità del carattere). Per esempio è una tabella a semplice entrata la seguente:

Indagine sul tipo di lettura preferita dagli alunni del Liceo Touschek” N.di giovani Narrativa 300 Fantascienza 175 Giallo 200 Storica 150 Scientifica totale 1000

Tabelle a doppia entrata: Le unità statistiche vengono classificate secondo due caratteri. Sulle righe si riportano le modalità di un carattere e sulle colonne le modalità dell’altro carattere. Nell’ultima colonna e nell’ultima riga si riportano i totali. Vediamo un esempio…..

Distribuzione di 100 abitazioni secondo il numero di vani e i componenti della famiglia N. vani Componenti famiglia Totali 1 2 3 4 5 6 10 15 23 12 8 36 20 totali 28 100

Frequenza assoluta, relativa e percentuale Frequenza assoluta è il numero di individui il cui carattere assume una determinata modalità Frequenza relativa è il rapporto tra la frequenza assoluta e la totalità della popolazione statistica su cui si sta svolgendo l’indagine. Pertanto è un numero positivo minore o uguale a uno. Frequenza percentuale è semplicemente la frequenza relativa moltiplicata per cento. Pertanto è un numero positivo minore o uguale a cento.

Indagine sul tipo di lettura preferita dagli alunni Liceo Touschek” Freq. Assolute Freq. relative Percentuali Narrativa 300 0,3 30% Fantascienza 175 0,175 17,5% Giallo 200 0,2 20% Storica 150 0,15 15% Scientifica totale 1000 1 100%

Rappresentazione grafica di un’indagine statistica Diagrammi cartesiani: si usano per rappresentare caratteri quantitativi:in ascissa si riportano i valori del carattere ed in ordinate le frequenze.

Istogrammi Si usano soprattutto nel caso di caratteri divisi in classi. L’asse del carattere viene suddiviso in intervalli adiacenti e su ogni intervallo si disegna un rettangolo la cui area è proporzionale alla frequenza assoluta o relativa. N.B. Con i dati divisi per classi la costruzione dell’istogramma deve tener conto anche dell’ampiezza della classe. Nell’esempio i rettangoli hanno tutti la stessa base e quindi sono le altezze ad essere proporzionali alle frequenze.

Diagrammi a torta Diagrammi a torta (o a settori circolari): si divide un cerchio in settori ciascuno dei quali ha un’area (ovvero l’angolo al centro) proporzionale alla frequenza corrispondente.

I valori di sintesi Spesso è utile descrivere una distribuzione di dati statistici mediante pochi valori sintetici che possono consentire di: Confrontare analisi effettuate in tempi e luoghi diversi Farci un’idea della variabilità dei dati. Per quanto riguarda il primo punto distinguiamo tra: Medie di calcolo : sono quelle che dipendono da tutti i valori della distribuzione e si ottengono mediante una formula (con la condizione di lasciare invariato un risultato operato sui dati) Medie di posizione: si ottengono considerando solo alcuni valori della distribuzione.

Media aritmetica semplice e ponderata La media aritmetica è quel valore che sostituito ai dati lascia invariata la loro somma. Se i dati sono singoli si parla di media aritmetica semplice:

Esempio Se i tuoi voti sono: 5,7,8,3,5,6,7,7,7,5 Allora n=10

media aritmetica ponderata: Se ad ogni valore è associata una frequenza allora si parla di : media aritmetica ponderata: Dove pi sono le frequenze associate al dato i-mo

Esempio di calcolo di una media aritmetica ponderata: Dato Frequenza Dato x freq. X p Xp 3 2 6 4 16 5 25 7 21 8 40 10 1 totali 20 118 M=118/20= 5,9

Calcolo di una media aritmetica con dati divisi per classi Classe Valore Frequenza Dato x freq. da a centrale p Xp 5 2,5 2 10 7,5 4 30 15 12,5 62,5 20 17,5 3 52,5 25 125 50 40 1   totali 315 M=315/20= 15,75

Medie di posizione Mediana. Se i dati sono ordinati in senso non decrescente la mediana è il valore centrale ossia il valore che supera la prima metà dei valori ed è superato dall’altra metà. Moda E’ il valore al quale corrisponde la frequenza più alta. ….non ci addentriamo oltre nel calcolo delle medie di posizione

Indici di variabilità I valori medi non sono sufficienti a darci un’idea della distribuzione dei dati attorno al valore medio. Distribuzioni diverse possono avere la stessa media ma dati molto diversi tra di loro e diversi dal valore medio. Per quantificare la variabilità di una distribuzione si utilizzano alcuni indici di variabilità. Ne vedremo solo alcuni….

Intervallo di variazione Non è altro che la differenza tra il valore massimo ed il valore minimo della distribuzione. Per esempio nella tabella riportata a lato l’intervallo di variazione è pari a (10-3)=7 Dato X 3 4 5 7 8 10

Varianza a scarto quadratico medio Se definiamo scarto di un valore dalla media aritmetica la differenza di quel valore dalla media stessa, allora La Varianza è il valore medio degli scarti al quadrato Lo Scarto quadratico medio è la radice quadrata della varianza ….Vedremo nelle prossime diapositive due esempi di calcolo della varianza e dello s.q.m.

Calcolo della varianza e dello scarto quadratico medio nel caso di dati singoli   Voti Scarti Scarti ^2 5 -1 1 7 8 2 4 3 -3 9 -2 6 somma 42 28 media=42/7= Varianza=28/7= S.q.m.= radq(4)=

Calcolo della varianza e dello scarto quadratico medio nel caso di dati con frequenze diverse Dato Frequenza Dato x freq. Scarti Scarti x p Scarti^2 Scarti^2 x p X p Xp v vp v^2 v^2p 3 2 6 -2,9 -5,8 8,41 16,82 4 16 -1,9 -7,6 3,61 14,44 5 25 -0,9 -4,5 0,81 4,05 7 21 1,1 3,3 1,21 3,63 8 40 2,1 10,5 4,41 22,05 10 1 4,1 16,81 totali 20 118 1,6 35,26 77,80 M=118/20= 5.9 Varianza = 77.80/20= 3.89 S.q.m.= radq(3.89)=1.97

Correlazione tra variabili Esiste correlazione tra le variabili? Finora abbiamo considerato una variabile alla volta, ora tratteremo analisi di tipo comparativo: Osservo una variabile su più gruppi di individui Osservo più variabili su un gruppo di individui Entrambe le situazioni a. e b. Esiste correlazione tra le variabili? Scatterplot, diagramma a dispersione

Indici di variazione bidimensionali Date n osservazioni congiunte di 2 variabili Covarianza campionaria Se cx,y>0 a valori grandi (piccoli) di x corrispondono valori grandi (piccoli) di y x e y sono direttamente correlate Se cx,y<0 a valori grandi (piccoli) di x corrispondono valori piccoli (grandi) di y x e y sono inversamente correlate Se cx,y=0 le variabili non sono correlate

Indici di variazione bidimensionali Indice di correlazione Date n osservazioni congiunte di 2 variabili In particolare, dove il segno di r =segno di a

Diagramma di dispersione e indice di correlazione y x r = 0.6 y x y r = -0.8 y x r = -1 x r = 0 x v y r = 0 y x

Regressione lineare: retta di regressione Si vuole cercare la relazione lineare tra due variabili x e y. Date n osservazioni congiunte di 2 variabili cerco due coefficienti a e b tali che y=ax+b passi il più possibile vicino a questi punti. Cerco a e b tali che sia minima (Metodo dei minimi quadrati)

Retta di regressione N.B. Il coefficiente angolare della retta ha il segno di cx,y Utilizzando le informazioni ottenute tramite lo scatterplot e il coefficiente di correlazione, parto dal presupposto che ci sia relazione lineare tra x e y Valori stimati: Residui: Utilizzando la retta di regressione posso fare delle previsioni

EXCEL: Retta di regressione Esercizio: Stabilire se c’e’ dipendenza lineare tra l’umidita’ del magazzino e l’evaporazione di un certo componente chimico. Step1: Scatterplot Step2: Coefficiente di correlazione Utilizzando la funzione =CORRELAZIONE(dati_1;dati_2) ottengo r = - 0.84695 Ha senso determinare la retta di regressione

EXCEL: Retta di regressione Step3: Retta di regressione Avendo gia’ lo scatterplot seleziono: Grafico-Aggiungi linea di tendenza y = -0,0801x + 13,639

Buon lavoro da parte della vostra prof. !!!