La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Introduzione alla statistica

Presentazioni simili


Presentazione sul tema: "Introduzione alla statistica"— Transcript della presentazione:

1 Introduzione alla statistica
Sai ched’è la statistica? E ‘na cosa che serve pe’ fa’ un conto in generale De la gente che nasce, che sta male, che more, che va in carcere e che sposa Ma pe’ me la statistica curiosa È dove c’entra la percentuale pe’ via che, lì, la media è sempre uguale puro co’ la persona bisognosa Me spiego. Da li conti che se fanno secondo le statistiche d’adesso risurta che te tocca un pollo all’anno: e, se nun entra ne le spese tue, t’entra nella statistica lo stesso perché c’è un antro che ne magna due Carlo Alberto Salustri detto TRILUSSA ( )

2 Introduzione alla statistica
La STATISTICA è una “tecnica che ha per scopo la conoscenza quantitativa dei fenomeni collettivi”. La parola STATISTICA deriva da Stato. Lo Stato fu il primo a raccogliere dati ed informazioni circa i “fatti che lo riguardavano” per i più disparati motivi: Religiosi; Militari; Sociali; Sanitari.

3 Introduzione alla statistica
Lo studio dei fenomeni collettivi è possibile attraverso l’osservazione della collettività intera di individui, ossia della popolazione. POPOLAZIONE→STATISTICA DESCRITTIVA Tra gli esempi più noti di raccolta delle informazioni su tutta la collettività si ricorda il Censimento della Popolazione e delle Abitazioni, il Censimento dell’Agricoltura e il Censimento dell’Industria e dei Servizi.

4 Introduzione alla statistica
…ma tale studio dei fenomeni collettivi si può effettuare anche osservando solo una parte della collettività ossia un campione. CAMPIONE → STATISTICA INFERENZIALE Tra gli esempi più noti di raccolta delle informazioni su parte della collettività (campione) si ricordano le indagini campionarie condotte dall’Istat (ad esempio, Forze di lavoro, Indici dei prezzi).

5 Introduzione alla statistica
Altri esempi di indagini campionarie Exit polls Un Exit polls è un sondaggio dove gli elettori sono intervistati immediatamente all’uscita del seggio elettorale. Diversamente dal sondaggio d'opinione che chiede all'elettore per chi intenda votare, con un exit poll si chiede all'elettore per chi ha votato realmente. Tali sondaggi vengono effettuati per ottenere una prima indicazione su come hanno votato gli elettori. PROBLEMA Gli intervistati possono anche non dire la verità.

6 Introduzione alla statistica
Proiezioni Una proiezione elettorale consiste nella previsione statistica dei risultati complessivi di un'elezione a partire dai risultati ottenuti in un insieme ridotto di seggi significativi. A differenza dei sondaggi e degli exit poll, una proiezione elettorale si basa su voti effettivamente dati dagli elettori; anch'essa, però, soffre degli stessi problemi statistici riguardo alla scelta di un campione rappresentativo dell'elettorato.

7 Introduzione alla statistica
Perché campionare? risorse limitate: quando si compie una indagine vi sono problemi di costo; informazioni disponibili in tempi più rapidi: una indagine campionaria fornisce informazioni in tempi minori rispetto ad una indagine censuaria; la prova è distruttiva: ad esempio vogliamo calcolare la vita media di 1000 lampadine.

8 Introduzione alla statistica
Le rilevazioni statistiche Si perviene alla conoscenza dei fenomeni collettivi mediante le Rilevazioni o Indagini Statistiche. Le Rilevazioni o Indagini Statistiche sono definite come il complesso delle operazioni che hanno lo scopo di acquisire informazioni, come risposte e misurazioni, su un insieme di elementi, oggetto di studio.

9 Introduzione alla statistica

10 Introduzione alla statistica
FASI DI UNA INDAGINE STATISTICA Definizione degli obiettivi della ricerca Gli obiettivi dell’indagine statistica devono essere chiari e particolareggiati. La rilevazione dei dati L’indagine statistica può essere di tipo “completo” (censimento) o di tipo “parziale” (indagine campionaria). Quanti dati raccogliere nella rilevazione? Né troppi, né pochi. Dipende dall’obiettivo dell’indagine. Vi sono vincoli di costi e di efficienza del campione.

11 Introduzione alla statistica
FASI DI UNA INDAGINE STATISTICA Elaborazione dei dati I dati raccolti devono essere elaborati secondo metodi dell’analisi statistica seguendo la metodologia più idonea. Presentazione dei risultati La presentazione dei risultati deve essere curata e adeguata per poter prendere decisioni efficaci e tempestive.

12 Introduzione alla statistica
FASI DI UNA INDAGINE STATISTICA Utilizzazione dei risultati della ricerca I risultati dell’indagine devono essere utilizzati in conformità agli obiettivi che si erano prefissati all’inizio. Lo statistico deve vigilare affinché non avvengano usi impropri dei risultati.

13 Alcune definizioni La Popolazione o il Campione (a seconda che l’indagine sia totale o parziale) è un insieme di elementi reale o virtuale che costituisce l’oggetto di investigazione statistica. Esempi di popolazione reale sono: Residenti di una certa regione; Studenti iscritti all’Università “G. d’Annunzio”

14 Alcune definizioni Esempi di popolazione virtuale sono:
Possibili cinquine su una ruota del lotto; Possibili risultati in una schedina del totocalcio.

15 Alcune definizioni L’unità statistica è l’elemento di osservazione di base della popolazione oggetto di indagine statistica L’unità di rilevazione è l’elemento di osservazione di base oggetto della rilevazione e spesso non coincide con l’unità statistica.

16 Alcune definizioni Un esempio di indagine statistica:
Il Censimento della popolazione e delle abitazioni (Istat) La popolazione (trattandosi di rilevazione totale) è costituita da tutti i soggetti presenti ad una certa data sul territorio nazionale. L’unità statistica, elemento di base di investigazione, è l’individuo. L’unità di rilevazione, alla quale viene somministrato il questionario, è la famiglia. Come si può osservare l’unità statistica e l’unità di rilevazione non coincidono.

17 Alcune definizioni Stili di vita e condizioni di salute (Istat)
Un esempio di indagine statistica: Stili di vita e condizioni di salute (Istat) Il Campione: famiglie per individui. L’unità statistica (elemento di base di investigazione) è l’individuo. L’unità di rilevazione è la famiglia. Unità statistica  unità di rilevazione

18 Alcune definizioni Il carattere è la caratteristica oggetto di studio rilevata e/o misurata sulle unità statistiche. Il carattere può essere di tipo qualitativo, ossia può rappresentare un attributo, una qualità non misurabile. Si parla in tal caso di “mutabile”. Esempio: il sesso rilevato su una unità statistica.

19 Alcune definizioni Il carattere può essere anche di tipo quantitativo, ossia può esprimere una misura, un’informazione quantitativa. Si parla in tal caso di “variabile”. Esempio: il peso rilevato su una unità statistica. La modalità è il modo di presentarsi del carattere nelle unità statistiche.

20 Alcune definizioni Nella popolazione studentesca dell’Università di Trento si può individuare lo studente Marco (unità statistica) sul quale sono stati rilevati i caratteri peso (carattere quantitativo) e squadra di calcio per cui tifa (carattere qualitativo). Marco pesa 85 Kg (modalità- numero) e tifa per la Lazio (modalità- attributo)

21 La classificazione dei caratteri
I caratteri qualitativi (attributi) sono divisi in: caratteri qualitativi sconnessi (non ordinabili, ad esempio: sesso, stato civile, squadra di calcio per cui si tifa); caratteri qualitativi ordinabili (ad esempio: livello nella professione, grado militare).

22 La classificazione dei caratteri
I caratteri quantitativi (misure) sono divisi in: caratteri quantitativi discreti, cioè in grado di assumere solo un numero discreto (finito o infinito) di modalità (ad esempio: numero di figli di una coppia, voto esame universitario); caratteri quantitativi continui, cioè in grado di assumere qualunque valore all’interno di un intervallo definito (ad esempio: peso, reddito).

23 La classificazione dei caratteri
Relazioni od operazioni fra modalità Qualitativo Quantitativo Sconnessi Ordinati = ≠ SI < > NO + -

24 Le distribuzioni statistiche
Il numero della volte che una data modalità si presenta nella nostra rilevazione prende il nome di frequenza. La frequenza è: assoluta, quando rappresenta il numero assoluto dei casi o presenze (si indica con ni); relativa, per indicare la frazione dei casi rispetto al totale (si indica con fi); percentuale, per indicare la frazione dei casi rispetto al totale supposto posto pari a 100 (si indica con pi).

25 Le distribuzioni statistiche
Le informazioni rilevate di un fenomeno possono essere sintetizzate tramite le distribuzioni. A seconda del numero di caratteri rilevati nel collettivo sotto investigazione si parla di: Distribuzione Semplice (un solo carattere); Distribuzione Doppia (due caratteri); Distribuzione Multipla di ordine m (m caratteri).

26 Le distribuzioni statistiche
rilevato il carattere Consideriamo la popolazione costituita da N unità statistiche sulla quale è stato .

27 Le distribuzioni statistiche
DEFINIZIONE: La successione X={x1,x2,…,xn} costituisce una distribuzione unitaria della popolazione P secondo il carattere X. La xi è la modalità con cui il carattere X si presenta nell’unità statistica ui. La distribuzione unitaria assegna, a ciascun soggetto la corrispondente modalità.

28 Unità Sesso Età Reddito Statura (cm) Colore degli occhi 1 Maschio 22 0,7 173 nero 2 Femmina 18 0,2 168 marrone 3 34 1,6 165 4 42 2,5 180 5 50 3,2 163 azzurro 6 12 0,1 160 7 46 3,8 177 8 72 1,3 164 verde 9 27 1,2 158 10 48 1,7 170 11 35 1,9 167 84 0,8 159 13 21 0,4 174 14 44 1,8 15 56 16 58 172 17 37 2,1 166 19 73 20 64 2,2 184

29 Le distribuzioni statistiche
Vi possono però essere più unità che assumono la stessa modalità … ...raggruppando fra loro gli elementi uguali si ottengono le distribuzioni di frequenza. I dati grezzi vanno organizzati in tabelle sintetiche per presentarli in maniera corretta, analizzarli, interpretarli.

30 Le distribuzioni statistiche
Le distribuzioni di frequenza… Carattere X ni (freq. Assolute) fi (freq. relative) pi (freq.percentuali) x1 n1 f1=n1/N p1=(n1/N)∙100 x2 n2 f2=n2/N p2=(n2/N)∙100 xi fi=ni/N pi=(ni/N)∙100 xk nk fk=nk/N pk=(nk/N)∙100

31 Le distribuzioni statistiche
ESEMPIO: Sono stati intervistati N =40 studenti che hanno avuto le seguenti votazioni all’esame di Statistica: La distribuzione unitaria può essere trasformata nella seguente distribuzione di frequenza:

32 Voti all'esame di statistica
X=voto ni fi pi 18 2 0,05 5% 19 20 21 3 0,08 8% 22 23 5 0,12 12% 24 4 0,10 10% 25 6 0,14 14% 26 27 28 29 0,00 0% 30 Totale 40 1,00 100%

33 Le distribuzioni statistiche
Distribuzioni per classe di valori Supponiamo ora che il carattere oggetto di studio sia quantitativo continuo, per cui può assumere un qualunque valore di un certo intervallo [a,b]. E’ pensabile suddividere detto intervallo in più sottointervalli (con uguale o diversa ampiezza) ed associare ogni unità al sottointervallo in cui ricade la modalità in essa rilevata. In tal caso si parlerà di distribuzione in classi.

34 Le distribuzioni statistiche
ESEMPIO : E’ stato rilevato su N =15 unità il peso in kg. Si sono ottenuti i seguenti risultati: , 67 66, Peso in kg Peso ni fi pi 62-64 3 0,20 20,00% 64-68 6 0,40 40,00% 68-73 5 0,33 33,33% 73-75 1 0,07 6,67% Totale 15 1,00 100%

35 Le distribuzioni statistiche
Distribuzioni cumulate Definiamo una distribuzione che fa corrispondere a ciascuna modalità xi la frequenza (assoluta, relativa o percentuale) di unità statistiche per cui il carattere assume un valore al più uguale a xi: X Ni Fi Pi x1 N1= n1 F1= f1 P1= p1 x2 N2 = n1+n2 F2 = f1 + f2 P2 = p1 + p2 xi Ni = n1+...+ni Fi =f fi Pi =p pi xk Nk =n1+..+nk =N Fk =f1+...+fk =1 Pk =p1 +..+pk =100

36 Le distribuzioni statistiche
ESEMPIO : Sia data una popolazione studentesca di N=1000 individui sui quali è stato rilevato il carattere titolo di studio. Titolo di studio di una popolazione studentesca ni Ni fi Fi pi Pi Lic. Elementare 170 0,17 17% Lic. Media Inferiore 200 370 0,20 0,37 20% 37% Lic. Media Superiore 280 650 0,28 0,65 28% 65% Laurea 350 1000 0,35 1,00 35% 100% Totale 1

37 Le rappresentazioni grafiche
Le rappresentazioni grafiche si basano essenzialmente su una proporzionalità tra le frequenze e le grandezze geometriche (aree o lunghezze) che vengono utilizzate per rappresentare il fenomeno.

38 Le rappresentazioni grafiche
Non esistono regole fisse per la costruzione e per la scelta del grafico ma si possono dare semplici consigli, affinché la rappresentazione sia la più chiara ed intuitiva possibile. E’ buona regola che un grafico contenga: Titolo con l’esatto contenuto del grafico Assi con l’indicazione dei caratteri riportati in essi Legenda per la comprensione del grafico Unità di misura in cui sono espressi i caratteri Fonte dei dati

39 Le rappresentazioni grafiche
Grafici per caratteri qualitativi Diagramma a settori circolari o a torta: a ciascuna modalità del carattere si associa un settore circolare avente area proporzionale alle frequenze; Diagramma a barre: a ciascuna modalità del carattere si associa un rettangolo avente base costante ed altezza proporzionale alle frequenze;

40 Le rappresentazioni grafiche
Grafici per caratteri qualitativi Diagrammi figurativi: si utilizzano le figure per rappresentare le modalità di una distribuzione e la dimensione della figura è proporzionale alle frequenze.

41 Le rappresentazioni grafiche
Unità Sesso Colore occhi 1 M Neri 2 F Marroni 3 4 5 Azzurri 6 Verdi 7 8 9 10 11 12 Alcuni esempi …. Si considerino le seguenti 12 unità sulle quali sono stati rilevati i caratteri sesso e colore degli occhi:

42 Le rappresentazioni grafiche
Sesso ni pi M 6 50% F Totale 12 100

43 Le rappresentazioni grafiche
Colore degli occhi ni pi Marroni 4 33,33% Neri 2 16,67% Verdi Azzurri Totale 12 100,00%

44 Le rappresentazioni grafiche

45 Le rappresentazioni grafiche
Consideriamo la seguente distribuzione dell’uso del suolo (APAT, 2003). Aree artificiali Aree agricole Arre boschive e seminaturali Altro ITALIA 1273 16174 12406 361

46 Le rappresentazioni grafiche
Riassumendo… Il diagramma a torte si ottiene dividendo l’angolo al centro di 360 gradi, in “fette” di dimensione proporzionale alla frequenza di ciascuna modalità. Nell’esempio, la modalità “aree agricole”, ha frequenza percentuale pari al 53,53%. La corrispondente fetta della torta è caratterizzata da un angolo x di:

47 Le rappresentazioni grafiche
La soluzione precedente, infatti, si ricava dalla seguente proporzione:

48 Le rappresentazioni grafiche
Rispetto al diagramma a torta, il diagramma a barre, apre lo spazio a maggiori possibilità di interpretazione di un fenomeno, non escludendo quelle di natura temporale. Ad esempio:

49 Le rappresentazioni grafiche
OSSERVAZIONE Occorre precisare come il diagramma a barre, pur contenendo in esso anche valutazioni temporali di un fenomeno, non è la rappresentazione specifica per le serie temporali.

50 Le rappresentazioni grafiche
Per caratteri quantitativi discreti Diagramma a segmenti o ad aste: è un grafico cartesiano in cui in corrispondenza di ciascuna modalità (un punto) si riporta un segmento avente altezza proporzionale alle frequenze. Un esempio... Consideriamo un collettivo di 32 studenti che hanno preso voti da 18 a 22 all’esame di statistica. Il relativo diagramma ad aste è il seguente:

51 Le rappresentazioni grafiche

52 Le rappresentazioni grafiche
Per caratteri quantitativi continui Istogramma di frequenza: è il grafico che fa corrispondere alle classi delle modalità nelle quali è suddiviso il carattere quantitativo (poste sulle ascisse) un rettangolo di area pari alla frequenza di quella classe. L’altezza del rettangolo è pari alla densità di frequenza: dove ni è la frequenza assoluta della classe e xi - xi-1 è l’ampiezza della classe.

53 Le rappresentazioni grafiche
Un esempio... Si consideri la distribuzione dei redditi (espressi in migliaia di euro) di 160 redditieri: Classi 50-60 60-70 70-80 80-90 90-100 Totale ni 10 12 18 46 50 24 160 hi 1,0 1,2 1,8 4,6 5,0 2,4

54 Le rappresentazioni grafiche

55 Le rappresentazioni grafiche
Un esempio... Si consideri la distribuzione dei bambini in età prescolare presso un pediatra di base Classi ni 0-1 10 1-6 20 Totale 30

56 Le rappresentazioni grafiche
È questa l’idonea rappresentazione grafica? 1 6 10 20 NO !!!

57 Le rappresentazioni grafiche
…oppure, visto che le classi sono di diversa ampiezza Classi ni xi–xi-1 hi 0-1 10 1 1-6 20 5 4 Totale 30 e considerando le densità

58 Le rappresentazioni grafiche
1 6 10 4 SI !!!!


Scaricare ppt "Introduzione alla statistica"

Presentazioni simili


Annunci Google