Statistica Descrittiva e Statistica Inferenziale insieme dei metodi che concernono la raccolta, la presentazione, la definizione di un insieme di dati relativi ad una popolazione allo scopo di descriverne le caratteristiche in maniera adeguata STATISTICA INFERENZIALE insieme dei metodi che consentono, basandosi soltanto sulle valutazioni fatte sul campione, di stimare i parametri di uno o più caratteri di una popolazione
Inferenza Statistica Nell’Inferenza Statistica sono quattro le componenti teoriche: la teoria dei campioni la teoria della probabilità la teoria della stima dei parametri la teoria della verifica delle ipotesi
Popolazione e Campione La rilevazione della variabile “grado di istruzione” su tutti i componenti della popolazione italiana residente sul territorio nazionale nell’anno 2001, comporta un‘indagine estesa a tutte le unità che compongono la popolazione oggetto di studio. Questa è una rilevazione indicata con il termine CENSIMENTO ed è un tipico esempio di indagine sull’intera popolazione Spesso non è possibile rilevare i dati relativi alle variabili in esame su tutte le unità statistiche (popolazione di riferimento) che compongono un’ampia collettività limitarsi a rilevazioni su un numero ridotto di individui o di entità (CAMPIONE)
Popolazione e campione Le informazioni sulle variabili esaminate in un campione estratto da una popolazione rappresentano la base per valutare le corrispondenti variabili nella popolazione Le teorie probabilistiche rappresentano l’anello di congiunzione per determinare la probabilità che i dati provenienti dal campione riflettano “con ragionevole certezza”i risultati ottenibili dall’intera popolazione
Definizioni Popolazione: composta da entità (animali, vegetali, uomini, cose etc.) che presentano caratteri comuni Campione: parte o frazione di una popolazione il campione, per rappresentare la popolazione dalla quale è tratto deve essere il più possibile rappresentativo e deve essere probabilistico
Campionamento non probabilistico e probabilistico Prescinde da criteri di casualità nella scelta delle unità campionarie Es: Campionamento a scelta ragionata: sono selezionate quelle unità statistiche che a giudizio del ricercatore meglio rappresentano il fenomeno in esame svantaggi: mancanza di accuratezza dovuta alla selezione distorta e quindi impossibilità di generalizzare i risultati vantaggi: comodità, velocità di estrazione, costi bassi Campionamento probabilistico Ogni entità di cui è composta la popolazione di studio ha una probabilità nota di essere incluso nel campione Il campionamento probabilistico garantisce la rappresentatività della popolazione, mentre le valutazioni dai campioni non probabilistici non sono generalizzabili ai parametri della popolazione
Metodi di campionamento campionamento non probabilistico campionamento probabilistico campionamento casuale semplice campionamento stratificato campionamento sistematico campionamento a grappoli
Campionamento Casuale Semplice (CCS)senza ripetizione Le unità vengono estratte ad una ad una ed ogni singola unità estratta è rimossa dalla popolazione in esame. Si attribuisce quindi, di volta in volta, una probabilità proporzionale al numero di unità rimaste. La selezione si effettua fino al raggiungimento della numerosità campionaria prefissata.
CCS con ripetizione Ad ogni estrazione, l’unità estratta viene di nuovo inserita nell’urna. La struttura della popolazione resta così inalterata ed ogni unità mantiene la stessa probabilità di essere estratta
Campionamento Sistematico Se gli elementi N di una popolazione, sono compresi in un’unica lista numerata e si può ritenere che siano elencati in maniera casuale, supponiamo di volerne estrarre un campione di numerosità n Le unità della popolazione sono considerate in sequenza Viene determinato il passo di campionamento: k = N / n Con campionamento casuale semplice si identifica la prima unità da selezionare tra le prime K e poi si selezionano le unità successive in base al passo di campionamento
Campionamento Sistematico data N =1000 stabilita n =100 Il passo di campionamento k K= 1000 / 100 = 10 Quindi, tra i primi 10 elementi della popolazione, sarà stato estratto in modo casuale il primo elemento del campione poi, scartando i 10 elementi successivi, selezioneremo il secondo e così via
Altri Metodi il campionamento stratificato il campionamento a grappoli La scelta tra i metodi finora descritti presenta inconvenienti quando l’indagine da intraprendere prevede una vasta mole di dati in questa circostanza è opportuno utilizzare altri metodi di campionamento, quali : il campionamento stratificato il campionamento a grappoli
Campionamento stratificato popolazione molto ampia (la scelta casuale semplice potrebbe non rispettare le densità dei residenti delle zone) Occorre creare delle subpopolazioni (strati) omogenee della popolazione stratificazione della popolazione, suddividendola in tanti sottoinsiemi, ognuno dei quali è omogeneo per i fattori da considerare. Il campione stratificato viene poi costituito riproducendo la struttura della popolazione e la casualità è rispettata, in quanto, nell’ambito di ciascuno strato, la selezione avviene utilizzando il metodo del CCS
Campione stratificato Dopo avere diviso i componenti della popolazione in strati, sulla base della caratteristica comune prescelta, sarà poi estratto un campione casuale semplice da ogni strato, in maniera indipendente, e saranno riuniti insieme i risultati dei singoli campionamenti per formare un unico campione dell’ampiezza stabilita. Se la numerosità della popolazione di uno strato è troppo piccola, rispetto a quella degli altri strati, invece dal campionamento stratificato uniforme si ricorre al campionamento stratificato proporzionale
Campionamento Stratificato Proporzionale Per un sondaggio di opinione tra gli studenti di una università, è necessario estrarre un campione tale da garantire a tutte le Facoltà di essere rappresentate in relazione al numero di iscritti. Supponiamo che in una Università gli studenti iscritti siano 10.000 Lettere ha 2.000 studenti, Ingegneria 1.500, Matematica 1.000, Medicina 3.000, Economia 2.500 La numerosità campionaria calcolata n=1200. Ogni Facoltà rappresenta uno strato, occorre dunque estrarre da ciascuno strato un numero di studenti proporzionale al numero degli studenti iscritti in ciascuna Facoltà es. Lettere x : 2000 = 1200 : 10000 x = 2000 *1200/10000 = 240 Ingegneria x : 1500 = 1200 : 10000 x = 1500 *1200/10000 = 180 Matematica x : 1000 = 1200 : 10000 x = 1000 *1200/10000 = 120 Medicina x : 3000 = 1200 : 10000 x = 3000 *1200/10000 = 360 Economia x : 2500 = 1200 : 10000 x = 2500 *1200/10000 = 300 Totale 1.200
Campione stratificato “stratificare” una popolazione significa ripartirla in sottopopolazioni sulla base di una caratteristica comune dette “strati”. VANTAGGI: 1) massimo controllo sulla selezione, pur mantenendola casuale 2) individuare sottopopolazioni il più possibile omogenee, rispetto a variabili oggetto di indagine, al fine di aumentare precisione nelle stime
Campionamento a grappoli Questo metodo si applica in una popolazione le cui unità sono raggruppate in sottoinsiemi di unità il più possibile eterogenei al loro interno, dette grappoli (ogni grappolo deve essere una miniatura della popolazione finita presa in esame) I grappoli possono essere definiti sulla base di raggruppamenti naturali, come: regioni, città, circoscrizioni elettorali, edifici, etc. Campionamento casuale a grappoli è un metodo che consiste nell’estrarre, senza ripetizione e contemporaneamente, un certo numero di grappoli e nel prendere come unità campionarie tutti gli elementi appartenenti ai grappoli estratti
Campionamento a grappoli- esempio Indagine di mercato sulle abitudini dei consumatori di una certa regione: se volessimo sapere quale marca di acqua minerale preferiscono gli abitanti della Toscana, potremmo definire come grappolo l’insieme di individui di uno stesso comune Il campionamento sarà poi realizzato estraendo casualmente un numero prefissato di comuni, e considerando appartenenti al campione tutti gli abitanti dei comuni estratti