La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Statistica Aziendale L’informazione statistica per le decisioni aziendali 1. Informazione già esistente (dati secondari)  Statistiche ufficiali e non.

Presentazioni simili


Presentazione sul tema: "Statistica Aziendale L’informazione statistica per le decisioni aziendali 1. Informazione già esistente (dati secondari)  Statistiche ufficiali e non."— Transcript della presentazione:

1 Statistica Aziendale L’informazione statistica per le decisioni aziendali 1. Informazione già esistente (dati secondari)  Statistiche ufficiali e non 2. Informazione creata attraverso indagini ad hoc (dati primari)  Tecniche di campionamento 3. La matrice dei dati e le analisi preliminari  Indici di distanza tra unità (e di associazione tra variabili) Metodi statistici per l’analisi dei dati aziendali 4. Relazioni causali tra variabili  Regressione multivariata 5. Segmentazione per omogeneità delle unità  Metodi di analisi dei gruppi 6. Produttività ed efficienza aziendale  Numeri Indici

2 Le indagini campionarie
Le fasi di un’indagine campionaria Il campionamento: schemi e stima dei parametri Gli errori campionari e non campionari Tipologie di quesiti, scale di valutazione, classificazione dei caratteri statistici Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

3 Indagini censuarie e campionarie
Un’indagine conoscitiva può essere condotta secondo due approcci distinti: indagine totale o censuaria indagine parziale o campionaria Il collettivo di unità su cui deve essere effettuata l’indagine è esaminato in maniera completa È esaminata solo una parte del collettivo - un campione - anziché la sua totalità Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

4 Confronto tra indagine censuaria e indagine campionaria
Aspetti Indagine censuaria Indagine campionaria Risorse economiche Elevate Contenute Durata delle operazioni Lunga Breve Errore campionario Assente Presente Altri tipi di errore Presenti Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

5 Il campionamento - prime definizioni
Inferenza statistica: si desumono le caratteristiche di una popolazione attraverso lo studio di una parte di essa detta campione Popolazione o universo: un insieme di unità che soddisfano in maniera esaustiva uno o più criteri Indagine campionaria: metodologia per conoscere le caratteristiche della popolazione tramite un campione Il campionamento può essere: - probabilistico: scelta delle unità affidata al caso - non probabilistico: scelta delle unità dipendente dalla soggettività di chi raccoglie le informazioni Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

6 Confronto tra campionamento probabilistico e non probabilistico
Campionamento non probabilistico Risorse economiche Relativamente elevate Contenute Durata delle operazioni lunga Breve Errore campionario Valutabile Non valutabile Rappresentatività della popolazione Buona Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

7 Le fasi di un’indagine campionaria
1. Formulazione degli obiettivi dell’indagine - Si decide quali informazioni rilevare - informazioni prioritarie (relative agli obiettivi principali dell’indagine) - informazioni complementari (relative agli obiettivi secondari) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

8 Le fasi di un’indagine campionaria
2. Individuazione della popolazione obiettivo - E’ l’insieme delle unità sulle quali si intende ottenere le informazioni obiettivo dell’indagine - definito in base ad alcuni criteri (in particolare criteri spazio-temporali) - Lista di campionamento: elenco esaustivo delle unità appartenenti alla popolazione obiettivo Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

9 Le fasi di un’indagine campionaria
3. Individuazione tecnica di campionamento - Metodo di selezione del campione - prima distinzione: metodi probabilistici e non probabilistici - Scelta dipendente da: - livello di attendibilità desiderato - vincoli sui costi dell’indagine Diversi schemi di campionamento probabilistico e non probabilistico Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

10 Le fasi di un’indagine campionaria
4. Individuazione modalità di raccolta dati - Osservazione diretta (es.: rilevazione prezzi) - In genere intervista, con diverse modalità: - postale (con autocompilazione del questionario) - telefonica (compilazione assistita) - diretta o faccia a faccia (compilazione assistita) - via internet o (con autocompilazione) Scelta modalità: compromesso tra diversi obiettivi spesso contrastanti: partecipazione; qualità dei dati; costi Par. 2.4 per i dettagli sulle tecniche di rilevazione dei dati (vantaggi e svantaggi delle diverse tecniche) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

11 Le fasi di un’indagine campionaria
5. Progettazione del questionario - Strumento per la rilevazione dei dati - Caratteristiche (lunghezza, complessità dei quesiti, istruzioni) dipendenti dalla modalità di rilevazione: - con autocompilazione (breve e semplice; istruzioni per l’intervistato) - intervista telefonica (breve e semplice; istruzioni per l’intervistatore) - intervista diretta (anche più complesso) - Test (indagini pilota) e revisioni Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

12 Le fasi di un’indagine campionaria
6. Rilevazione dei dati - Determinazione del periodo più appropriato per la raccolta dei dati - Evitare i periodi non idonei - Concentrazione in un breve periodo 7. Codifica e archiviazione dei dati - Codifica numerica delle variabili qualitative (in particolare, in caso di domande a risposte aperte) - Inserimento delle informazioni in un supporto informatico Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

13 Le fasi di un’indagine campionaria
8. Analisi dei dati - Produzione delle stime campionarie dei valori ignoti relativi alla popolazione 9. Redazione di un rapporto di ricerca - Descrizione delle caratteristiche dell’indagine - Descrizione dei principali risultati ottenuti Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

14 Il processo di stima – concetti di base
Processo di stima: procedimento per ricavare, tramite una funzione delle osservazioni campionarie, il valore incognito di una caratteristica della popolazione Il parametro da stimare: la caratteristica della popolazione che costituisce l’obiettivo dell’indagine Lo stimatore: una formula analitica atta a stimare il valore incognito della caratteristica della popolazione sulla base dei dati campionari Il valore della stima o stima: il risultato dell’applicazione dello stimatore ai dati campionari Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

15 Il processo di stima – un esempio
Il parametro da stimare è la media aritmetica del fatturato delle aziende di un paese, le quali costituiscono la popolazione di riferimento (composta da N unità): Dalla popolazione si estrae un campione casuale di n unità sulle quali si rileva il fatturato. La stima del parametro della popolazione si ottiene applicando ai dati campionari lo stimatore media aritmetica: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

16 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il processo di stima Altri parametri da stimare (oltre la media): - Il totale: - La varianza: Stima del totale: ? No  Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

17 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il processo di stima Caso di variabile binaria o dicotomica Codifica: Y = 1 (presenza attributo); Y = 0 (assenza attributo) - Totale: - Frequenza (proporzione): Stima di una frequenza: Stima del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

18 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori Lo stimatore di un parametro θ della popolazione: una funzione dei dati campionari per assegnare un valore a θ sulla base del campione Stimatore corretto (o non distorto): se nell’insieme dei campioni casuali estraibili il valore medio delle stime è pari al valore del parametro nella popolazione: Altrimenti, stimatore non corretto Distorsione: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

19 Gli stimatori - Esempio
Campionamento casuale semplice senza ripetizione Popolazione di N = 4 unità; campioni di n = 2 unità Popolazione n. Y Possibili campioni Valori di y 110 120 80 90 (1; 2) (1; 3) (1; 4) (2; 3) (2; 4) (3; 4) 110; 120 110; 80 110; 90 120; 80 120; 90 80; 90 115 95 100 105 85 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

20 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori Uno stimatore corretto è sempre da preferire a uno distorto? No se è caratterizzato da una molto maggiore dispersione delle stime intorno al valore del parametro da stimare Errore statistico: differenza tra la stima e il parametro da stimare: Errore quadratico medio: valore medio, nell’insieme dei campioni estraibili, dell’errore statistico al quadrato Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

21 Gli stimatori - Esempio
Campionamento casuale semplice senza ripetizione Popolazione di N = 4 unità; campioni di n = 2 unità Popolazione n. Y Possibili campioni Errore statistico al quadrato 110 120 80 90 (1; 2) (1; 3) (1; 4) (2; 3) (2; 4) (3; 4) 115 95 100 105 85 15 -5 5 -15 225 25 MSE = 83.3 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

22 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori Stimatore più efficiente: dati due stimatori di uno stesso parametro si definisce stimatore più efficiente quello con minore MSE Scomposizione dell’errore quadratico medio: Se lo stimatore è corretto: Se lo stimatore è corretto, lo stimatore più efficiente è quello a varianza minima Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

23 Lo stimatore fondamentale nel campionamento probabilistico
Nel campionamento probabilistico la probabilità di inclusione nel campione è nota e diversa da zero per ogni unità della popolazione Probabilità di inclusione: probabilità che una unità appartenga al campione. Non necessariamente uguale per ogni unità Esempio: Campionamento casuale semplice senza ripetizione Popolazione di N = 4 unità: 1; 2; 3; 4 Insieme dei possibili campioni di n = 2 unità (1,2); (1,3); (1,4); (2,3); (2,4); (3,4) Probabilità di inclusione dell’unità 1: 3/6= ½ (= n/N) (idem per 2, 3, 4) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

24 Lo stimatore fondamentale
Stimatore corretto per il campionamento probabilistico senza ripetizione - Notazioni: Probabilità di inclusione: Coefficienti di espansione: Stimatore fondamentale (di Horvitz-Thompson) della media: e del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

25 Stimatore fondamentale - Esempio
Popolazione di N = 4 unità: Y1 = 110; Y2 = 120; Y3 = 80; Y4 = 90; Campione estratto di n = 2 unità: (1,3) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

26 Le tecniche di campionamento probabilistico
Principali tecniche di campionamento probabilistico: casuale semplice (CCS) sistematico (CSI) stratificato (CST) a grappoli (CGRA) a più stadi (CSTA) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

27 Il campionamento casuale semplice
Tecnica di campionamento più elementare tra i metodi probabilistici Rappresenta il naturale punto di partenza per lo studio di tutti gli altri metodi di campionamento La probabilità di inclusione nel campione è la stessa per ogni unità della popolazione - pari alla frazione di campionamento - data da: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

28 La tecnica di estrazione del CCS - illustrazione
Dato N=50, le unità della popolazione sono numerate da 1 a 50 Per estrarre un CCS di 10 unità (f = 1/5) si genera una sequenza di numeri casuali {3, 6, 11, 12, 25, 28, 31, 37, 44, 46} Le unità corrispondenti a tali numeri d’ordine costituiscono il campione Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

29 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Pro e contro del CCS La semplicità concettuale è il suo principale punto di forza Il CCS presenta tuttavia anche alcuni possibili svantaggi: Il campione potrebbe presentarsi sparso sul territorio con conseguenti costi elevati di organizzazione Poiché tutti i possibili campioni hanno uguale probabilità di essere estratti, è possibile estrarre un ‘‘cattivo’’ campione (poco rappresentativo della popolazione) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

30 Il campionamento sistematico
Tecnica alternativa assimilabile a quella per l’estrazione di un CCS Consiste nella selezione di una unità ogni k presenti nella lista k è il passo di campionamento: la parte intera del reciproco della frazione di campionamento  k = N/n Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

31 La tecnica di estrazione del CSI - illustrazione
Dato N = 50 e fissata la dimensione campionaria n = 10, si determina il passo di campionamento, dato da k = N/n = 50/10 = 5 Si estrae un numero casuale compreso tra 1 e k (5) per esempio 2 e si seleziona l’unità corrispondente Si procede selezionando le unità corrispondenti ai seguenti n. d’ordine: 2+k = 7, 2+2k = 12, 2+3k = 17, … fino ad esaurimento della lista Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

32 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Pro e contro del CSI Pro: Per formare il campione è sufficiente una sola estrazione casuale Teoricamente si potrebbe prescindere dalla lista di campionamento Contro: Se la lista presenta particolari ordinamenti il CSI produce un ‘‘cattivo’’ campione: esclude a priori alcuni segmenti di popolazione legati alla periodicità della lista Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

33 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le stime con il CCS Media: Lo stimatore corretto della media della popolazione è la media campionaria Totale: Varianza (stima della varianza di Y nella pop ): Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

34 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Stima di una frequenza Popolazione: Yi = 1 se l’attributo è presente; Yi = 0 se assente Stimatore fondamentale della frequenza: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

35 Varianza degli stimatori
Varianza teorica della media campionaria: Stima della varianza della media campionaria: Varianza della stima del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

36 Varianza degli stimatori - Esempio
Popolazione n. Y Possibili campioni 110 120 80 90 (1; 2) (1; 3) (1; 4) (2; 3) (2; 4) (3; 4) 115 95 100 105 85 12.5 112.5 50 200 Varianza teorica: Stima – campione (1; 2): Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

37 Intervalli di confidenza per le stime
Per n sufficientemente elevato la distribuzione campionaria della media può essere approssimata con una normale Intervallo di confidenza per la media campionaria: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

38 Intervalli di confidenza per le stime
Intervallo di confidenza per il totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

39 Il campionamento stratificato
L’obiettivo è estrarre un campione più efficiente rispetto al CCS: stime più precise (o numerosità campionaria inferiore) Esempio: Popolazione di N = 12 imprese Media ROI popolazione: 3.75 Campioni CS: (4; 6; 9; 10)  media ROI: ( )/4 = 2.5 (2; 3; 7; 12)  media ROI: ( )/4 = 5 Risultato: stime poco precise e a forte variabilità N. imp. 1 2 3 4 5 6 7 8 9 10 11 12 ROI Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

40 Il campionamento stratificato
Disponibilità informazione aggiuntiva: settore di attività Riorganizzazione informazioni: Popolazione: Campione: N. imp. 1 2 3 4 5 6 7 8 9 10 11 12 ROI Settore A C M T Settore N. imp. ROI A 3 3; 3; 3 T 2; 2; 2 M 6; 6; 6 C 4; 4; 4 N=12 Media 3.75 Settore n. imp. ROI A 1 3 T 2 M 6 C 4 n=4 Media 3.75 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

41 Il campionamento stratificato
La popolazione obiettivo è classificata in sottopopolazioni - esaustive e mutuamente esclusive - dette strati Gli strati devono essere possibilmente omogenei al loro interno ed eterogenei tra di loro Da ogni strato si estrae un campione casuale semplice Infine l’aggregazione di tali campioni produce il campione stratificato NB: E’ necessario disporre di informazioni aggiuntive - variabili ausiliarie - per ogni unità della popolazione Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

42 La tecnica di estrazione del CST
Schema di campionamento stratificato: In blu le unità campionate in ciascuno dei tre strati Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

43 Campionamento stratificato
Schema di popolazione di dimensione N ripartita in H strati Strato Unità Dimens. Media Varianza 1 . h H Y11 … Y1i … Y1N1 Yh1 … Yhi … YhNh YH1 … YHi … YHNH N1 Nh NH S12 Sh2 SH2 Parametri di strato: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

44 Campionamento stratificato
Schema di campione di dimensione n estratto dagli H strati Strato Unità Dimens. Media Varianza 1 . h H y11 … y1j … y1n1 yh1 … yhj … yhnh yH1 … yHj … yHnH n1 nh nH s12 sh2 sH2 Media e varianza campionaria di strato: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

45 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Stime con CST In caso di CCS negli strati, la probabilità di inclusione per l’unità i dello strato h è: Lo stimatore della media: : peso di strato Lo stimatore del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

46 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Esempio stima con CST Popolazione: Campione: Settore N. imp. ROI A 2 3; 3 T 3 2; 2; 2 M 6; 6 C 4; 4; 4 N=10 Media 3.6 Settore n. imp Pr.incl. ROI A 1 1/2 3 T 1/3 2 M 6 C 4 n=4 Media 3.6 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

47 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le stime con il CST Varianza della media campionaria: Varianza del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

48 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le stime con il CST Intervalli di confidenza media campionaria: totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

49 L’allocazione della numerosità campionaria tra gli strati
Allocazione proporzionale: La numerosità campionaria n viene ripartita tra gli strati in proporzione al peso di ogni strato nella popolazione: Pesi di strato nel campione = pesi di strato nella popolazione: Frazione di campionamento uguale in ogni strato (pari alla frazione di campionamento globale f) (campione autoponderante) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

50 Campionamento stratificato - Schema con allocazione proporzionale
Dato N=50 e fissata la dimensione campionaria n=10, si determina la frazione di campionamento f = 1/5 Nella popolazione sono stati individuati 3 strati: N1=10; N2=25; N3=15 Applicando f = 1/5 ad ogni strato si ottengono le numerosità campionarie di strato: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

51 Stima CST con allocazione proporzionale
Media campionaria: Varianza della media campionaria: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

52 L’allocazione non proporzionale
Applicazione di frazioni di campionamento differenti nei diversi strati. Preferibile in caso di maggiore variabilità del fenomeno oggetto di studio in alcuni strati rispetto ad altri Esempio: Strati N. impr. ROI 1 5 5.5; 5.7; 6; 6.3; 6.5 2 2; 3; 4; 5; 6 Al fine di produrre stime più efficienti, negli strati a maggiore variabilità si può intenzionalmente applicare una frazione di campionamento maggiore Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

53 L’allocazione non proporzionale
Allocazione ottimale di Neyman: la numerosità campionaria di strato è direttamente proporzionale, oltre che al peso di strato Wh, alla variabilità di strato espressa da Sh: Esempio: Popolazione N = 10; Campione n = 5 Strati N. impr. ROI Sh nh ottimale 1 5 5.5; 5.7; 6; 6.3; 6.5 0.369 2 2; 3; 4; 5; 6 1.414 4 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

54 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Pro e contro del CST Pro: Guadagno in efficienza rispetto al CCS Possibilità di stimare le variabili in sottopopolazioni di particolare interesse per gli scopi della ricerca Riduzione della probabilità di estrazione di campioni poco rappresentativi della popolazione obiettivo Contro: Se le variabili ausiliari non sono di buona qualità (sufficientemente correlate con il fenomeno oggetto di studio) ne può derivare una perdita di efficienza Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

55 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il Deff Sulla base della variabilità delle stime è possibile calcolare una misura del guadagno in efficienza derivante da un disegno di campionamento alternativo al CCS La misura è denominata effetto di disegno o Deff In generale, il Deff è definito come segue (dove ALT sta per disegno di campionamento alternativo al CCS): < 1 guadagno in efficienza > 1 perdita in efficienza Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

56 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il Deff Nel caso di campionamento stratificato in genere si ha: Più specificamente, in genere si verifica: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

57 Il campionamento a grappoli
Una popolazione oggetto di indagine può essere talvolta considerata come costituita da sottoinsiemi “naturali” di unità elementari denominati grappoli Esempi: la popolazione delle persone residenti in una città è costituita dalle persone appartenenti alle famiglie residenti; - gli studenti di una scuola sono costituiti dagli appartenenti alle sue diverse classi Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

58 Il campionamento a grappoli
Lo schema di campionamento a grappoli prevede: a. l’estrazione casuale di alcuni grappoli (es: famiglie) b. l’analisi completa di tutte le unità in essi contenute Obiettivo diverso da quello della stratificazione: convenienza in termini di costi e di tempo, facilitare il processo di raccolta delle informazioni Può essere anche più efficiente? In teoria: se i grappoli fossero eterogenei al loro interno e omogenei tra essi (alcuni grappoli rappresentano anche quelli non selezionati) Ma nella realtà in genere si verifica il contrario Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

59 La tecnica di estrazione del CGRA - illustrazione
La popolazione di 50 unità è suddivisa in 7 grappoli Vengono estratti casualmente 3 grappoli Per ognuno di essi vengono esaminate tutte le unità Il campione risultante si compone di 20 unità Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

60 La stima della media con il CGRA
Grappoli N. unità per grappolo Unità Totale di grappolo 1 α A B1 BA Y11 … Y1β …Y1B1 Yα1 … Yαβ …YαBα YA1 … YAβ …YABA tY1 tYα tYA Campione di a grappoli; probabilità di inclusione: a/A Stimatore fondamentale della media: Num. campionaria: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

61 La stima della media con il CGRA
Dimensione media dei grappoli nella popolazione = Dimensione media dei grappoli nel campione N/A = n/a : Media delle osservazioni campionarie Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

62 La stima della varianza con il CGRA
Varianza della media campionaria: NB: var( ) corrisponde alla stima della varianza di nel CCS: Dove: Stima varianza del totale: corrisponde alla stima della varianza di Y nel caso di CCS: f = a/A: frazione di campionamento Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

63 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Pro e contro del CGRA Pro: Vantaggioso quando i grappoli costituiscono una naturale aggregazione delle unità finali per le quali invece non si possiede una lista Effettuare la rilevazione solo su alcuni grappoli è molto meno dispendioso rispetto al CCS soprattutto se: a) si rende necessario un contatto diretto; b) le unità sono caratterizzate da dispersione sul territorio Contro: E’ in genere meno efficiente: i raggruppamenti naturali di unità tendono ad essere omogenei al loro interno ed eterogenei tra loro Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

64 Campionamento a due stadi
Nella popolazione vengono individuati: raggruppamenti di unità (grappoli) denominati unità di primo stadio (esempio: comuni) unità elementari appartenenti alle unità di primo stadio denominate unità di secondo stadio (esempio: aziende) Lo schema di campionamento a due stadi consiste: nel selezionare casualmente un campione di unità di primo stadio (es: comuni) nel selezionare casualmente un campione di unità di secondo stadio da quelle di primo stadio (es: aziende) Può essere visto come un campionamento a grappoli in cui si osserva solo una parte delle unità appartenenti ai grappoli campione Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

65 La tecnica di estrazione del CSTA - illustrazione
1° stadio sono estratte casualmente 3 UPS 2° stadio da ogni UPS selezionata sono estratte casualmente delle USS (f = 1/2) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

66 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Pro e contro del CSTA Pro: nelle indagini con rilevazione diretta tramite intervistatori consente di ridurre notevolmente la dispersione territoriale della rilevazione e quindi i suoi costi Contro: Di norma si verifica che le UPS sono omogenee al loro interno ed eterogenee tra esse. Di conseguenza il CSTA risulta meno efficiente del CCS Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

67 Tecniche di campionamento non probabilistico
Trovano largo impiego in particolare nelle ricerche di mercato Vantaggi: la semplicità organizzativa i bassi costi di realizzazione la velocità di esecuzione Limiti: - l’arbitrio di chi raccoglie i dati può comportare una distorsione da selezione del campione - non è possibile effettuare una stima della precisione dei risultati Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

68 Il campionamento per quote
Il metodo si basa sulla riproduzione nella composizione del campione di alcune caratteristiche distributive note della popolazione, nonostante che: non si dispone di una lista di campionamento non si applicano criteri di casualità nella selezione delle unità campionarie Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

69 Il campionamento per quote
Fasi del metodo: Si individuano le caratteristiche rilevanti della popolazione da riprodurre nel campione (esempio: genere e/o età degli individui; settore e/o dimensione delle aziende) Attraverso idonee fonti statistiche si calcola il peso percentuale dei corrispondenti gruppi sul totale della popolazione Stabilita la numerosità campionaria, essa è ripartita tra i gruppi individuati in modo che il campione rispecchi la composizione della popolazione Ai rilevatori sono assegnate le quote, ovvero il numero di interviste da effettuare liberamente in ognuno dei gruppi Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

70 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Profilo dell’errore Errore statistico: differenza tra il valore vero - relativo ad una certa caratteristica della popolazione - ed il valore osservato sui dati campionari Ignota la vera entità dell’errore, poiché è ignoto il valore vero della caratteristica oggetto di studio Scomposizione dell’errore statistico in: 1. errore campionario: derivante dal fatto che si esamina solo un campione della popolazione, anziché la sua totalità 2. errore non campionario: a sua volta scomponibile in diversi tipi di errore a seconda delle fonti Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

71 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
L’errore campionario La stima dell’errore campionario definisce l’intervallo di confidenza. Nel campionamento casuale semplice: Errore campionario: Errore standard: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

72 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
L’errore campionario Sulla base della sua espressione si deduce che l’ errore campionario è tanto più grande: quanto maggiore è il livello di fiducia che si vuole avere nella stima  i valori dei coefficienti zα/2 crescono al crescere del livello di fiducia quanto più elevata è la variabilità della caratteristica studiata nella popolazione  tale variabilità si riflette in quella osservata sul campione (e quindi sulla varianza e sull’errore standard della media campionaria) quanto minore è la dimensione del campione  legata alla varianza della media campionaria secondo una proporzione inversa Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

73 L’errore campionario - Esempio
- Popolazione di imprese (N = 10000); - Estratte 400 unità (n = 400) mediante CCS - Stima della media del fatturato: 495 (migliaia di euro); - Stima della varianza: 2500 (migliaia di euro). La stima dell’errore campionario, in corrispondenza di un livello di fiducia del 95%: Conclusione: nella stima della media del fatturato delle aziende - per un livello di fiducia del 95% - si può commettere un errore pari a 4,8 migliaia di euro, per difetto o per eccesso Ovvero, al 95% di probabilità, il valore vero incognito si trova nell’intervallo di confidenza [ ,8; ,8] Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

74 L’errore campionario - Esempio
Per una diversa numerosità campionaria: n = 300 (e a parità di livello di fiducia e stima della varianza nella popolazione) Errore campionario: Intervallo di confidenza: [495 – 5,6; ,6] Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

75 Calcolo numerosità campionaria
Stabilita prima di estrarre il campione in base all’errore campionario massimo che si è disposti a commettere Come si fissa l’errore massimo? Non possiamo partire dalla sua stima campionaria (non abbiamo ancora il campione) Dobbiamo partire dai valori teorici La varianza teorica della media campionaria nel CCS: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

76 Calcolo numerosità campionaria
Da cui deriva il valore teorico dell’errore standard: e il valore teorico dell’errore campionario: da cui si ottiene n in funzione di e (e di altri parametri): Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

77 Calcolo numerosità campionaria
Poiché la varianza della caratteristica nella popolazione S2Y è ignota, in genere si ricorre a: una misura della variabilità derivante da eventuali indagini pregresse una stima proveniente da un’indagine pilota Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

78 Calcolo numerosità campionaria
Caso di stima di una frequenza Variabile dicotomica: Y = 1 (presenza attributo); Y = 0 (assenza attributo) La varianza di Y nella popolazione è: S2Y = P (1 - P) La numerosità campionaria può essere determinata assumendo il valore massimo della varianza, che si ha per P = 0.5, e sostituendolo nella formula generale, ottenendo: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

79 Calcolo numerosità campionaria - Esempio
Popolazione di N = imprese Calcolo della numerosità campionaria per la stima della proporzione di imprese che hanno fatto investimenti nel triennio precedente, con - un errore massimo del 3% in più o in meno (e = 0.03) - un livello di fiducia del 95% (α = 0.05; zα/2 = 1.96) Per N = ? n = 1056 Per N = ? n = 1066 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

80 Calcolo numerosità campionaria - Esempio
Per P = 0.2 ? (e N = 10000) Bastava un campione più piccolo: Oppure (per n = 964) avremo un errore campionario minore: e quindi un intervallo di confidenza meno ampio Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

81 Errore non campionario
Casuale Sistematico è attribuibile unicamente al caso e i suoi effetti tendono ad annullarsi all’aumentare della numerosità campionaria di copertura di non risposta di misura di codifica e archiviazione dei dati totale parziale imputabile a insufficienze metodologiche o organizzative che possono originare in ogni fase di una indagine Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

82 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Errore di copertura Legato al grado di corrispondenza tra le unità elencate nella lista di campionamento e quelle effettive della popolazione Due tipi di errore: 1. Sovracopertura - la lista include unità non appartenenti alla popolazione 2. Sottocopertura - la lista esclude unità appartenenti alla popolazione (es. elenchi telefonici) si diagnostica con un quesito iniziale per verificare l’appartenenza si risolve eliminando le unità e con un campione di riserva per la loro sostituzione si diagnostica analizzando le caratteristiche della lista si risolve con riponderazione o post-stratificazione Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

83 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Errore di non risposta Deriva dalla mancata osservazione sull’unità di rilevazione di alcune o di tutte le caratteristiche oggetto di studio Si distingue in: non risposta totale - se riguarda tutte le caratteristiche non risposta parziale - se riguarda un numero contenuto di caratteristiche oggetto di indagine si previene con: motivazione unità selezionate; semplicità del questionario; solleciti; incentivi; sovracampionamento si risolve con: sostituzione unità; riponderazione, post- stratificazione si previene con: chiarezza domande; attenzione alla riservatezza; addestramento intervistatori si risolve con: imputazione dati mancanti (Cap. 3) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

84 Errori di non risposta o di copertura
Effetto sul campione delle non risposte totali o della sotto-copertura: alcune componenti della popolazione sottorappresentate, altre sovrarappresentate; composizione campione diversa da quella della popolazione Esempio (mancate risposte): M F TOT Popolazione: (40%) (60%) (100%) Campione: Rispondenti (30%) (70%) (100%) N. R Tassi di risposta: % % % Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

85 Errori di non risposta o di copertura
Esempio (sottocopertura): M F TOT Popolazione: (40%) (60%) (100%) Campione Selezionato: (30%) (70%) (100%) Rispondenti: Tassi di risposta: 75% % % Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

86 Riponderazione / post-stratificazione
Nota la composizione della popolazione secondo una o più caratteristiche, la riponderazione consiste: nell’aumentare il peso delle unità campionarie sotto- rappresentate e nel diminuire il peso di quelle sovra-rappresentate (fino a riportare i pesi a quelli noti nella popolazione) Informazioni necessarie: Composizione della popolazione (oltre che del campione) secondo le k modalità della caratteristica (o delle caratteristiche) utilizzata/e per la riponderazione (Esempio: percentuale di M e di F nella popolazione e nel campione) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

87 Riponderazione / post-stratificazione
Composizione della popolazione e del campione secondo le k modalità della caratteristica: Popolazione: Campione: Pesi di riponderazione: (per ogni unità j appartenente al sottocampione i): unità sottorappresentate: peso aumentato unità sovrarappresentate: peso diminuito Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

88 Riponderazione / post-stratificazione
Stima della media: Esempio (mancate risposte): M F TOT Popolazione: (40%) (60%) (100%) Campione: (40%) (60%) (100%) Rispondenti (30%) (70%) (100%) Pesi riponderazione: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

89 Riponderazione / post-stratificazione
Classificazione del campione secondo le k modalità: classificazione del campione in k strati (post-stratificazione) Formula del campionamento stratificato applicata ai k strati costruiti a posteriori Riponderazione = Post-stratificazione Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

90 Post-stratificazione - Esempio
Esempio (mancate risposte): M F TOT Popolazione (40%) (60%) (100%) Rispondenti (30%) (70%) (100%) N. R Post-stratificazione: Pesi (Ni / N) Medie Senza tenere conto della diversa incidenza delle mancate risposte ? Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

91 Le tipologie di quesiti
Classificati in base alle modalità di risposta domande a risposta aperta (o domande aperte): - non sono fornite le categorie di risposta; - l’intervistato deve fornire un valore numerico esatto oppure rispondere con parole proprie domande a risposta chiusa (o domande chiuse): - sono elencate le possibili categorie di risposta tra cui il rispondente deve indicarne una o più di una Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

92 Domande aperte vs domande chiuse
Pro aperte: consentono l’espressione libera del rispondente consentono l’acquisizione di dati numerici esatti nelle fasi di test del questionario consentono di individuare le categorie di risposta per le domande chiuse della versione finale Contro aperte: interpretazione soggettiva della domanda carico di lavoro più elevato con maggiori probabilità di errore e/o abbandono Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill 92

93 Le scale di valutazione
Utilizzate nella rilevazione di opinioni o atteggiamenti Esempio: accordo/disaccordo  molto, abbastanza, … Oppure: soddisfazione/insoddisfazione Trovano impiego nei sondaggi di opinione e nelle ricerche di mercato Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

94 Le scale di valutazione
Scala ancorata: possibilità di selezionare valori interi all’interno di un certo intervallo Totalmente Abbastanza Né d’accordo Abbastanza Totalmente in disaccordo in disaccordo né in disaccordo d’accordo d’accordo Scala continua: opzioni di risposta un insieme continuo di valori Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

95 Classificazione dei caratteri statistici
Principale distinzione Caratteri quantitativi: che derivano da misurazioni o operazioni di conteggio (es: reddito, n. di addetti) Caratteri qualitativi: in cui è assente il concetto di quantità (es: condizione occupazionale) Classificazione più fine, fondata sulla scala di misurazione: da essa dipendono le operazioni che si possono compiere Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

96 La scala di misurazione
Caratteri qualitativi Scala nominale: le modalità non possono essere messe in ordine secondo una sequenza logica (es: nazionalità) Confronto ammissibile tra due unità statistiche: se sono uguali o diverse rispetto a quel carattere Scala ordinale: le modalità possono essere messe in ordine secondo una sequenza logica (es: titolo di studio) Confronto ammissibile tra due unità statistiche: se l’una ha modalità maggiore o minore dell’altra secondo quel carattere Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

97 La scala di misurazione
Caratteri quantitativi Scala di intervalli: le modalità non possiedono uno “zero assoluto” che indichi assenza della quantità Esempio: temperatura; zero convenzionale, diverso a seconda della scala adottata Confronto ammissibile: per differenza tra i valori assunti dal carattere sulle unità Esempio: l’aumento di calore che si verifica tra 0° e 20° della scala Celsius è lo stesso che si verifica tra 20° e 40°. Ma non si può affermare che il caldo a 40° è doppio che a 20° Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

98 La scala di misurazione
Caratteri quantitativi Scala di rapporti: le modalità possono essere misurate partendo da un’origine che rappresenta l’assenza della quantità (Esempio: fatturato) Confronto ammissibile: rapporto tra i valori assunti dal carattere in due diverse unità (Esempio: se il rapporto è 2 il fatturato è doppio) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

99 La classificazione dei caratteri statistici
Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill


Scaricare ppt "Statistica Aziendale L’informazione statistica per le decisioni aziendali 1. Informazione già esistente (dati secondari)  Statistiche ufficiali e non."

Presentazioni simili


Annunci Google