Percorso introduttivo alla statistica ufficiale L’INDAGINE STATISTICA Scuola Secondaria di Secondo grado; Argomento: Introduzione – Indagine (30.09.13); Pacchetto: S2.A.2
INDICE Definizioni Le fasi di un’indagine statistica La Definizione degli obiettivi La Definizione del disegno di indagine Indagini totali e indagini campionarie Pro e contro di indagini totali e campionarie Alcuni esempi La Rilevazione dei dati Rilevazioni dirette. Definizione ed alcuni esempi Rilevazioni indirette. Definizioni ed alcuni esempi Pro e contro di indagini dirette ed indirette
DEFINIZIONI 3
L'Indagine statistica Un’indagine statistica è una raccolta di dati effettuata seguendo un processo produttivo complesso che ha come obiettivo la produzione di informazione statistica, ossia la produzione di descrizioni riassuntive di carattere quantitativo riguardanti un fenomeno collettivo. L’oggetto dell’osservazione di ogni fenomeno individuale che costituisce il fenomeno collettivo è detto unità statistica 4
L'indagine statistica Il fenomeno collettivo viene studiato mediante, quindi, l’osservazione o la misurazione di una o più caratteristiche delle unità statistiche Ogni caratteristica è detta carattere o variabile statistica ed il “modo” in cui il carattere si manifesta si chiama modalità L’insieme delle unità statistiche costituisce il collettivo o popolazione. Esempi di unità statistiche: - ciascun individuo di una popolazione, - ciascuna coppia di sposi, - ogni unità produttiva . La popolazione è quindi l’insieme di unità elementari ben identificabili, delle quali interessa studiare una o più caratteristiche ad essa comuni. 5
LE FASI DI UN'INDAGINE STATISTICA E LA RILEVAZIONE DEI DATI 6
Progettare un’indagine L’attività di progettazione e di esecuzione di un’indagine è frutto di un impegno multidisciplinare che coinvolge un elevato numero di professionalità, per la valutazione e definizione delle diverse fasi di indagine: Definizione degli obiettivi Disegno di indagine Rilevazione sul campo Registrazione revisione e validazione Elaborazione metodologica Presentazione ed utilizzazione dei risultati Diffusione
Definizione degli obiettivi In questa fase va dedicata particolare attenzione: Individuare con precisione le informazioni da ricercare, delimitando esattamente cosa interessa da cosa non interessa, tenendo presente che più ampio è l’arco degli argomenti trattati, maggiori divengono le complessità da affrontare sul piano concettuale e operativo Individuare con precisione la popolazione di riferimento ossia l’insieme di unità statistiche alle quali si intende estendere i risultati dell’indagine Definire se interessa descrivere un fenomeno nella sua componente statica o dinamica e, quindi, circoscrivere con esattezza il territorio e il periodo di riferimento dell’indagine Definire le variabili e le loro classificazioni
Disegno di indagine La definizione del disegno di indagine mira a rispondere alle seguenti necessità: Definire qual è il tipo di indagine più consono a produrre le statistiche che si desiderano Indagine diretta Indagine indiretta Decidere tra indagine totale e campionaria e, in tal caso, disegnare ed estrarre il campione (strategia di campionamento)
Le indagini dirette Una rilevazione si definisce diretta quando le osservazioni sono desunte dalle singole unità che costituiscono la popolazione e che vengono contattate nella fase di rilevazione Tecniche di intervista interviste dirette o faccia a faccia o rilevazione interviste postali interviste telefoniche autocompilazione Alle differenti tecniche di intervista è associato un diverso grado di attendibilità dei risultati Tipologie di questionario e di intervista PAPI (Pencil e paper) CAPI (Computer Assisted Personal Interview) CATI (Computer Assisted Telephone Interview) CAWI (Computer Assisted Web Interview)
Le indagini dirette Intervista diretta (o faccia a faccia) l’intervista viene condotta da un rilevatore che legge le domande e le opzioni di risposta nell’esatto ordine e con lo stesso linguaggio adottati nel questionario riportandovi quindi le risposte così come sono fornite dal rispondente Se CAPI: registrazione immediata delle informazioni gestione automatica dei filtri e, quindi, possibilità di somministrare questionari molto complessi controllo immediato delle informazioni mediante regole di compatibilità Intervista postale Tale tecnica prevede l’invio postale del questionario cartaceo tramite postel, la compilazione da parte del rispondente e l’invio al centro di rilevazione Intervista telefonica L’intervista viene condotta al telefono da un intervistatore che legge le domande e le opzioni di risposta nell’esatto ordine e con lo stesso linguaggio adottati nel questionario riportando poi le risposte così come sono fornite dal rispondente (CATI) Autocompilazione Il rispondente legge il questionario e lo compila
Le indagini dirette Vantaggi Rispondenza tra gli obiettivi dell’indagine e l’informazione raccolta Possibilità di contattare il rispondente Tasso ridotto di mancate risposte (persuasione a collaborare) Possibilità di fornire spiegazioni Svantaggi Maggiori costi di rilevazione Minore tempestività Maggior disturbo statistico Maggiori errori di rilevazione Necessità di un’organizzazione capillare sul territorio Maggiori rischi di condizionamento
Le indagini dirette Alcune indagini dirette condotte dall’Istat Condizioni di salute e ricorso ai servizi sanitari Tecnica di indagine mista: intervista faccia a faccia + autocompilazione del questionario Indagine continua Forze di lavoro Tecnica di indagine mista: intervista faccia a faccia (CAPI)+ reintervista telefonica (CATI)
Le indagini indirette Si definisce rilevazione indiretta (o indagine statistica basata su dati di fonte amministrativa) l’indagine che utilizza dati amministrativi con finalità di tipo statistico. La gran parte delle rilevazioni svolte dall’Istat ha base amministrativa Caratteristiche Il dato statistico è generato dalla normale attività amministrativa Nasce dalla registrazione di uno stato di fatto È un dato esaustivo
Le indagini indirette Vantaggi Riducono il costo della rilevazione Riducono il disturbo statistico Svantaggi La popolazione alla quale interessa riferire l’informazione può non coincidere con quella della raccolta dei dati amministrativi (errore di copertura) I concetti, le definizioni, e le classificazioni adottate nella raccolta dei dati amministrativi possono non coincidere con quelli della ricerca statistica La qualità con cui le informazioni sono raccolte nei dati amministrativi può non essere sufficiente agli obiettivi della ricerca Non sempre è garantita la disponibilità dei dati in tempi utili alle necessità di informazione statistica
Le indagini indirette Alcuni esempi di indagini indirette condotte dall’Istat Rilevazioni demografiche sulla popolazione (Iscritti in anagrafe per nascita, Movimento migratorio della popolazione residente, Matrimoni, ....) Statistiche giudiziarie (delitti denunciali, separazioni civili,…) Rilevazione degli incidenti stradali Commercio estero Movimento clienti negli esercizi ricettivi
Indagini totali e campionarie Lo studio di una popolazione può essere effettuato scegliendo tra due metodi alternativi Conducendo un’indagine totale (o censimento) , ossia compiendo una enumerazione completa delle unità statistiche di interesse e raccogliendo studiando ogni unità, sia che siano cose sia persone, in una popolazione Conducendo un’indagine campionaria, ossia scegliendo un sottoinsieme di unità della popolazione, selezionate in modo da essere rappresentative di tutte le unità nella popolazione di riferimento Entrambi gli approcci forniscono informazioni in grado di descrivere l’intera popolazione
Le indagini totali Vantaggi Fornisce una misura reale (non affetta da errore campionario) della popolazione Le informazioni rilevate possono essere utilizzate come base di riferimento per studi successivi Elevato dettaglio di analisi Svantaggi Il rilascio delle informazioni richiede tempi molto lunghi Costi elevati sia in termini di risorse che economici
Le indagini campionarie Per ovviare ai problemi cui sono soggette le indagini totali si ricorre alle indagini campionarie caratterizzate dal fatto che solo una parte delle unità statistiche componenti la popolazione viene selezionata e indagata. Inoltre si ricorre alle indagini campionarie quando: L’ampiezza della popolazione è infinita La rilevazione comporta la distruzione delle unità osservate Si rende necessario ridurre i costi È necessario ridurre i tempi per ottenere le informazioni È necessario migliorare la qualità dei dati in termini di accuratezza, ovvero di precisione Questo espediente, diminuendo l’onere della rilevazione consente di destinare maggiore attenzione a tutte le attività connesse al miglioramento e al controllo della qualità dei dati raccolti. Tuttavia selezionare solo un campione implica ovviamente una minore attendibilità delle stime riferite ai parametri di interesse
Strategie di campionamento La definizione delle modalità di estrazione del campione, della sua dimensione e delle funzioni dei dati utilizzate per ottenere, dai dati rilevati dal campione, stime riferite alla popolazione di interesse prende il nome di strategia di campionamento. I criteri di scelta del campione possono essere: Probabilistici: il piano di campionamento avviene mediante meccanismi aleatori, per i quali è possibile determinare la probabilità (costante o variabile) di estrarre un’unità statistica Non probabilistici: il piano di campionamento prescinde dai criteri di casualità nella scelta delle unità campionate
Criteri probabilistici Campioni casuali semplici: la probabilità di entrare a far parte del campione è uguale per tutte le unità della popolazione Con ripetizione Senza ripetizione Campioni con probabilità variabili: ad ogni unità della popolazione viene associata una diversa probabilità di estrazione Campionamento stratificato Campionamento a grappoli Campionamento a due stadi
Criteri non probabilistici Campioni a scelta ragionata: le unità statistiche vengono individuate mediante criteri logici di rappresentatività, conoscenza specialistica del problema, ecc. Campioni per quota: le unità statistiche vengono scelte dal rilevatore in modo che il campione complessivo rispetti delle proporzioni predefinite da chi ha pianificato l’indagine Campioni volontari: le unità statistiche decidono autonomamente se far parte del campione oppure no
Il Censimento Il censimento è una rilevazione: Totale o universale viene osservata l’intera popolazione di riferimento Simultanea le notizie devono essere riferite allo stesso istante (la situazione rilevata deve essere quella del momento stabilito come data del censimento) Periodica viene ripetuta ad intervalli regolari Diretta Le informazioni sono desunte da ciascuna unità di rilevazione I censimenti dell’Istat Censimento generale dell’Agricoltura Censimento della Popolazione e delle Abitazioni Censimento dell’Industria e dei Servizi e delle Istituzioni no profit
Le innovazioni nei censimenti La tornata censuaria 2010 – 2012 ha introdotto molte innovazioni soprattutto nelle modalità di compilazione e restituzione del questionario. Tecnica di restituzione multi-canale. Le aziende o le famiglie potevano scegliere la restituzione tramite web del questionario di rilevazione oppure la restituzione del questionario cartaceo presso un centro di raccolta comunale o in uno degli uffici postali del territorio nazionale. Il rilevatore è stato utilizzato prevalentemente nei casi di mancate risposte.
Le innovazioni nei censimenti La restituzione multicanale ha evidenziato le diverse problematiche legate alla qualità del dato. Autocompilazione vs. compilazione tramite rilevatore (possibilità di chiedere chiarimenti, mancate risposte/risposte ridondanti, ecc). Compilazione assistita via web vs. compilazione cartaceo (coerenza dei percorsi, controlli di tipo probabilistico/deterministico, ecc.). Necessità di un processo di data entry (errori di digitazione/lettura ottica, smarrimento/deterioramento dei questionari, ecc.).
Bibliografia Fortini, M. (2000), Linee guida metodologiche per rilevazioni statistiche, Istat http://www.istat.it/it/files/2010/09/lineeguida.pdf Maggino, F. (2005), L’analisi dei dati nell’indagine statistica, Firenze University Press
…e adesso… buon lavoro! Rete per la promozione della cultura statistica Per ulteriori moduli didattici relativi alle scuole secondarie di secondo grado si prega di consultare anche la piattaforma Scuola di statistica – Lab (accessibile dal link http://scuoladistatistica-lab.istat.it/)