“Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti
Lezione Causalità Corbetta, capitolo 3 1. Il disegno della ricerca 2. Concetti, indicatori e variabili 3. Gli errori di rilevazione
Il disegno della ricerca Il disegno della ricerca costituisce un insieme di passaggi logicamente strutturati che definisce le azioni che lo studioso deve seguire per indagare un fenomeno. Il rapporto tra teoria e ricerca è strutturato e composto di fasi sequenziali, nelle quali secondo un processo deduttivo, le formulazioni teoriche precedono l’osservazione del fenomeno che si vuole indagare.
Il disegno della ricerca Negli studi quantitativi il disegno della ricerca è definito in modo rigoroso, e si ambisce alla produzione di conoscenza scientifica. Cumulatività delle conoscenze Controllabilità delle procedure Pubblicità delle procedure
“Se ho visto più lontano è perché stavo sulle spalle dei giganti” Newton “La scienza è pubblica e non privata” Merton
Il disegno della ricerca TEORIA Interrogativo di ricerca IPOTESI RACCOLTA DEI DATI ANALISI DEI DATI Interpretazione e ritorno alla teoria RISULTATI
Interrogativo di ricerca TEORIA Interrogativo di ricerca Contesto della scoperta. Dalla rassegna teorica e dagli interessi del ricercatore scaturiscono gli interrogativi di ricerca. MOMENTO DEDUTTIVO IPOTESI RACCOLTA DEI DATI ANALISI DEI DATI RISULTATI
Le ipotesi sono costruite attraverso i concetti. TEORIA Interrogativo di ricerca Le ipotesi sono costruite attraverso i concetti. Le Hp (e i concetti) devono essere operativizzabili (empiricamente traducibili) IPOTESI RACCOLTA DEI DATI Controllabilità empirica delle ipotesi ANALISI DEI DATI RISULTATI Falsificazionismo K.Popper
Ipotesi scientifiche falsificabili Durkheim, “il suicidio”: comunità cattoliche e protestanti hanno differenti tassi di suicidio. PRIN 2005: l’ordinamento del prestigio delle occupazioni è rimasto lo stesso negli ultimi 20 anni in Italia. Sampson e Laub: le caratteristiche sociali di base influenzano il comportamento anti-sociale degli adolescenti non direttamente, ma attraverso la mediazione di alcune variabili processuali legate al comportamento dei familiari. Disuguaglianze intergenerazionali: il titolo di studio dei genitori condiziona le carriere scolastiche dei figli.
Ipotesi non falsificabili, perché indefinibili empiricamente In futuro il progresso tecnologico renderà tutti più felici. Nel settecento le persone vivevano meglio che ai nostri giorni. Impossibilità di osservazione (avere dati) del fenomeno Concetti ambigui e non osservabili
Interrogativo di ricerca TEORIA Interrogativo di ricerca La raccolta dei dati avviene attraverso procedure campionarie standardizzate che permettono di conoscere (in parte) l’errore di misura delle informazioni rilevate. IPOTESI RACCOLTA DEI DATI ANALISI DEI DATI RISULTATI
Interrogativo di ricerca TEORIA Interrogativo di ricerca Le analisi permettono di sintetizzare le informazioni a scopo descrittivo, e di realizzare test statistici allo scopo di sottoporre a controllo empirico le ipotesi di ricerca. Analisi monovariata, bivariata e multivariata. IPOTESI RACCOLTA DEI DATI ANALISI DEI DATI RISULTATI
TEORIA Interrogativo di ricerca I risultati corroborano oppure falsificano Hp, o possono modificare gli interrogativi iniziali allo scopo di re-definire tutto il disegno della ricerca. MOMENTO INDUTTIVO Interpretazione e ritorno alla teoria RISULTATI
Concetti e indicatori Un concetto racchiude il significato di un segno linguistico o di un immagine mentale I concetti sono necessari per rappresentare il reale. Essi rispondono alla necessità di DIFFERENZIARE E RIDURRE LA COMPLESSITA’
Concetti I concetti possono essere disposti lungo un continuum ideale di concretezza o astrazione: Il peso Il titolo di studio La salute La libertà Concretezza Astrazione
Concetti Nel ragionamento scientifico i concetti sono i “mattoni” delle ipotesi, le quali possono essere sottoposte a vaglio empirico. Tuttavia i concetti per essere utilizzati in ipotesi “falsificabili”, devono essere tradotti in proprietà osservabili (e misurabili) su delle unità di analisi.
Concetti Per testare un’ipotesi, occorre passare dai concetti che la definiscono, alle proprietà di questi concetti, e all’ – operativizzazione in variabili di queste proprietà. CONCETTO Proprietà VARIABILE Operativizzazione
ESEMPIO: HP – L’istruzione rende più sani. Concetti ESEMPIO: HP – L’istruzione rende più sani. Il concetto “istruzione” deve essere tradotto in un concetto più concreto (che è chiamato INDICATORE), che potrebbe essere quello di titolo di studio. Il quale viene OSSERVATO attraverso le sue proprietà (ad esempio la gradazione) che possono assumere STATI differenti. Gli STATI sono misurati attraverso una definizione operativa, la quale costituisce un insieme di regole che traducono le proprietà dei concetti in variabili. Ossia… “…il complesso di regole che guidano le operazioni con cui lo stato di ciascun caso sulla proprietà X viene rilevato, assegnato a una delle categorie stabilite in precedenza .“ Marradi 1980
Concetti e indicatori Concetto “concreto” Proprietà VARIABILE ASTRATTO Concetto “concreto” Proprietà VARIABILE INDICATORE Operativizzazione
INDICATORE dell’istruzione Concetti e indicatori ISTRUZIONE CONCETTO ASTRATTO Titolo di studio Gradazione del titolo Concetto “concreto” Proprietà VARIABILE INDICATORE dell’istruzione Operativizzazione
ES: L’istruzione rende più sani. Concetti Il processo nel quale si applica la definizione operativa è l’OPERATIVIZZAZIONE. ES: L’istruzione rende più sani. ES - Definizione operativa: quando l’unità di analisi (il soggetto) dichiara di aver terminato gli studi con le scuole dell’obbligo, segnare la risposta 1, quando il soggetto dichiara di aver terminato gli studi con il diploma segnare la risposta 2, eccetera.
Procedure di operativizzazione Classificazione Ordinamento Conteggio Misurazione
Concetti tradotti in variabili CONCETTO (INDICATORE) Proprietà Operativizzazione REGISTRAZIONESULLA VARIABILE PESO Peso di una persona MISURAZIONE Pesatura 65 Kg LIVELLO SCOLASTICO Gradazione del titolo di studio CLASSIFICAZIONE Intervista e registrazione della risposta 3 - Diploma di maturità DIMENSIONI DEL NUCLEO FAMILIARE Numero di persone nel nucleo familiare CONTEGGIO Conta delle persone che appartengono allo stesso nucleo familiare 4 ETA’ Numero di anni compiuti Lettura dell’anno di nascita dal documento d’identità, differenza con l’anno corrente e registrazione della risposta 23 anni GRADIMENTO DI TRE PARTITI Gradimento ORDINAMENTO L’intervistato indica l’ordine dei partiti Partito in 1° posizione Partito in 2° posizione Partito in 3° posizione OCCUPAZIONE Tipo di condizione occupazionale 1 - Occupato
Lo stesso concetto può essere tradotto diversamente CONCETTO (INDICATORE) Proprietà Operativizzazione REGISTRAZIONESULLA VARIABILE ANDARE A TEATRO Frequenza ORDINAMENTO Registrazione fra tre modalità riferite all’ultimo mese: “spesso, qualche volta, mai” 1 - spesso CONTEGGIO Registrazione del numero di volte nell’ultimo mese 2 Gradimento Registrazione su scala Likert della soddisfazione 4 - “Molto soddisfatto”
Misurazione degli stati di salute Variabili su cui è misurata la salute degli individui.
Le unità di analisi Le unità di analisi sono gli oggetti su cui noi rileviamo gli stati delle proprietà che sono si nostro interesse.
Le unità di analisi Individui Aggregati di individui Gruppi-organizzazioni Eventi Prodotti culturali Proprietà Unità di analisi
Le unità di analisi: gli individui La maggior parte della ricerca sociale avviene considerando come unità di analisi l’individuo. Le proprietà rilevate sono inerenti a: -caratteristiche socio-demografiche -comportamenti -atteggiamenti o opinioni -valori -possesso di beni -eccetera
Le unità di analisi: aggregati di individui Le proprietà riguardano degli attributi individuali nel loro insieme (generalmente a livello ecologico/territoriale) Le proprietà rilevate fanno riferimento ad indicatori ecologici che “sintetizzano” un’informazione AD ESEMPIO: PIL pro-capite dei comuni italiani % di disoccupati negli stati europei Tassi di mortalità nelle regioni italiane Num. medio di sigarette fumate al giorno per persona nelle diverse province AGGREGATI TERRITORIALI
Le unità di analisi: gruppi/organizzazioni Le proprietà riguardano in questo caso le caratteristiche dei gruppi e non degli individui che ne fanno parte AD ESEMPIO: -Fatturato delle prime 100 aziende della provincia -Numero degli studenti delle scuole lombarde -Numero di parlamentari nei paesi europei -Seggi attribuiti ai partiti
Le unità di analisi: eventi Talvolta oggetto di studio sono eventi, e le proprietà vengono registrate su di essi. AD ESEMPIO: -Caratteristiche dei conflitti in Africa dal Dopoguerra -Durata degli episodi lavorativi (primo lavoro) -Durata degli scioperi alla FIAT negli anni ‘80 -Adesione alle manifestazioni di piazza
Le unità di analisi: prodotti culturali Raramente l’attenzione della ricerca è rivolta a precise rappresentazioni simboliche o prodotti culturali. Le proprietà rimandano all’Analisi del contenuto che focalizza l’attenzione sullo studio della comunicazione. AD ESEMPIO: -Ricorrenza di certi temi negli articoli in prima pagina di un giornale -Caratteristiche di un certo tipo di spot -Caratteristiche dei telegiornali -Meta-analisi degli articoli scientifici
Variabili Possono applicarsi diverse tipologie di variabili. Le principali sono definite in base a: - alla scala di misurazione alle relazioni che intercorrono tra loro all’osservabilità NB: se una variabile registra sempre lo stesso stato rispetto alla proprietà osservata è detta COSTANTE.
Variabili: la scala di misurazione Si distinguono tre principali livelli di misurazione delle variabili: nominale, ordinale e cardinale. A seconda della scala di misurazione cambiano le procedure di rilevazione (operativizzazione delle proprietà in casi) e le analisi applicabili.
Ad esempio per il genere (variabile nominale): 1=femmina; 2=maschio Variabili NOMINALI Quando le modalità non sono ordinabili e possiedono un alto grado di autonomia semantica (le modalità hanno senso di per sé, indipendentemente dalle altre). La fede religiosa L’essere d’accordo o no (si/no) con una certa affermazione La condizione occupazionale Il colore dei capelli Il genere Non è possibile nessuna operazione aritmetica sulle modalità. Tuttavia alle modalità è possibile attribuire dei valori a cui corrispondono delle etichette. Ad esempio per il genere (variabile nominale): 1=femmina; 2=maschio
Variabili ORDINALI Quando le modalità sono ordinabili e possiedono un basso grado di autonomia semantica. La frequenza di un certo luogo (spesso, qualche volta, mai) …teatro u.m. L’ordinamento in preferenze di alcuni colori (rosso, giallo, verde) L’essere molto, abbastanza, poco o per niente d’accordo … Il livello d’istruzione in gradi scolastici. È possibile applicare sulle modalità operazione di confronto (<>=). Alle modalità è possibile attribuire dei valori a cui corrispondono delle etichette. Ad esempio per il titolo di studio: 4=Laurea; 3=Diploma; 2=Licenza Media; 1=Licenza Elementare
Variabili CARDINALI (e quasi-cardinali) Quando le modalità costituiscono numeri derivati da misurazioni discrete (conteggi) o continue, e non possiedono nessun grado di autonomia semantica (le modalità non hanno senso di per sé, se non in relazione alle altre). L’altezza in centimetri L’età in anni Il reddito Grado di accordo tra 0 e 100 su una certa affermazione* È possibile applicare sulle modalità tutte le operazione di confronto (-+*/). Le modalità corrispondono ai valori, e non vengono attribuite etichette.
Variabili dipendenti e indipendenti Quando è possibile considerare che due variabili sono in relazione di causa-effetto (o ipotizzate come tali) è possibile distinguerle : Le variabili indipendenti sono le variabili “causa”, che realizzano un “effetto” sulle variabili DIPENDENTI. Generalmente si indicano le var.dipendenti con la Y, e le variabili indipendenti con la X. Y =f(X) EXPLICANDUM EXPLICANS
Variabili dipendenti e indipendenti Le variabili indipendenti sono di tipo ascrittivo quando riguardano caratteri anagrafici, altrimenti sono considerate come tali in base a considerazioni squisitamente teoriche. Ad esempio, ponendo in relazione titolo di studio e genere, solo la seconda può assumere la condizione di indipendente. Oppure, tra valori e comportamenti, teoricamente si è orientati a considerare i secondi come effetto del sistema valoriale incorporato dalle identità individuali.
Variabili osservate e latenti Le variabili sono distinte tra latenti ed osservate quando … in un qualche modello statistico sono impiegate le variabili (normalmente presenti in un data set), direttamente derivate dalle operativizzazioni delle proprietà osservate, … ed a queste si aggiungono delle variabili che non sono osservate direttamente, ma “sussunte” da altre variabili osservate (con un certo errore misurabile).
ESEMPI DI FATTORI LATENTI DEPRIVAZIONE ECONOMICA CATTIVA SALUTE + 0.83 + 0.59 + 0.90 + 0.78 + 0.87 Situazione economica Risorse econ.fam. Soddisfazione economica Salute percepita Soddisfazione salute
Indicatori Come abbiamo visto quando si ha a che fare con concetti astratti, occorre scendere lungo la scala di astrazione ed utilizzare concetti più concreti le cui proprietà sono operativizzabili in variabili. ESEMPIO: HP – L’istruzione rende più sani. Il concetto “livello scolastico” è INDICATORE del concetto più astratto “istruzione”.
Indicatori e indici Per alcuni concetti particolarmente complessi possono essere utilizzati più indicatori. In fase di raccolta dati, vengono registrati gli indicatori-concetti concreti. In fase analitica tali indicatori sono sintetizzati (allo scopo di ricostruire idealmente il concetto più astratto e complesso) in un INDICE COMPOSITO.
Il concetto complesso INDICE di XENOFOBIA, ESEMPIO: Il concetto complesso INDICE di XENOFOBIA, deve essere declinato in concetti più semplici e concreti. 1) Quando incontri persone che parlano un’altra lingua ti senti disturbato? Da 1 a 7 dove 1 è per niente e 7 molto. 2) Quando incontri persone di un’altra etnia ti senti disturbato? Da 1 a 7 dove 1 è per niente e 7 molto. 3) Quando incontri persone di un’altra religione ti senti disturbato? I tre indicatori, una volta rilevati sul campione, vengono ricomposti in un’unica variabile-indice di xenofobia.
Valore osservato = Valore vero + Errore Errore di rilevazione Nel passaggio dai concetti alle variabili è possibile incorrere in diversi tipi di errore. Valore osservato = Valore vero + Errore Errore= Errore sistematico + Errore accidentale
Errore sistematico * E’ un errore costante che si presenta in tutte le rilevazioni. Il suo valore medio è diverso da zero, ossia il “valore osservato” sbaglia sistematicamente nello stimare il “valore vero”. Ad esempio se chiediamo in una serie di interviste telefoniche il reddito dell’ultimo mese sappiamo che tendenzialmente registreremo in media un valore che è una sottostima di quello vero.
Su tutti i possibili campioni il suo valore medio atteso è zero. Errore accidentale * E’ un errore variabile che cambia a seconda della rilevazione. E cambierebbe anche se ripetessimo la rilevazione sullo stesso individuo. Su tutti i possibili campioni il suo valore medio atteso è zero. Gli intervistati sulla collocazione politica (1 sinistra-10 destra) possono comprendere male la domanda (individualmente), ma in media gli errori tenderanno ad annullarsi.
Errore accidentale + Errore sistematico Il centro è il valore vero! Errore accidentale + Errore sistematico Errore accidentale E(t)=0 E(t)=a
FASE TEORICA FASE EMPIRICA CONCETTO Indicatore VARIABILE proprietà Errore di operativizzazione ** Errore di indicazione * (validità dell’indicatore) SELEZIONE (nelle survey) Copertura Campionamento Non risposta OSSERVAZIONE Intervistatore Intervistato Strumento Modo Trattamento dati
Errore di operativizzazione ** ERRORE DI SELEZIONE (nelle survey) Copertura: le unità di analisi non sono raggiungibili Campionamento: i dati sono relativi solo a una parte della popolazine (inferenza) Non risposta: unità che si rifiutano di rispondere ERRORE DI OSSERVAZIONE Intervistatore Intervistato Strumento: domande sbagliate Modo: metodo di rilevazione del dato ERRORE nel Trattamento dei dati Errori di inputazione, di codifica, o in generale nella manipolazione dei dati
ESEMPI Errore di operativizzazione ** ERRORE DI SELEZIONE (nelle survey) Copertura: le unità di analisi non sono raggiungibili Campionamento: i dati sono relativi solo a una parte della popolazione (inferenza) Non risposta: unità che si rifiutano di rispondere ERRORE DI OSSERVAZIONE Intervistatore Intervistato Strumento: domande sbagliate Modo: metodo di rilevazione del dato ERRORE nel Trattamento dei dati Errori di inputazione, di codifica, o in generale nella manipolazione dei dati Intervista telefonica troppo lunga Domande tendenziose (scala asimmetrica) Indagini web, auto-selezione Errata comprensione della domanda Errore di campionamento Interviste telefoniche a fissi Registrazione errata delle risposte
Attendibilità e validità La validità è il grado con il quale una certa procedura di traduzione di un concetto in variabile effettivamente rileva il concetto che si intende rilevare. Legata all’errore sistematico, difficilmente individuabile L’attendibilità è il grado con il quale una certa procedura di traduzione di un concetto in una variabile produce gli stessi risultati (in più misurazioni con lo stesso strumento o con più strumenti). Legata all’errore accidentale. Più domande nella stessa batteria sullo stesso argomento.
Un modo di misurare l’attendibilità è l’alfa di Cronbach Vengono fatte una serie di domande diverse sullo stesso argomento (o concetto). Se le risposte risultano tra loro “correlate” allora le variabili ad esse associate costituiscono indicatori affidabili del concetto. Esempio a pagina 249 del Corbetta.