1 “Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti
LA FALLACIA ECOLOGICA Non è corretto mettere in relazione variabili misurate ad un diverso grado di aggregazione, o meglio è scorretto inferire da una relazione tra dati aggregati correlazioni a livello individuale.
3 Vedendo questo grafico e sapendo che le regioni del nord hanno un maggiore benessere socio-economico (correlato ad un’istruzione media più alta) possiamo ipotizzare che gli anni di scolarità siano associati ad una salute peggiore ?
r = - 0,41 b yx = -0,1 Correlazione fra anni di scolarità (0-21) e salute* (1-5) con dati aggregati Affidandoci ai soli dati aggregati affermeremmo che la relazione tra salute e scolarità è negativa. Cioè all’aumentare dell’istruzione la salute diminuisce. In media per ogni anno di istruzione in più la salute diminuisce di 0,1 punti. ASCOLI_mSALUTE_M XY Campania Puglia Sicilia Trentino Calabria Basilicata Molise Abruzzo Lazio Toscana Marche Sardegna Umbria Veneto Liguria Lombardia Piemonte Friuli Venezia Giulia Emilia Romagna * 1=salute cattiva; 5=salute buona
5 r = + 0,22 b yx = + 0,05 Correlazione fra anni di scolarità e salute con dati individuali TUTTAVIA, potendo disporre di dati individuali, possiamo controllare che la “vera” relazione a livello individuale delle due variabili è diversa. In media ad ogni anno di scolarità in più la salute aumenta di 0,05 punti.
Il livello di aggregazione interviene sulla relazione tra variabili a livello individuale esercitando un effetto spurio. Se usiamo dati ecologici il livello di aggregazione può divenire la “reale causa” dell’effetto inferito a livello individuale. Nell’esempio, le regioni del nord, hanno salute peggiore e più alta istruzione (in media), ma il dato aggregato inganna, poiché a livello individuale l’istruzione è invece correlata con una salute migliore. Il dato aggregato non discerne tra coloro, all’interno della stessa regione, che hanno istruzione bassa e salute bassa, e istruzione alta e salute alta. Considerandoli tutti insieme, nella media regionale, perde di vista la relazione.
7 Percentuali di giovani 2005 PIL eq (media 100) Relazioni a livello ecologico, non adatte all’inferenza
8 % PIL in ricerca e sviluppo n. Brevetti Relazioni a livello ecologico, non adatte all’inferenza