La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Analisi monovariata: frequenze

Presentazioni simili


Presentazione sul tema: "Analisi monovariata: frequenze"— Transcript della presentazione:

1 Analisi monovariata: frequenze
Analisi monovariata: insieme di tecniche che prendono in considerazione una sola variabile alla volta. Essa è il punto di partenza per tutte le analisi dei dati Il punto di partenza dell’analisi monovariata è la distribuzione di frequenza, ossia ad ogni modalità della variabile viene associata la frequenza con cui essa si presenta nella matrice-dati. Distribuzione di frequenza della variabile sesso Modalità Frequenza Maschio 325 Femmina 254 Totale 579

2 Analisi monovariata: frequenze
Esistono due tipi diversi di frequenze: le frequenze assolute e le frequenze relative Le frequenze assolute (tabella precedente) consistono nel semplice conteggio del numero di casi che presentano lo stesso valore (modalità), per la variabile prescelta. Generalmente le F.A. sono di difficile interpretazione, poiché non ci permettono di cogliere l’incidenza delle singole modalità sull’intera distribuzione della variabile (posso conoscere il numero di persone di sesso maschile, ma se non metto in relazione tale numero con il totale dei casi non posso affermare alcunché). Per questi motivi è più utile ricorrere alle frequenze relative, ossia quel tipo di frequenze che permette di annullare l’effetto della numerosità dei casi.

3 Analisi monovariata: frequenze relative
Le frequenze relative si suddividono in quattro tipi: proporzioni, frequenze percentuali, cumulate, retro-cumulate. A seconda del tipo di variabile da analizzare, sarà possibile utilizzare parte o tutti i tipi di frequenze relative. Per tutte le variabili (nominali, ordinali e cardinali) è possibile calcolare: proporzione: frequenza assoluta numero totale dei casi frequenza percentuale: frequenza assoluta X 100

4 Analisi monovariata: frequenze relative - 2
Esempio: Modalità Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza media 342 0,285 28,5 Diploma 264 0,220 22,0 Laurea 55 0,046 4,6 Totale 1.200 1 100,0

5 Analisi monovariata: frequenze relative -3
Se le variabili sono ordinali è possibile calcolare anche le percentuali cumulate e retro-cumulate. La frequenza cumulata relativa a una categoria indica quale numero (o percentuale) di casi non arriva alla categoria successiva o oltre; La frequenza retro-cumulata relativa a una categoria indica quale numero (o percentuale) di casi arriva a quella categoria o alle successive (cioè più alte nell’ordine) (Marradi, 2002).

6 Analisi monovariata: frequenze relative - 4
Esempio: Modalità Frequenze assolute Frequenze relative Percentuali Cumulate Retro-cumulate Senza titolo 30 2,5 100,0 Lic. elementare 509 42,4 44,9 97,5 Licenza media 342 28,5 73,4 55,1 Diploma 264 22,0 95,4 26,6 Laurea 55 4,6 Totale 1.200 Interpretazione: “gli individui che al massimo hanno la licenza media sono il 73,4%” “gli individui che hanno almeno il diploma sono il 26,6%”

7 Analisi monovariata: tabelle - 1
Presentazione tabellare delle distribuzioni di frequenza: Parsimonia: inserire solo le informazioni indispensabili (indicare solo un tipo di frequenza (assoluta, relativa, percentuale, etc…) Numerosità dei casi: nel caso si utilizzino le frequenze percentuali (più usate) è necessario indicare il numero complessivo dei casi in valore assoluto (N) Utilità delle percentuali: non usare le frequenze percentuali se N è minore di 50 casi (riportare le percentuali se si vuole comparare più distribuzioni di frequenza) Fallacy of the misplaced precision: evitare la tendenza a riportare percentuali con un numero eccessivo di decimali, ma riportare solo quelli strettamente necessari. Una possibile regola, suggerita da Marradi (2001), è la seguente: se N ≥ casi 1 cifra decimale se N ≥ casi 2 cifre decimali Arrotondamenti corretti: da 0 a 4  arrotondamento per difetto (16,73  16,7) da 6 a 9  arrotondamento per eccesso (34,27  34,3) se 5  controllare il decimale successivo (se 16,75 è arr. di 16,752  16,8; se 16, 75 è arr. di 16,748  16,7; se 16,75 non è arr.  arrotondamento sia per eccesso che per difetto) Usare con cautela: la decisione è da prendere sempre a seconda dei casi; evitare comunque di usare troppi decimali

8 Analisi monovariata: tabelle - 2
Ricordarsi sempre di intestare la tabella e di inserire la fonte o, se i dati sono stati raccolti autonomamente, la domanda corrispondente ordine delle modalità: V. nominali: libera scelta, a seconda delle necessità di presentazione (es. frequenze decrescenti) V. ordinali: utilizzare l’ordine delle modalità (es. tab. 1 – NO freq. decrescenti) V. cardinali: molte modalità, sintesi necessaria  raggruppamento di valori Tabella 1 – intestazione (es. titolo di studio) Modalità % Senza titolo 2,5 Lic. elementare 42,4 Licenza media 28,5 Diploma 22,0 Laurea 4,6 Totale 100,0 (N=1.200) Fonte o, se survey, domanda del questionario Modalità % 20 anni 2,7 21 anni 22 anni 2,9 23 anni 3,0 24 anni 3,4 Modalità % 20-24 anni 14,7 25-29 anni 20,9 30-34 anni 30,5 35-39 anni 33,9 Totale 100,0 (N= ) Fonte: demo.istat.it – Milano 2007

9 Analisi monovariata: grafici - 1
Presentazione grafica delle distribuzioni di frequenza: Le rappresentazioni grafiche sono molteplici. Esse non veicolano informazioni aggiuntive rispetto alle tabelle (spesso è, anzi, il contrario), ma hanno maggiore impatto comunicativo, soprattutto verso un target con scarse competenze “numeriche”. Prima di procedere alla creazione di un grafico, è necessario conoscere il tipo di variabile che si vuole rappresentare: nominale, ordinale o cardinale. Ogni tipo di variabile può essere rappresentata solo con alcune forme di grafici; in caso contrario si corre il rischio di veicolare informazioni fuorvianti, se non addirittura scorrette. Le rappresentazioni grafiche si dividono in due famiglie: le rappresentazioni lineari e le rappresentazioni circolari. Ogni famiglia ha pregi e difetti, da valutare caso per caso.

10 Analisi monovariata: grafici - 2
Rappresentazioni grafiche lineari – diagrammi a barre Vantaggi: sono semplici da disegnare consentono un’agevole comparazione tra le frequenze delle varie modalità sottolineano l’autonomia semantica delle modalità Svantaggi: è difficile comparare una singola modalità con l’intera distribuzione difficile aggregazione ad “occhio” di categorie adiacenti (es. cattolico + protestante) (NON con variabili ordinali perché le barre distanti non danno l’idea che ci sia una continuità tra le modalità, come accade invece con le variabili ordinali – meglio l’istogramma). Variabili nominali

11 Analisi monovariata: grafici - 3
Rappresentazioni grafiche lineari – istogramma Vantaggi: è semplice da disegnare facilita la comparazione tra frequenze di categorie contigue è possibile utilizzare anche con variabili cardinali ricodificate (es. classi di età) Svantaggi: suggerisce un ordine tra le categorie, tale da renderlo poco utile per rappresentare variabili con forte autonomia semantica delle categorie (nominali) difficile definire il rapporto tra una modalità e l’intera distribuzione Variabili ordinali e cardinali (ricodificate)

12


Scaricare ppt "Analisi monovariata: frequenze"

Presentazioni simili


Annunci Google