Analisi monovariata: frequenze

Slides:



Advertisements
Presentazioni simili
Analisi monovariata: frequenze
Advertisements

L’analisi monovariata
© 2015 Giorgio Porcu - Aggiornamennto 01/12/2015 I STITUTO T ECNICO SECONDO BIENNIO T ECNOLOGIE E P ROGETTAZIONE Rappresentazione dell’ Informazione Sistemi.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Fondamenti di Informatica A - Massimo Bertozzi LE RAPPRESENTAZIONI CONCATENATE.
1 Corso di Analisi Statistica per le Imprese Rappresentazione dei dati Prof. L. Neri a.a
Organizzazione dei dati AnnoQ [m 3 /s]
Il trattamento statistico dei dati
Statistica I Grafici Seconda Parte.
LA STATISTICA DESCRITTIVA
ESERCITAZIONE RIEPILOGO di Statistica Descrittiva
DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE
Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap
Analisi dei Dati – Tabelle e Grafici
Variabili casuali a più dimensioni
Il trattamento statistico dei dati
EasyGraph Dynamic web-based dashboard
PEDAGOGIA SPERIMENTALE
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
L’analisi monovariata
L’analisi del comportamento delle imprese (seconda parte)
Cluster Analysis Definizione di Classificazione: operazione concettuale condotta adottando un solo criterio (detto fondamento della divisione) per individuare.
La frazione come numero razionale assoluto
Confronto tra diversi soggetti:
Accenni di analisi monovariata e bivariata
Introduzione a Statistica e Probabilità
La Statistica si occupa dei modi
Misurazione Raccolta sistematica e organizzata di elementi per
Misurazione Raccolta sistematica e organizzata di elementi per
Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill
Misurazione Raccolta sistematica e organizzata di elementi per
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Esercizio 1 Questi sono i punteggi dei soggetti ad un questionario sulla depressione: Costruire una tabella di frequenza,
Esercitazione di Statistica Economica
Statistica descrittiva bivariata
L’analisi monovariata
I 7 strumenti della qualità
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Esercitazione di Statistica Economica
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese Rappresentazione dei dati
Organizzazione dei dati
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Elaborazione statistica di dati
Esercitazioni psicometria
Statistica descrittiva
Statistica Scienza che studia i fenomeni collettivi.
Misurazione Raccolta sistematica e organizzata di elementi per
Confronto tra diversi soggetti:
Statistica.
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
PEDAGOGIA SPERIMENTALE
CEI – Ufficio nazionale per la pastorale della Famiglia CISF – Centro Internazionale Studi Famiglia LA PREPARAZIONE DEI FIDANZATI AL MATRIMONIO E ALLA.
Ricorsione 16/01/2019 package.
© 2007 SEI-Società Editrice Internazionale, Apogeo
Raccolta sistematica e organizzata di elementi per
ANALISI DI REGRESSIONE
Riduzione dei Dati.
SCALE DI MISURA CARATTERI QUALITATIVI CARATTERI QUANTITATIVI
Precorso di Statistica per le Lauree Magistrali
Compito 1: La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: Costruire una tabella di frequenza, indicando: f, fc, %, %c.
Misurazione Raccolta sistematica e organizzata di elementi per
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Statistica descrittiva bivariata
EserciZI di Statistica
Transcript della presentazione:

Analisi monovariata: frequenze Analisi monovariata: insieme di tecniche che prendono in considerazione una sola variabile alla volta. Essa è il punto di partenza per tutte le analisi dei dati Il punto di partenza dell’analisi monovariata è la distribuzione di frequenza, ossia ad ogni modalità della variabile viene associata la frequenza con cui essa si presenta nella matrice-dati. Distribuzione di frequenza della variabile sesso Modalità Frequenza Maschio 325 Femmina 254 Totale 579

Analisi monovariata: frequenze Esistono due tipi diversi di frequenze: le frequenze assolute e le frequenze relative Le frequenze assolute (tabella precedente) consistono nel semplice conteggio del numero di casi che presentano lo stesso valore (modalità), per la variabile prescelta. Generalmente le F.A. sono di difficile interpretazione, poiché non ci permettono di cogliere l’incidenza delle singole modalità sull’intera distribuzione della variabile (posso conoscere il numero di persone di sesso maschile, ma se non metto in relazione tale numero con il totale dei casi non posso affermare alcunché). Per questi motivi è più utile ricorrere alle frequenze relative, ossia quel tipo di frequenze che permette di annullare l’effetto della numerosità dei casi.

Analisi monovariata: frequenze relative Le frequenze relative si suddividono in quattro tipi: proporzioni, frequenze percentuali, cumulate, retro-cumulate. A seconda del tipo di variabile da analizzare, sarà possibile utilizzare parte o tutti i tipi di frequenze relative. Per tutte le variabili (nominali, ordinali e cardinali) è possibile calcolare: proporzione: frequenza assoluta numero totale dei casi frequenza percentuale: frequenza assoluta X 100

Analisi monovariata: frequenze relative - 2 Esempio: Modalità Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza media 342 0,285 28,5 Diploma 264 0,220 22,0 Laurea 55 0,046 4,6 Totale 1.200 1 100,0

Analisi monovariata: frequenze relative -3 Se le variabili sono ordinali è possibile calcolare anche le percentuali cumulate e retro-cumulate. La frequenza cumulata relativa a una categoria indica quale numero (o percentuale) di casi non arriva alla categoria successiva o oltre; La frequenza retro-cumulata relativa a una categoria indica quale numero (o percentuale) di casi arriva a quella categoria o alle successive (cioè più alte nell’ordine) (Marradi, 2002).

Analisi monovariata: frequenze relative - 4 Esempio: Modalità Frequenze assolute Frequenze relative Percentuali Cumulate Retro-cumulate Senza titolo 30 2,5 100,0 Lic. elementare 509 42,4 44,9 97,5 Licenza media 342 28,5 73,4 55,1 Diploma 264 22,0 95,4 26,6 Laurea 55 4,6 Totale 1.200 Interpretazione: “gli individui che al massimo hanno la licenza media sono il 73,4%” “gli individui che hanno almeno il diploma sono il 26,6%”

Analisi monovariata: tabelle - 1 Presentazione tabellare delle distribuzioni di frequenza: Parsimonia: inserire solo le informazioni indispensabili (indicare solo un tipo di frequenza (assoluta, relativa, percentuale, etc…) Numerosità dei casi: nel caso si utilizzino le frequenze percentuali (più usate) è necessario indicare il numero complessivo dei casi in valore assoluto (N) Utilità delle percentuali: non usare le frequenze percentuali se N è minore di 50 casi (riportare le percentuali se si vuole comparare più distribuzioni di frequenza) Fallacy of the misplaced precision: evitare la tendenza a riportare percentuali con un numero eccessivo di decimali, ma riportare solo quelli strettamente necessari. Una possibile regola, suggerita da Marradi (2001), è la seguente: se N ≥ 1.000 casi 1 cifra decimale se N ≥ 10.000 casi 2 cifre decimali Arrotondamenti corretti: da 0 a 4  arrotondamento per difetto (16,73  16,7) da 6 a 9  arrotondamento per eccesso (34,27  34,3) se 5  controllare il decimale successivo (se 16,75 è arr. di 16,752  16,8; se 16, 75 è arr. di 16,748  16,7; se 16,75 non è arr.  arrotondamento sia per eccesso che per difetto) Usare con cautela: la decisione è da prendere sempre a seconda dei casi; evitare comunque di usare troppi decimali

Analisi monovariata: tabelle - 2 Ricordarsi sempre di intestare la tabella e di inserire la fonte o, se i dati sono stati raccolti autonomamente, la domanda corrispondente ordine delle modalità: V. nominali: libera scelta, a seconda delle necessità di presentazione (es. frequenze decrescenti) V. ordinali: utilizzare l’ordine delle modalità (es. tab. 1 – NO freq. decrescenti) V. cardinali: molte modalità, sintesi necessaria  raggruppamento di valori Tabella 1 – intestazione (es. titolo di studio) Modalità % Senza titolo 2,5 Lic. elementare 42,4 Licenza media 28,5 Diploma 22,0 Laurea 4,6 Totale 100,0 (N=1.200) Fonte o, se survey, domanda del questionario Modalità % 20 anni 2,7 21 anni 22 anni 2,9 23 anni 3,0 24 anni 3,4 … Modalità % 20-24 anni 14,7 25-29 anni 20,9 30-34 anni 30,5 35-39 anni 33,9 Totale 100,0 (N=343.647) Fonte: demo.istat.it – Milano 2007

Analisi monovariata: grafici - 1 Presentazione grafica delle distribuzioni di frequenza: Le rappresentazioni grafiche sono molteplici. Esse non veicolano informazioni aggiuntive rispetto alle tabelle (spesso è, anzi, il contrario), ma hanno maggiore impatto comunicativo, soprattutto verso un target con scarse competenze “numeriche”. Prima di procedere alla creazione di un grafico, è necessario conoscere il tipo di variabile che si vuole rappresentare: nominale, ordinale o cardinale. Ogni tipo di variabile può essere rappresentata solo con alcune forme di grafici; in caso contrario si corre il rischio di veicolare informazioni fuorvianti, se non addirittura scorrette. Le rappresentazioni grafiche si dividono in due famiglie: le rappresentazioni lineari e le rappresentazioni circolari. Ogni famiglia ha pregi e difetti, da valutare caso per caso.

Analisi monovariata: grafici - 2 Rappresentazioni grafiche lineari – diagrammi a barre Vantaggi: sono semplici da disegnare consentono un’agevole comparazione tra le frequenze delle varie modalità sottolineano l’autonomia semantica delle modalità Svantaggi: è difficile comparare una singola modalità con l’intera distribuzione difficile aggregazione ad “occhio” di categorie adiacenti (es. cattolico + protestante) (NON con variabili ordinali perché le barre distanti non danno l’idea che ci sia una continuità tra le modalità, come accade invece con le variabili ordinali – meglio l’istogramma). Variabili nominali

Analisi monovariata: grafici - 3 Rappresentazioni grafiche lineari – istogramma Vantaggi: è semplice da disegnare facilita la comparazione tra frequenze di categorie contigue è possibile utilizzare anche con variabili cardinali ricodificate (es. classi di età) Svantaggi: suggerisce un ordine tra le categorie, tale da renderlo poco utile per rappresentare variabili con forte autonomia semantica delle categorie (nominali) difficile definire il rapporto tra una modalità e l’intera distribuzione Variabili ordinali e cardinali (ricodificate)