Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.

Slides:



Advertisements
Presentazioni simili
LA MEDIA STATISTICA di Zappa Giacomo.
Advertisements

- le Medie la Moda la Mediana
I numeri naturali ….. Definizione e caratteristiche
SCALA INTERVALLO / A RAPPORTO
2. Introduzione alla probabilità
____________________
QUANTILI.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
“Teoria e metodi della ricerca sociale e organizzativa”
Le misure di tendenza centrale informano sul centro della distribuzione 4 - Le medie a.a Le medie a.a
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Variabilità Variabilità: inevitabile fluttuazione dei fenomeni naturali, fisici, sociali ecc le indicazioni fornite dalle misure di tendenza centrale (media.
Lez. 3 - Gli Indici di VARIABILITA’
Analisi preliminari dei dati
esponente del radicando
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Calcolo della mediana per un carattere quantitativo suddiviso in classi Il valore della funzione di ripartizione calcolato in x=Me è pari a 0,5 esempio:
Elementi di Statistica
Inferenza statistica per un singolo campione
Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie di analisi.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
COSA VUOL DIRE FARE STATISTICA
Misure di posizione Gli indici di posizione servono per individuare la tendenza centrale del fenomeno studiato. I più utilizzati sono: Moda Mediana Quartili,
NUMERI RELATIVI.
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
SNV a.s Servizio di valutazione del sistema dellistruzione Incontro provinciale di coordinamento organizzativo a cura del CSA di Treviso Novembre.
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Pedagogia sperimentale
Mediana Punto che lascia il 50 % dei casi alla sua destra e il 50% dei casi alla sua sinistra Esempio: 8, 9, 10, 11, 15, 6, 7 Mettere le misure in ordine.
I numeri interi relativi
Indici di posizione Mediana e quantili. x 50% Mediana.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Di Capuano,Colucci e Panunzi Valori medi I valori medi.
LA SINTESI STATISTICA Una serie di dati numerici è
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Orientamento universitario
MEDIE STATISTICHE.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
Bando Pittori e Scultori in Piemonte alla metà del ‘700
Teoria della probabilità
Statistica La statistica è
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
COSA VUOL DIRE FARE STATISTICA
Martina Serafini Martina Prandi
Marta Pinto Stefania Serra Valentina Paravidino
STATISTICHE DESCRITTIVE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
ANALISI E INTERPRETAZIONE DATI
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Statistica sociale Modulo A A.A Prof.ssa Barbara Baldazzi Dottore Mario Mastrangelo Facoltà di Lettere e Filosofia Università di Tor Vergata.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
DEFINIZIONE. La statistica è la disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del.
Transcript della presentazione:

Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita e rappresenta nel modo più corretto l’insieme dei dati osservati

Indice di sintesi deve essere compresa tra il dato più piccolo ed il dato più elevato della distribuzione x1 ≤ sintesi ≤ xn deve identificarsi con i valori più frequenti sono localizzati al centro della distribuzione indici di “tendenza centrale”

Indici di sintesi: medie analitiche: il calcolo richiede operazioni algebriche su tutti i valori del carattere dati quantitativi indici di posizione: il calcolo non considera tutti i valori ma solo la loro posizione tutti i tipi di dati

MEDIA ARITMETICA Calcolabile per dati quantitativi continui

Esempio sulla media aritmentica Peso di un campione di n=60 casse di legno presenti in porto da caricare su nave merci 19, 29, 15, 20, 20, 17, 25, 15, 26, 25, 17, 21, 22, 25, 26, 17, 19, 21, 22, 24, 23, 19, 20, 21, 26, 26, 24, 19, 20, 24, 24, 25, 26, 25, 19, 19, 25, 19, 26, 19, 20, 20, 25, 26, 24, 24, 20, 20, 26, 26, 20, 24, 20, 24, 24, 26, 24, 24, 26, 24 Somma delle x = 1341 Media = 1341/60 = 22.35 Kg

INDICI DI POSIZIONE forniscono indicazioni sulla tendenza centrale di una distribuzione, senza ricorrere all’elaborazione di tutti i dati sono utilizzabili: per i dati qualitativi ordinali per i dati quantitativi

MODA è quel valore che corrisponde alla massima frequenza del fenomeno può essere utilizzata: per dati qualitativi per dati quantitativi discreti per dati quantitativi continui ma divisi in classi non prende in considerazione i dati relativi ad un carattere, ma le frequenze con cui i dati del carattere osservato si presentano (nessuna operazione algebrica)

Numero di viaggi negli ultimi 5 anni Esempio: Numero di viaggi negli ultimi 5 anni F 1 2 5 3 4 Totale 13

MEDIANA valore che occupa la posizione centrale utilizzata quando: dati qualitativi, oppure quantitativi ordinati in senso crescente o decrescente Valori anomali valore che occupa la posizione centrale divide in due parti uguali la distribuzione il 50% dei dati sono di valore superiore a quello della mediana ed il 50% di valore inferiore

Mediana Se N è dispari Se N è pari Calcolo: Se N è dispari Mediana = dato che occupa la posizione (N+1)/2 tale che la metà dei valori è rispettivamente maggiore e minore rispetto al valore della mediana Se N è pari Mediana = dati nella posizione N/2 ed ( N /2 ) + 1* * nel caso in cui i dati siano quantitativi, la mediana è data dalla media dei due valori centrali della distribuzione

Esempio: Autotrasportatori che alloggiano in albergo

Quantili QUANTILI: valori che dividono la distribuzione in parti uguali Assumono denominazioni diverse a seconda del numero di parti in cui suddividono l’insieme delle unità ordinate per grandezza QUARTILI: valori per cui una distribuzione, ordinata in senso crescente, risulta suddivisa in 4 parti uguali Il primo quartile (Q1) è quel valore che lascia a sinistra il 25% della distribuzione ed il 75% a destra Il secondo quartile (Q2) corrisponde con la mediana e lascia destra ed a sinistra il 50% dei dati; Il terzo quartile (Q3), è quel valore che lascia a destra il 25% della distribuzione ed il 75% a sinistra CENTILI: In una distribuzione si calcola la distribuzione cumulativa della frequenza relativa per una certa variabile X. Il valore xi che separa l’1% delle osservazioni è chiamato primo centile, il valore xi che separa il 2% delle osservazioni è il secondo centile e così via. Il 500 centile corrisponde alla mediana della distribuzione

Box-Whisker plot mediana (50° percentile) 75° percentile minimo massimo

Distribuzione Simmetrica μ = Me = Mo

Distribuzione con asimmetria positiva Mo < Me < μ

Distribuzione con asimmetria negativa μ < Me < Mo

Simmetria e Asimmetria Se la distribuzione è simmetrica μ = Me = Mo Se μ = Me = Mo la distribuzione è simmetrica La condizione dell’uguaglianza delle tre misure è necessaria, ma non sufficiente, a garantire la simmetria di una distribuzione infatti, data la seguente distribuzione: 4, 16, 20, 20, 20, 30, 30 media = 20 mediana = 20 moda =20 la distribuzione è asimmetrica!!!