La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

ANALISI DATI ANTROPOMENTRICI

Presentazioni simili


Presentazione sul tema: "ANALISI DATI ANTROPOMENTRICI"— Transcript della presentazione:

1 ANALISI DATI ANTROPOMENTRICI
ESERCITAZIONE ANALISI DATI ANTROPOMENTRICI

2 INTRODUZIONE Statistica
È una raccolta di metodi e strumenti matematici atti ad organizzare una o più serie di dati che descrivono una categoria di fatti È la scienza che studia i fenomeni collettivi o di massa. Esempi: numero di componenti delle famiglie di una data area geografica, l’età dei cittadini di un certo paese, la lunghezza delle foglie di un tipo di pianta, la durata delle lampadine di una certa marca,… Insegna a individuare i modi in cui un fenomeno si manifesta, a descriverlo sinteticamente e a trarne da esso conclusioni più generali di fenomeni più ampi

3 INDAGINE STATISTICA INDAGINE STATISTICA Sull’ intera popolazione
(es: censimento sulle famiglie italiane) STATISTICA DESCRITTIVA Trarre indicazioni sull’intera popolazione (descrivere il fenomeno) Su un campione della popolazione statistica (indagine campionaria) STATISTICA INDUTTIVA Trarre indicazioni dal campione che siano valide per l’intera popolazione

4 Statistica descrittiva
INDAGINE STATISTICA Popolazione Campione Statistica induttiva (inferenze) Parametri Statistica descrittiva

5 POPOLAZIONE, UNITÀ, CAMPIONE
Popolazione statistica: insieme degli elementi a cui si riferisce l’indagine statistica: opinione degli americani riguardo una nuova elezione presidenziale: tutti i cittadini USA. geni sovra-espressi nelle persone che soffrono di obesità: tutte le persone obese Unità statistica: ogni elemento della popolazione statistica, la minima unità della quale si raccolgono i dati: Un cittadino, una persona obesa…. Campione statistico (sample): un qualsiasi insieme di unità statistiche prese da tutta la popolazione. Un campione è dunque un sottoinsieme di misurazioni selezionate dalla popolazione 50 persone con problemi di obesità (estratte a caso).

6 VARIABILI VARIABILE CASUALE
variabile casuale: Il fenomeno collettivo che si presenta secondo modalità diverse nelle varie unità statistiche osservazione: Il valore assunto dalla variabile casuale in una data unità statistica Esempio: variabile casuale: livello di espressione del gene AAA; osservazione: il gene AAA della persona X ha un livello di espressione pari a 12.3, il gene AAA della persona Y ha un livello di espressione di 10.2, il gene AAA della persona Z….

7 VARIABILI Variabile quantitativa: quando assume valori numerici
Continua: assume valori continui in un intervallo (peso e statura di una persona, livelli di intensità dei campioni su microarray, livello di espressione genica, etc.) Discreta: assume valori discreti come numero di campioni, numero di geni sovra-espresso, numero di pazienti, etc. Variabile qualitativa: quando assume valori non numerici Ordinale: i dati sono in un ordine, come ad esempio la top ten degli artisti musicali Categorica: uomo/donna, basso/medio/alto, fenotipo, gruppi di pazienti malati/sani, etc.

8 VARIABILI I dati codificati di una rilevazione statistica effettuata su n unità statistiche con riferimento a p variabili, vengono raccolti in una tabella che viene chiamata “matrice dei dati” ANAGRAFICA CEFALOMETRIA TESTA NASO Turno Codice Età Sesso Lunghezza Larghezza Circonferenza 1 EA_1_1 22 M 19.6 15 56 5.8 3.2 EA_1_2 23 F 18.5 14.5 55 5 3.5 EA_1_3 25 21 15.1 58.8 5.7 3.4 EA_1_4 20.3 16.5 57.2 5.2 3.3 Righe: Unità statistiche Colonne: variabili

9 ANALISI DATI La matrice dei dati contiene tutte le informazioni analitiche di ciascuna unità statistica Quando i dati sono molti, l’analisi diretta della matrice non consente di cogliere in via immediata gli aspetti salienti del fenomeno Occorre perciò ottenere una sintesi attraverso un’elaborazione statistica dei dati Per sintetizzare una certa caratteristica INDICI STATISTICI Per confrontare situazioni differenti

10 ANALISI DATI INDICI STATISTICI Tendenza centrale Dispersione Forma
Media Mediana Moda Quantili Percentili Dispersione Campo di variazione Scarto medio assoluto Varianza Deviazione standard Coefficiente di variazione Forma Coefficiente di asimmetria Coefficiente di curtosi

11 ANALISI DATI INDICI DI TENDENZA CENTRALE Un indice di tendenza centrale è lo scalare che esprime sinteticamente come si è manifestata la proprietà in esame nel campione considerato. Può essere visto come il valore che meglio rappresenta una distribuzione Es. il valore più frequente, oppure il valore che occupa una posizione intermedia nella distribuzione. Indici analizzati: MEDIA MEDIANA MODA

12 ANALISI DATI INDICI DI TENDENZA CENTRALE
MEDIA - somma di tutti i valori delle variabili della popolazione diviso il numero di unità della popolazione (N) o campione (n)

13 ANALISI DATI INDICI DI TENDENZA CENTRALE
MEDIANA - valore che occupa la posizione centrale in un insieme ordinato di dati E’ una misura robusta, in quanto poco influenzata dalla presenza di dati anomali Caratteristiche: si ricorre al suo uso quando si vuole attenuare l'effetto di valori estremi; in una distribuzione o serie di dati, ogni valore estratto a caso ha la stessa probabilità di essere inferiore o superiore alla mediana

14 ANALISI DATI INDICI DI TENDENZA CENTRALE
Per calcolare la mediana di un gruppo di dati, bisogna: disporre i valori in ordine crescente oppure decrescente e contare il numero totale n di dati; 2. se il numero (n) di dati è dispari, la mediana corrisponde al valore numerico del dato centrale, quello che occupa la posizione (n+1)/2; 3. se il numero (n) di dati è pari, la mediana è stimata utilizzando i due valori centrali che occupano le posizioni n/2 e n/2+1: con poche osservazioni, come mediana viene assunta la media aritmetica di queste due osservazioni intermedie; con molte osservazioni raggruppate in classi, si ricorre talvolta alle proporzioni

15 ANALISI DATI INDICI DI TENDENZA CENTRALE
MODA - il valore più frequente di una distribuzione, o meglio, la modalità più ricorrente della variabile (cioè quelle a cui corrisponde la frequenza più elevata) Caratteristiche: viene utilizzata solamente a scopi descrittivi, perché è meno stabile e meno oggettiva delle altre misure di tendenza centrale. Per individuare la moda di una distribuzione si possono usare gli istogrammi Può differire nella stessa serie di dati, quando si formano classi di distribuzione (intervalli) con ampiezza differente. Per individuare la moda entro una classe di frequenza, non conoscendo come i dati sono distribuiti, si ricorre all'ipotesi della ripartizione uniforme

16 ANALISI DATI

17 ANALISI DATI INDICI DI DISPERSIONE - VARIANZA
Varianza della popolazione: misura che caratterizza la variabilità di una popolazione (N) o campione (n) Quando n è grande le differenze tra i valori di varianza sono minime; quando n è piccolo, le differenze sono sensibili

18 ANALISI DATI INDICI DI DISPERSIONE – DEVIAZIONE STANDARD
La varianza ha lo svantaggio di essere una grandezza quadratica e quindi non direttamente confrontabile con la media o con gli altri valori della distribuzione Per trovare una misura espressa nella stessa unità di misura della variabile di partenza è sufficiente estrarre la radice quadrata della varianza. La deviazione standard è una misura di distanza dalla media e quindi ha sempre un valore positivo E' una misura della dispersione della variabile casuale intorno alla media Può essere considerato come un errore da associare al valore medio

19 ANALISI DATI INDICI DI DISPERSIONE – DEVIAZIONE STANDARD

20 ANALISI DATI ANTROPOMETRICI
Due matrici di dati Dati studenti antropologia Dati militari americani Due livelli di analisi Tra gli studenti Tra studenti e militari Statistiche descrittive (generali e tra gruppi: turni – Sesso) Tendenza centrale: Media – mediana – moda Dispersione: varianza – deviazione standard Statistiche descrittive tra gruppi Tendenza centrale: Media – mediana – moda Dispersione: varianza – deviazione standard

21 ANALISI DATI ANTROPOMETRICI
Grafici Istogrammi + barre di errore Distribuzioni Box-plot

22 ANALISI DATI ANTROPOMETRICI
BOX PLOT (diagramma a scatole e baffi) È un metodo per rappresentare una distribuzione statistica i quartili sono quei valori che ripartiscono la popolazione in quattro parti di uguale numerosità MAT 0.995 COM LEC COS 0.994 AQU 0.993 AVI 0.990 BNV 0.989 PIC 0.988 TVA ORI 0.986 PIL 0.983 VIC 0.981 CAS 0.979 TER 0.978 CMB 0.977 BOZ 0.976 CAD NSA BRE 0.973 TRE 0.969 CUN 0.963 SPZ 0.962 SGL 0.926 UDI 0.903 Media Q3=0.989 Media Q2=0.980 Media Q1=0.975 outliers Metodo dell'interquartile

23 ANALISI DATI ANTROPOMETRICI
Indici antropometrici Cefalico =(larghezza/lunghezza)x100 Nasale= (larghezza/lunghezza)x100 Larghezza delle spalle=(larghezza biacromiale/statura)x100 Larghezza del bacino=(larghezza bicristale/statura)x100 Acromion-iliaco=(larghezza bacino/larghezza spalle)x100 Corporatura=statura (in cm) / circ. del polso (in cm)

24 ANALISI DATI ANTROPOMETRICI
Formule Excel Media: =MEDIA(intervallo dati) Mediana: =MEDIANA(intervallo dati) Moda: =MODA.SNGL (intervallo dati) Varianza: =VAR.C(intervallo dati) Deviazione standard: =DEV.ST.C(intervallo dati)


Scaricare ppt "ANALISI DATI ANTROPOMENTRICI"

Presentazioni simili


Annunci Google