Misurare la diversità Alessandro Giuliani. La diversità può essere definita solo in riferimento ad una popolazione e per quanto riguarda una misura dotata.

Slides:



Advertisements
Presentazioni simili
Le distribuzioni di probabilità continue
Advertisements

Il linguaggio della statistica
Il senso dei dati: Elaborazione e Interpretazione.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
L’Analisi Fattoriale (PCA) con SPSS
Fisica 1 Termodinamica 9a lezione.
Variabili casuali a più dimensioni
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
LA STATISTICA By prof. Pietro Rossi.
Il concetto di misura.
Seminario sostitutivo dello stage
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi di Ensemble Metaclassificatori.
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
La distribuzione normale e normale standardizzata
Obiettivi del corso di Statistica Medica.
Analisi della varianza (a una via)
Introduzione alla statistica per la ricerca Lezione I
Distribuzioni di probabilità
Appunti di inferenza per farmacisti
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
STATISTICA a.a LA STATISTICA INFERENZIALE
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
Lezioni per Insegnanti mod. 2 prof. Giovanni Raho I metodi della ricerca sociale Lezioni per il corso S. I. S. S. Anno 2004 mod. 2.
Lezioni per Insegnanti mod 4 Prof. Giovanni Raho 1 I metodi della ricerca sociale Corso S. I. S. S Mod. 4.
Statistica sociale Modulo A
Complementi al Corso di Ecologia - Approfondimenti di statistica
Misurazione Le osservazioni si esprimono in forma di misurazioni
Gli strumenti della misurazione
Cai Lin Lin Michela & Guidetti Emanuela presentano:
METODI E CONTROLLI STATISTICI DI PROCESSO
C ONCETTI B ASE DI S TATISTICA. C ONCETTI BASE DI S TATISTICA WWW. CENTROSTUDIGORGIA. COM La statistica studia i fenomeni ripetibili del mondo con determinazione.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Associazione tra due variabili
TRATTAMENTO DEI DATI ANALITICI
STATISTICA La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di un "collettivo". Studia i modi (descritti attraverso formule.
Le diverse facce dell‘Entropia (S)
TEMPERATURA E DILATAZIONE TERMICA Lezione n.1 – classi SECONDE –Fisica ITI «Torricelli» –S.Agata M.llo (ME) Prof. Carmelo Peri W.T.Kelvin A.Celsius.
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
C. Volendo organizzare attività, seminari ed incontri per la settimana dello studente, il comitato organizzatore affida alla classe I F un monitoraggio.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
accertamento e valutazione degli esiti di apprendimento
Statistica La statistica è
La statistica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Accenni di analisi monovariata e bivariata
“Teoria e metodi della ricerca sociale e organizzativa”
ORIENTAMENTO CONSAPEVOLE
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Studio fenomeni collettivi
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Elementi di statistica e probabilità Misure Meccaniche e Termiche - Università di Cassino 2 Eventi aleatori e deterministici Un evento aleatorio può.
Corso di Statistica Applicata C. L. in Tecnologie forestali e ambientali 4 crediti (32 ore) Docente: Lorenzo Marini DAFNAE, Università di Padova
Gli strumenti di misura
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
Introduzione all’inferenza
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Misurare la diversità Alessandro Giuliani

La diversità può essere definita solo in riferimento ad una popolazione e per quanto riguarda una misura dotata di variabilità, che può cioè assumere diversi valori in diversi individui La quantificazione della diversità è quindi un problema statistico

La statistica deriva dalla confluenza della sapienza sviluppata dagli esseri umani in relazione a due problemi differenti: 1.Lo sviluppo di numeri indice che riassumano le caratteristiche rilevanti di una popolazione (censimenti, statistica descrittiva). 2.Prendere decisioni in condizione di incertezza calcolando delle probabilità per diversi esiti (gioco d’azzardo, statistica inferenziale)

mondo misura compressore Ogni misura implica una scelta ben definita di prospettiva, solo alcune caratteristiche dell’oggetto vengono prese in considerazione, oggetti, eventi diversi, dopo l’atto della misura risultano indistinguibili.

Una misura consiste in un insieme di regole che mi consente di assegnare univocamente, ad un certo evento (campione di sangue, ratto, volume d’aria..) un valore Questo valore deve essere tale da consentirmi di stabilire una metrica, cioè di dire se l’evento A è più simile all’evento B o all’evento C. D(a,b) = SQRT [ (X(a)-X(b)) 2 + (Y(a) – Y(b)) 2 ]

Matrici di dati nome Eta’AbitazioneRedditoSessoLavoro Mario23120AMLib. Prof. Vanda5680BFCas. Pietro72100MMPens. Luca38130MMImp. Pina1860BFStud Lucia2575MFImp. Tonino4262BMOp. Andrea58100BMContad. Virginia3480AFLib. Prof.

Per la costruzione di una misura posso fare affidamento su un fenomeno fisico Come ad esempio la dilatazione termica (termometri) o la forza di gravità (bilance)...oppure posso immaginare un punteggio basato sulla risposta ad una serie di domande (es. cartella delle tasse, test psicologici..). In ogni caso le mie misure non saranno mai la cosa in sé, ma dei ‘proxy’ cioè qualcosa che ha a che vedere con qualcosa di misterioso che ne garantisce il senso in modo a noi ignoto.

Classi di misure Scala intervallare : le differenze hanno significato quantitativo Scala ordinale: l’ordinamento e’ affidabile, l’entita’ dei distacchi no Scala qualitativa: dati di categoria, e’ affidabile solo l’assegnazione alle classi Scala intervallare: temperature, pressioni, altezze, peso Scala ordinale: voti scolastici, classifica campionato Scala qualitativa: colore dei capelli, attivita’ lavorativa

E (X) =  (X(i))/N ) : Media, indice di locazione SD (X) =   (X(i)) – E(X)) 2 / N: Deviazione standard, indice di diversità

ES = Std.Dev. /  N (3)

Quanto differiscono tra loro le medie dei campioni ? Tanto piu’ grandi i campioni, tanto piu’ simili fra di loro (legge dei grandi numeri) Da non confondere con la variabilita’ naturale tra soggetti.

Il modello uniforme Il modello normale

La quantita’ di informazione derivabile da una misura dipende dalla sua distribuzione in frequenza Entropia =  p(i)lg (p(i))

Una tabella di contingenza rappresenta una correlazione ******************* ****************** ******************* * * * ****************** ******************* ANon A B Non B

Il calcolo dell’entropia (o indice di mutabilità) si basa sulla divisione della popolazione in classi di cui si calcola la frequenza relativa. La massima diversità (entropia) corrisponde alla distribuzione uniforme: tutte le classi sono equiprobabili, la mia incertezza nel collocare un oggetto sconosciuto nella sua classe di appartenenza è massima. Massima è quindi l’informazione che posso immagazzinare in una codifica dotata di elevata entropia.

Codifica: scegliere una dimensione privilegiata di interpretazione

La distribuzione di idrofobicità della proteina P53, la mancanza di un ordine prestabilito nella distribuzionespaziale di idrofobicità (elevata entropia), consente alla proteina di veicolare grandi quantità di informazione

Il confronto del grado relativo di ‘diversità’ di due insiemi, insomma la decisione se l’ambiente A ha un maggiore grado di biodiversità dell’insieme B o se il paziente A ha un maggiore grado di variabilità del paziente B relativo al battito cardiaco, ci costringe a prendere delle decisioni esplicite sullo stato delle cose. Queste decisioni vanno sotto il nome generico di STANDARDIZZAZIONE

Due insiemi A e B, chi è il più variabile ? A: 10, 20, 30 B: 1, 2, 3

Due distribuzioni C e D, chi ha più entropia ? c1 c2 c3 C: d1 d2 d3 d4 D:

La scelta di una misura piuttosto di un’ altra, di cosa diamo per ‘già dato’ e quindi irrilevante, da normalizzare o da considerare esplicitamente, influenza il nostro giudizio di diversità. Non esistono misure neutre, esistono però misure oneste.