Test basati su permutazioni (MCPP)

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
I dati Carta di Controllo p (I Fase) Numero di Campioni 25
Le distribuzioni di probabilità continue
Valutazione d’Istituto A.S. 2008/2009
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Laboratorio Processi Stocastici
LA VARIABILITA’ IV lezione di Statistica Medica.
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Intervalli di confidenza
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
COORDINATE POLARI Sia P ha coordinate cartesiane
6. Catene di Markov a tempo continuo (CMTC)
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
2.VARIABILI CONTINUE A. Federico ENEA; Fondazione Ugo Bordoni Scuola estiva di fonetica forense Soriano al Cimino 17 – 21 settembre 2007.
Il contesto abitanti dipendenti dirigenti 164
Variabili casuali a più dimensioni
Fondamenti della Misurazione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
ANALISI DELLA COVARIANZA
6. Catene di Markov a tempo continuo (CMTC)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Fogli elettronici Microsoft Excel.
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Capitolo 9 I numeri indici
Disegno del modello di analisi dei dati sperimentali
Obiettivi del corso di Statistica Medica.
Processi Aleatori : Introduzione – Parte I
1 Perugia, 16 giugno 2005 ~ X Consumo nei due mesi ~ Spesa in euro: Avvertenza: i testi qui proposti sono, talvolta, modificati rispetto alla formulazione.
8. Reti di Code Nella maggior parte dei processi produttivi risulta troppo restrittivo considerare una sola risorsa. Esempio: linea tandem arrivi 1 v.
Corso di biomatematica lezione 7: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
TECNOLOGIE DEI SISTEMI DI CONTROLLO
B D1D1 D2D2 B2B2 6 4 B3B3 3 B1B1 2 1 B4B4 B5B5 D3D3 D4D4 D5D5 D6D6 a b c a T=22 c d T= P.D. SENZA e CON DUPLICAZIONE.
ALCUNI TERMINI: POPOLAZIONE CAMPIONE CAMPIONAMENTO INFERENZA STATISTICA PARAMETRI (ad es. ) STIMATORI (ad es. x) n: DIMENSIONE DEL CAMPIONE MISURE.
Napoa Azione 4 – Gruppo B7 1.Risultati della somministrazione 2002: M2 Vamio Analisi item test di profitto rispetto ai contenuti riferiti ai temi ministeriali.
Cos’è un problema?.
Introduzione ai fogli elettronici: EXCEL
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Esercitazione no. 5 EXCEL Laboratorio di Informatica AA 2009/2010.
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
SCOMPOSIZIONE IN FATTORI PRIMI di un polinomio
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
I principali tipi di grafici
Piano delle attività Anno scolastico 2012/13 Anno scolastico 2012/13.
Piano delle attività Anno scolastico 2012/13 Anno scolastico 2012/13.
Riepilogo Foglio elettronico Excel - Base
1 CALCOLO COMBINATORIO Principio fondamentale del calcolo combinatorio Se un evento E 1 si può presentare in n 1 modi e un secondo evento E 2 si può manifestare.
Misura del tasso di formazione stellare nella galassia
Corso di Informatica - Foglio elettronico - Raffaele Grande
Classificazione (aka Cluster Analysis)
Analisi dei dati ecologici
Corso di Informatica Corso di Laurea in Conservazione e Restauro dei Beni Culturali Gianluca Torta Dipartimento di Informatica Tel: Mail:
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Lez. 3 - Gli Indici di VARIABILITA’
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 10 PROBABILITA’ E VARIABILI ALEATORIE.
Teoria della probabilità
Interazione di particelle cariche pesanti con la materia
La Ricerca Scientifica per le Aree Marine Protette Il monitoraggio: principi pratici, strategie, tecnologie ed elaborazione dei dati Michele Scardi Professore.
La distribuzione campionaria della media
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Transcript della presentazione:

Test basati su permutazioni (MCPP) Sono un caso speciale dei test di randomizzazione, che utilizzano serie di numeri casuali formulare delle inferenze statistiche. La potenza di calcolo dei moderni PC ha reso possibile la loro applicazione diffusa. Questi metodi non richiedono che siano soddisfatte particolari assunzioni circa la distribuzione dei dati. Quindi, questi metodi sono molto più adatti dei tradizionali test statistici (es. t-tests, ANOVA, etc.) in applicazioni ecologiche.

Test basati su permutazioni (MCPP) Si definisce una statistica il cui valore sia proporzionale all’intensità del processo o della relazione studiati Si definisce un’ipotesi nulla H0 Si crea un set di dati basati sul “rimescolamento” di quelli realmente osservati (la modalità di “rimescolamento” viene definita in funzione dell’ipotesi nulla) Si ricalcola la statistica di riferimento e si compara il valore con quello osservato Si ripetono gli ultimi due punti molte volte (es. 1000 volte) Se la statistica osservata è maggiore del limite ottenuto nel 95% dei casi basati su “rimescolamento”, si rigetta H0

MRPP Se D è la distanza media intragruppo osservata fra i gruppi definiti a priori, pesata per la dimensione dei diversi gruppi, allora:

MRPP Merluccius merluccius   ------------- Multi-Response Permutation Procedures (MRPP) -------------- Area A, controllo: n = 43 average within-group distance = 1.3570038 Area B, M/C Haven: n = 20 average within-group distance = 7.5528164 Test statistic: T = -14.493640 Observed delta = 3.3239284 Expected delta = 3.7441384 Variance of delta = 0.84057736E-03 Skewness of delta = -2.0045495 Chance-corrected within-group agreement, R = 0.11223141 Probability of a smaller or equal delta, p = 0.00000019

Indicator Species Analysis L'abbondanza relativa RAkj della specie j nel gruppo di campioni k è La frequenza media RFkj della presenza di una specie j nel gruppo di campioni k è Combinando abbondanze relative (RA) e frequenze medie (RF) si ottiene quindi il valore indicatore (IV)

Indicator Species Analysis Merluccius merluccius Group: A B Number of items: 43 20 n ID Avg Max INDVAL p taxon ---------------------------------------------------------------- 1 EUFASI 24 44 4 44 0.017 Eufasiacei 2 THYSAN 12 25 0 25 0.004 Thysanopoda aequalis 3 RESPES 13 26 26 1 0.046 Resti pesci 4 RESCRO 10 20 0 20 0.009 Resti crostacei 5 MISIDA 2 5 5 0 0.595 Misidacei nc 6 DECAPO 2 3 2 3 0.999 Decapodi nc 7 CEFALO 2 5 5 0 0.554 Cefalopodi 8 CHLORO 3 5 0 5 0.299 Chlorotocus crassicornis 9 CRANGO 1 2 2 0 0.999 Crangon sp 10 SARDIN 3 5 0 5 0.299 Sardina pilchardus 11 ROCINE 3 5 0 5 0.307 Rocinela sp 12 POLICH 1 2 2 0 0.999 Policheti

A1 A2 A3 B1 B2 B3 B1 B2 A3 B3 A2 A1 Si compara la composizione della comunità bentonica fra un area protetta ed una non protetta.

Distanza euclidea

ANOSIM (ANalysis Of SIMilarities) ordina n=6 n=9

... P=90% R= 0.50 R= 0.20 R= 0.19 R= -0.26 rw= 5.75 rw= 7.08 rw= 7.17 rb=9.50 rb=8.61 rb=8.56 rb=7.22 ... n=6 n=9 n=6 n=9 n=6 n=9 n=6 n=9

(differenze “inter”>differenze “intra”) B1 B2 B3 B1 B2 A3 B3 A2 A1 Db>Dw (differenze “inter”>differenze “intra”)

A1 A2 A3 B1 B2 B3 A1 B1 B2 A2 B3 A3 Si compara la composizione della comunità bentonica fra un area protetta ed una non protetta.

ANOSIM (ANalysis Of SIMilarities) p = 0.171

(differenze “intra”>differenze “inter”) B1 B2 B3 A1 B1 B2 A2 B3 A3 Dw>Db (differenze “intra”>differenze “inter”)

Matrice X distanze geografiche Matrice Y dissimilarità cenotica Test di Mantel Matrice X distanze geografiche Matrice Y dissimilarità cenotica

Statistiche di Mantel assoluta standardizzata La distribuzione di riferimento si genera ricalcolando la statistica dopo permutazioni aleatorie di una delle due matrici o (per matrici molto grandi) approssimando una distribuzione t di Student.