Indici statistici geospaziali

Slides:

Advertisements

Presentazioni simili

Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.

Advertisements

Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.

Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.

Il metodo STATIS (L’Hermier des Plantes, 1976; Escoufier, 1983; Lavit et al., 1994) STATIS = Structuration des Tableaux A Trois IndiceS Tecnica esplorativa.

Organizzazione dei dati AnnoQ [m 3 /s]

Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a

Precorso di Statistica per le Lauree Magistrali

= 2x – 3 x Definizione e caratteristiche

Dip. Economia Politica e Statistica

La parabola e la sua equazione

Precorso di Statistica per le Lauree Magistrali

Definizione di logaritmo

PEDAGOGIA SPERIMENTALE

Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a

Algoritmi di stima con perdita di pacchetti in reti di sensori wireless: modellizzazione a catene di Markov, stima e stima distribuita Chiara Brighenti,

L’analisi monovariata

Metodi Quantitativi per Economia, Finanza e Management Lezione n°12 Regressione Logistica: Le ipotesi del modello, la stima del modello.

G. Grossi Modelli e applicazioni

1 L’equazione dell’iperbole

DISTRIBUZIONI TEORICHE DI PROBABILITA’

Quantitative Market Research Set-up Protocol

PIANIFICAZIONE DEI TRASPORTI Regressione lineare

Analisi delle Traiettorie: Modelli di Crescita Latente (LGM)

Indici di variabilità Gli indici di variabilità misurano

Precorso di Statistica per le Lauree Magistrali

Equazioni differenziali

Insiemi di punti: altre caratteristiche

Lo studio completo di una funzione

MATEMATICA III.

Le trasformazioni nel piano cartesiano

APPUNTI DI STATISTICA INFERENZIALE

FUNZIONI MATEMATICHE DANIELA MAIOLINO.

Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.

Confronto tra diversi soggetti:

Precorso di Statistica per le Lauree Magistrali

La Statistica Istituto Comprensivo “ M. G. Cutuli”

Statistica descrittiva bivariata

ANALISI DEI GRUPPI I.

ANALISI DEI GRUPPI I.

ANALISI DELLE DISTRIBUZIONI STATISTICHE

L’equazione dell’ellisse

Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.

Organizzazione dei dati

Autocorrelazione dei residui

Momenti e valori attesi

Statistica Scienza che studia i fenomeni collettivi.

Confronto tra diversi soggetti:

Quantitative Market Research Set-up Protocol

La distribuzione campionaria: principi generali

Intervalli di confidenza

PROCEDURA per la misura e la relativa stima

Statistica descrittiva bivariata

Statistica descrittiva bivariata

ANALISI DEI GRUPPI I.

ANALISI DEI GRUPPI I.

Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: le ipotesi del modello, la stima del modello.

ANALISI DI REGRESSIONE

Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: le ipotesi del modello, la stima del modello.

ANALISI DEI GRUPPI I.

Precorso di Statistica per le Lauree Magistrali

ANALISI DEI GRUPPI I.

ANALISI DEI GRUPPI I.

Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9

Corso di Analisi Statistica per le Imprese

Precorso di Statistica per le Lauree Magistrali

Test per campioni indipendenti

Corso di Analisi Statistica per le Imprese

Statistica descrittiva bivariata

Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.

I sistemi di equazioni di 1° grado

Transcript della presentazione:

Indici statistici geospaziali

E.D.A Exploratory Data Analysis Qual è il modo migliore per organizzare e visualizzare il campione di dati? Esistono delle grandezze che riassumono il comportamento di un gruppo di dati? Esiste una trasformata che possa semplificare la procedura di E.D.A. ?

Experimental distribution PARTE GRAFICA ISTOGRAMMA DISTRIBUZIONE CUMULATA CAMPIONARIA (OGIVE) BOX-PLOT PARTE ANALITICA MEDIA CAMPIONARIA MEDIANA CAMPIONARIA VARIANZA CAMPIONARIA COEFFICIENTE DI ASIMMETRIA CAMPIONARIO Ecc …

Experimental distribution Parte grafica (esempio) T (mq/giorno) x (km) y (km) 2.9 0.876 0.138 2.5 0.188 0.214 4.7 2.176 2.119 4.2 2.717 2.685 3.739 0.031 2.1 1.534 2.4 2.078 0.267 5.8 3.324 1.67 Valore massimo Terzo quartile Primo quartile Mediana Valore minimo

Experimental distribution Parte analitica (esempio) Numero di osservazioni 8 Valore minimo 2.1 Primo quartile 2.42 Mediana 3.57 Terzo quartile 4.24 Interquartile 1.81 Massimo valore 5.88 Media 3.62 Deviazione standard 1.33 Coefficiente di asimmetria 0.32

Trasformazione dei Dati Distribuzioni simmetriche e unimodali hanno molti pratici vantaggi: Un solo numero può essere usato per rappresentare il valore centrale in quanto media, moda e mediana coincidono Per un istogramma come in figura che approssima una distribuzione normale, la deviazione standard è circa ¾ dell’interquartile; di consequenza non c’è nessun problema se si usa l’interquartile o la deviazione standard come indice di dispersione ! Per un campione di dati strutturato in questo modo, la media e la varianza forniscono sufficienti informazioni per ricostruire l’istogramma con accettabile accuratezza !!!

Trasformazione dei Dati

Test di Normalità e di indipendenza La distribuzione univariata dei dati è normale (gaussiana)? Test statistici ( chi-quadro, Kolmogorov-Smirnov, ecc…) Questi test assumono che i dati non abbiano una struttura correlativa Questi test potrebbero essere applicati ai residui ortonormali (che sono le differenze tra valori campionari e valori stimati); si suppone che questi residui siano incorrelati e seguano una distribuzione normale con media nulla e varianza unitaria

E.D.A Exploratory Data Analysis Struttura spaziale dei dati

E.D.A Exploratory Data Analysis Struttura spaziale dei dati Un modo per mettere in luce una possibile non stazionarietà del processo è usare media e la mediana campionaria riferita a righe e colonne L’uso di queste due statistiche ha due finalità: la mediana è un indice robusto, ma anche il suo confronto con uno stimatore non robusto quale la media ha la funzione addizionale di mettere in risalto righe o colonne che possono contenere osservazioni atipiche

Definizione del KRIGING OBIETTIVO : ottimizzare la stima di una grandezza, che è distribuita nello spazio ed è misurata in un insieme discreto di punti. Le equazioni del kriging saranno utilizzate in due casi: ipotesi di stazionarietà del processo ipotesi intrinseca (cioè la stazionarietà degli incrementi) Z1 Z2 Z3 Z4 Z5 Z6 Z0 ? X1 X2 X3 X4 X5 X6 X0 IPOTESI: Z(x) sia un campo Random

(o stazionarietà del secondo ordine) Ipotesi di Stazionarietà debole (o stazionarietà del secondo ordine) Un campo Random si dice stazionario del secondo ordine se: X1 X2 h

(o stazionarietà del secondo ordine) Ipotesi di Stazionarietà debole (o stazionarietà del secondo ordine) Se le proprietà del campo sono identiche in ogni direzione (C(h) dipende solo dal modulo del vettore h e non dalla sua direzione) allora il campo si dice isotropo (questa ipotesi si assumerà in tutta la trattazione) La funzione di covarianza C(h) determina la struttura del campo Random Bisogna osservare che C(0)=sz2 è la varianza del campo random Z.

SIMPLE KRIGING IPOTESI: Stazionarietà del secondo ordine se le funzioni media m e covarianza C(h) sono note.

SIMPLE KRIGING Lo stimatore Y0* è detto ottimale se l’errore di stima (Y0*–Y0), chiamato “bias”, è minimo. Poiché il valore reale Y0 è sconosciuto, bisognerà minimizzare il valore atteso dell’ errore quadratico medio: Sviluppando i calcoli si ottiene:

Unica soluzione C è una funzione definita positiva. SIMPLE KRIGING Unica soluzione C è una funzione definita positiva. Bisogna notare che la matrice di correlazione C non dipende dal punto x0: questo implica la fattorializzazione della stessa (con algoritmi opportuni) una sola volta, cambiando solo il vettore termini noti al variare di x0, ai fini della risoluzione del sistema.

Calcolo della varianza di stima

Kriging nel caso intrinseco: definizione del variogramma Ipotesi Intrinseca Funzioni di h e non di x La varianza degli incrementi definisce una nuova funzione chiamata variogramma g(h)

Kriging nel caso intrinseco: definizione del variogramma Var(Z) finita Asintoto orizzontale del variogramma (Sill) Sill Range

Kriging nel caso intrinseco: definizione del variogramma È possibile mostrare che: per ogni x1,…., xn e per ogni a1,…, an, che sono n coefficienti soddisfacenti g(h) deve essere un infinitesimo di ordine superiore rispetto a h2 cioè

Equazioni del Kriging Condizione di indistorsione Anche in questo caso si impone che la varianza dell’errore di stima sia minimo :

Equazioni del Kriging Sviluppando i calcoli e usando la definizione di varianza si ha: Minimizzando la funzione varianza usando i moltiplicatori di Lagrange si ottiene il seguente sistema lineare nelle incognite li e m (moltiplicatore di Lagrange): Varianza dell’errore di stima

BLUE (Best Linear Unbiased Estimator) Proprietà del Kriging BLUE (Best Linear Unbiased Estimator) Interpolatore esatto Calcolo di Z nella k-esima stazione di misura Intervalli di confidenza Ipotesi di distribuzione normale degli errori Per esempio 95% +1.96s lk=1 li=0 i≠k Le equazioni del sistema non dipendono dai valori misurati Zi

Ipotesi: media del campo random costante Inferenza Statistica Ipotesi: media del campo random costante Se però i dati sono irregolarmente posizionati nello spazio: Definizione di un numero di classi di distanza Per ogni classe si calcolano Numero di coppie presenti nella classe nh Distanza media della classe (o comunque una distanza rappresentativa) La somma degli incrementi tra tutti i punti xi e xj le cui distanze ricadono nella classe

Tipologie di variogrammi

Tipologie di variogrammi

Tipologie di variogrammi

Tipologie di variogrammi

Effetto nugget

Cause del nugget Errori di misura I dati non sono stati aggregati in classi di distanza sufficientemente piccoli da mostrare un comportamento continuo nell’origine

Cause del nugget Il kriging è ancora un interpolatore esatto, ma la stima è discontinua nei punti di misura La stima è comunque continua in ogni altro punto del dominio spaziale di interesse !

Anisotropia del variogramma Se il variogramma mostra diversi comportamenti per diverse classi direzionali: L’ipotesi di stazionarietà o di comportamento intrinseco potrebbero non essere valide Se le ipotesi precedenti sono assunte valide, questa anisotropia può essere eliminata tramite un’appropriata trasformazione lineare del sistema di coordinate; ciò permette di usare l’interpolatore kriging sul dominio spaziale deformato

Moving Neighborhood Vantaggi del metodo Numero minore di equazioni da impiegare per ogni punto L’ipotesi di stazionarietà o di comportamento intrinseco è limitata all’intorno in questione (condizione più plausibile) Le stazioni distanti dal punto in questione potrebbero dare luogo a pesi addirittura negativi, implicando in qualche caso stime negative !

Problemi non stazionari Casi speciali Assumere che Z sia localmente stazionario, interpolando con la tecnica moving neighborhood Assumere nota la funzione m(x). Ciò può essere dedotto da altri tipi di misure Assumere che il variogramma g(h) sia stazionario e noto ? UNIVERSAL KRIGING

CROSS VALIDATION Per testare la validità di tutte le assunzioni usate nel kriging, è preferibile testare la capacità del modello di prevedere i dati noti Si seleziona volta per volta un punto campionario i (a cui è associato Zi) Si stima il valore Zi*nel punto selezionato tramite le equazioni del kriging, sfruttando le stazioni rimanenti Si stimano l’errore Zi-Zi* e la relativa varianza dell’errore di stima sZi Fatto questo per tutti i punti, non si rigetta il modello ipotizzato se:

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

FINE

UNIVERSAL KRIGING Condizioni di indistorsione

Intrinsic Random Functions of order k UNIVERSAL KRIGING Problema: Il variogramma g(h) deve essere noto e non può essere stimato direttamente dai dati; sebbene ci siano procedure di stima del variogramma in maniera iterativa, esse sono difficili da mettere in pratica! UNIVERSAL KRIGING è caso particolare di IRF-k Intrinsic Random Functions of order k

IRF-k Intrinsic Random Functions of order k Ridefinizione dell’ipotesi intrinseca (k=0) Si assume che la differenza Zi-Z0 o Z(x+h)-Z(x), nota come primo incremento di Z, sia stazionaria. Si può dimostrare che la varianza dell’errore di stima dipenda solo dal variogramma:

Intrinsic Random Functions of order k IRF-k Intrinsic Random Functions of order k Si può riformulare il tutto in maniera differente Z0*-Z0 è un incremento di ordine zero e l’ipotesi intrinseca assume che esso sia stazionario. È possibile determinare il variogramma direttamente dai dati.

Intrinsic Random Functions of order k IRF-k Intrinsic Random Functions of order k IRF-1 IRF-2 L’errore di stima è dato da Si ponga :

Intrinsic Random Functions of order k IRF-k Intrinsic Random Functions of order k Se si ipotizza che gli incrementi generalizzati del primo o del secondo ordine di Z siano stazionari (oppure che rispettino l’ipotesi intrinseca), allora è possibile mostrare (come nel caso degli incrementi di ordine 0) che la varianza dell’errore di stima può essere espressa nella forma seguente: Dove K è una nuova funzione, detta covarianza generalizzata del primo o del secondo ordine; K è stazionaria, cioè è funzione solo del vettore distanza.

Intrinsic Random Functions of order k IRF-k Intrinsic Random Functions of order k Se si assume che K sia nota, le equazioni del kriging diventano le seguenti per il primo ordine: Per il secondo ordine si ha:

Intrinsic Random Functions of order k IRF-k Intrinsic Random Functions of order k pk(x) sono i 6 polinomi in Xi e Yi. La varianza di stima è data per il primo ordine da: Mentre per il secondo ordine si ha: Queste equazioni sono identiche a quelle dell’universal kriging, se si sostituisce g al posto di K.