Similarità, distanza, associazione
Misure di similarità Variano da 1 (massima somiglianza, osservazioni identiche) a 0 (nessuna somiglianza, osservazioni completamente diverse) Possono essere simmetriche (l’assenza di una specie è considerata informativa) o asimmetriche (l’assenza non è un dato certo) Se trasformate in dissimilarità (D=1-S), possono godere di proprietà metriche o meno
a = 4 b = 3 c = 2 d = 1 Osservazione j 1 Osservazione k a b c d Osservazione k a b c d p = a + b + c + d St. A St. B Sp. 1 3 Sp. 2 4 2 Sp. 3 Sp. 4 5 Sp. 5 1 16 Sp. 6 Sp. 7 12 Sp. 8 Sp. 9 Sp. 10 a = 4 b = 3 c = 2 d = 1
Alcune misure di similarità simmetriche asimmetriche concordanza semplice Jaccard Rogers & Tanimoto Sørensen
Gower Bray-Curtis Steinhaus per descrittori binari si=1 nei casi di concordanza e si=0 altrimenti (la concordanza da doppio zero viene trattata in accordo con il significato dello zero) per descrittori semi-quantitativi ordinali e quantitativi: si=1-|xij-xik| Ri-1 (dove Ri è l'intervallo di variazione dell'i-mo descrittore) Gower Bray-Curtis Steinhaus D=1-S
Dissimilarità metriche se… 1. Djk=0 se j=k 2. Djk>0 se jk 3. Djk=Dkj 4. Djk+DkhDjh (assioma della diseguaglianza triangolare) semimetrica
Misure di distanza Canberra euclidea Bray-Curtis Manhattan Minkowski corda Czekanowski
Misure di associazione Fager & McGowan …ma possono essere utilizzati anche i coefficienti di correlazione.
quantitativa qualitativa Manhattan Canberra qualitativa Jaccard