La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Similarità e dissimilarità

Presentazioni simili


Presentazione sul tema: "Similarità e dissimilarità"— Transcript della presentazione:

1 Similarità e dissimilarità

2 Similarità Similarità
Misura numerica della rassomiglianza di due osservazioni (univariate o multivariate) Più elevata più due osservazioni sono simili. Di solito definita nell’intervallo [0,1]

3 Dissimilarità Dissimilarità
Misura numerica della dissomiglianza di due osservazioni La dissimilarità minima è spesso 0 Il limite superiore varia Prossimità si riferisce sia alla similarità che alla dissimilarità

4 Similarità/Dissimilarità per attributi semplici
p e q sono le variabili di due osservazioni.

5 Distanza Euclidea

6 Distanza di Minkowski

7 Distanza di Minkowski: Esempi
r = 1. Distanza City block (Manhattan, taxicab, norma L1 ) . r = 2. Distanza Euclidea r  . “supremum” (norma Lmax ,norma L ). La differenza massima tra le componenti di due vettori.

8 Distanza di Minkowski: Esempi

9 Proprietà di una misura di distanza
d(p, q)  0 ; d(p, q) = 0 solo se p = q. d(p, q) = d(q, p) . (Simmetria) d(p, r)  d(p, q) + d(q, r). (Disuguaglianza triangolare) d(p, q): distanza tra due punti (osservazioni) p e q.

10 Proprietà della similarità
s(p, q) = 1 (similarità massima) solo se p = q. s(p, q) = s(q, p) (Simmetria)

11 Misure di similarità per vettori binari
Accoppiamento semplice( Simple Matching) Coefficenti di Jaccard Similarità angolare (Cosine similarity) Correlazione Si veda IDM 2.4 per ulteriori dettagli


Scaricare ppt "Similarità e dissimilarità"

Presentazioni simili


Annunci Google