Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
Similarità e dissimilarità
2
Similarità Similarità
Misura numerica della rassomiglianza di due osservazioni (univariate o multivariate) Più elevata più due osservazioni sono simili. Di solito definita nell’intervallo [0,1]
3
Dissimilarità Dissimilarità
Misura numerica della dissomiglianza di due osservazioni La dissimilarità minima è spesso 0 Il limite superiore varia Prossimità si riferisce sia alla similarità che alla dissimilarità
4
Similarità/Dissimilarità per attributi semplici
p e q sono le variabili di due osservazioni.
5
Distanza Euclidea
6
Distanza di Minkowski
7
Distanza di Minkowski: Esempi
r = 1. Distanza City block (Manhattan, taxicab, norma L1 ) . r = 2. Distanza Euclidea r . “supremum” (norma Lmax ,norma L ). La differenza massima tra le componenti di due vettori.
8
Distanza di Minkowski: Esempi
9
Proprietà di una misura di distanza
d(p, q) 0 ; d(p, q) = 0 solo se p = q. d(p, q) = d(q, p) . (Simmetria) d(p, r) d(p, q) + d(q, r). (Disuguaglianza triangolare) d(p, q): distanza tra due punti (osservazioni) p e q.
10
Proprietà della similarità
s(p, q) = 1 (similarità massima) solo se p = q. s(p, q) = s(q, p) (Simmetria)
11
Misure di similarità per vettori binari
Accoppiamento semplice( Simple Matching) Coefficenti di Jaccard Similarità angolare (Cosine similarity) Correlazione Si veda IDM 2.4 per ulteriori dettagli
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.