Similarità e dissimilarità

Slides:



Advertisements
Presentazioni simili
STRUTTURA DI.
Advertisements

Corso di Percezione Robotica (PRo) A. A. 99/00 B
Teoria e Tecniche del Riconoscimento
Apprendimento Non Supervisionato
Apprendimento Automatico: Apprendimento Pigro (Lazy Learning)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
ANALISI DEI GRUPPI seconda parte
VETTORI.
Cinematica differenziale
PER FUNZIONI DI PIÙ VARIABILI - 2.
Argomenti della lezione
Seminario su clustering dei dati – Parte I
Isometrie del piano In geometria, si definisce isometria
Analisi dei gruppi – Cluster Analisys
Instance Based Learning Mercoledì, 17 novembre 2004 Giuseppe Manco Readings: Chapter 8, Mitchell Chapter 7, Han & Kamber Instance-Based Learning (IBL):
Chapter 14, Hastie , Tibshirani and Friedman
Trasformazioni geometriche
TRASFORMAZIONI GEOMETRICHE
Trasformazioni geometriche
Efficient Region- Based Image Retrieval di Roger Weber e Michael Mlivoncic Swiss Federal Institute of Technology (ETH) Presentazione di Laura Galli, Mauro.
Proprietà delle matrici con variabili standardizzate.
Similarità, distanza, associazione
ANALISI DEI DATI STATISTICI
La matematica: linguaggio universale PROGETTO INNOVAMATICA Innovazione & Matematica Corso Galileo Prima lezione - 22 ottobre 2003 Ricerca & consulenza.
ANALISI DEI GRUPPI I. La Cluster analysis è uno strumento di classificazione capace di scomporre una realtà complessa di osservazioni plurime in tipologie.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Definizione operativa e indicatori. Definizione operativa La definizione operativa è l’insieme di operazioni cognitive e materiali, di regole e convenzioni.
I metodi di Classificazione automatica
FORMULARIO DI ANALITICA di ORIZIO STEFANO. DISTANZA TRA DUE PUNTI Se il segmento è parallelo all'asse x: d=|X 2 -X 1 | Se il segmento è parallelo all'asse.
Il metodo STATIS (L’Hermier des Plantes, 1976; Escoufier, 1983; Lavit et al., 1994) STATIS = Structuration des Tableaux A Trois IndiceS Tecnica esplorativa.
Precorso di Statistica per le Lauree Magistrali
LA STATISTICA DESCRITTIVA
Scale di misurazione La scala è una utile caratterizzazione della variabile ed è legata al contesto dell’indagine. Gli stessi dati possono essere interpretati.
Definizione di logaritmo
Endogenous restricted participation
GLI STRUMENTI AUSILIARI
Definizioni delle grandezze rotazionali
DISTRIBUZIONI TEORICHE DI PROBABILITA’
A Phenotypic Null Hypothesis for the Genetics of Personality E
Richiami di Algebra Matriciale
x : variabile indipendente
Indici di variabilità Gli indici di variabilità misurano
Insiemi di punti: altre caratteristiche
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Cluster Analysis: concetti di base e algoritmi
Precorso di Statistica per le Lauree Magistrali
Addizioni in binario, ottale, esadecimale
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
Richiami di Algebra Matriciale
Momenti e valori attesi
Impariamo a conoscere le Matrici
Statistica descrittiva bivariata
GRANDEZZA SCALARE DEFINITA DA UN NUMERO GRANDEZZA VETTORIALE DEFINITA DA UN VETTORE.
Statistica descrittiva bivariata
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
LA RETTA.
Energia potenziale elettrostatica Lavoro della forza Coulombiana
II Prova in itinere corso di Fisica 4 21/4/2006
Classificazione degli stati molecolari
Approssimazione Born-Oppenheimer
ANALISI DEI GRUPPI I.
Precorso di Statistica per le Lauree Magistrali
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
A cura dei Docenti: Prof Salvatore MENNITI, Prof ssa Alessandra SIA
Richiami di Algebra Matriciale
DERIVATA DI UNA FUNZIONE
Regole di selezione Affinchè il momento di transizione sia diverso da zero, l’argomento di questo integrale deve essere una funzione totalsimmetrica, deve.
Transcript della presentazione:

Similarità e dissimilarità

Similarità Similarità Misura numerica della rassomiglianza di due osservazioni (univariate o multivariate) Più elevata più due osservazioni sono simili. Di solito definita nell’intervallo [0,1]

Dissimilarità Dissimilarità Misura numerica della dissomiglianza di due osservazioni La dissimilarità minima è spesso 0 Il limite superiore varia Prossimità si riferisce sia alla similarità che alla dissimilarità

Similarità/Dissimilarità per attributi semplici p e q sono le variabili di due osservazioni.

Distanza Euclidea

Distanza di Minkowski

Distanza di Minkowski: Esempi r = 1. Distanza City block (Manhattan, taxicab, norma L1 ) . r = 2. Distanza Euclidea r  . “supremum” (norma Lmax ,norma L ). La differenza massima tra le componenti di due vettori.

Distanza di Minkowski: Esempi

Proprietà di una misura di distanza d(p, q)  0 ; d(p, q) = 0 solo se p = q. d(p, q) = d(q, p) . (Simmetria) d(p, r)  d(p, q) + d(q, r). (Disuguaglianza triangolare) d(p, q): distanza tra due punti (osservazioni) p e q.

Proprietà della similarità s(p, q) = 1 (similarità massima) solo se p = q. s(p, q) = s(q, p) (Simmetria)

Misure di similarità per vettori binari Accoppiamento semplice( Simple Matching) Coefficenti di Jaccard Similarità angolare (Cosine similarity) Correlazione Si veda IDM 2.4 per ulteriori dettagli