Similarità, distanza, associazione

Slides:



Advertisements
Presentazioni simili
Pattern Oggetto o entità definito da un nome: p.es. un neo, un volto, un sintomo, un segnale biomedico, un paziente, un esame clinico, … Rappresenta.
Advertisements

Funzioni e trasformazioni Vincenza Russo
Il V postulato di Euclide e la nascita delle geometrie non euclidee
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
LE REAZIONI CHIMICHE Reazione chimica: Una reazione chimica è la trasformazione della materia nel corso della quale le sostanze che vi partecipano.
Definizione Dati un punto O del piano α e un numero reale k ≠ 0, si dice omotetia di centro O e rapporto k la trasformazione del piano in sé che associa.
TEORIA CINETICA DEI GAS
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
a’ = f(a) Definizione e proprietà
Popolazione, campione, parametri e stimatori
N0 è una classe (i suoi elementi sono numeri) Zero è un numero
Teoria e Tecniche del Riconoscimento
Apprendimento Automatico: Apprendimento Pigro (Lazy Learning)
RICHIAMI ELEMENTARI DI ALGEBRA MATRICIALE
ANALISI DEI GRUPPI seconda parte
Curiosità sui triangoli
TEOREMI CLASSICI DELL’ANALISI
Sistemi di equazioni lineari
Seminario su clustering dei dati – Parte I
Algoritmi di classificazione e reti neurali Seminario su clustering dei dati – Parte I Università di RomaLa Sapienza Dipartimento di Informatica e Sistemistica.
BIOINGEGNERIA S. Salinari Lezione 8. RETI AD APPRENDIMENTO NON SUPERVISIONATO Le reti ad apprendimento non supervisionato debbono essere in grado di determinare.
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Analisi dei gruppi – Cluster Analisys
Matematica della Distanza
geometria euclidea Realizzato dall’alunna: PARIMBELLI ILARIA
Instance Based Learning Mercoledì, 17 novembre 2004 Giuseppe Manco Readings: Chapter 8, Mitchell Chapter 7, Han & Kamber Instance-Based Learning (IBL):
Chapter 14, Hastie , Tibshirani and Friedman
Le matrici e I Sistemi lineari.
GEOMETRIA EUCLIDEA POSTULATI SULLA RETTA A • B •
Pedagogia sperimentale
LA TRASFORMATA DI FOURIER: PROPRIETA’ ed ESEMPI SEZIONE 7
Trasformazioni Geometriche
Statistica descrittiva
relazioni tra radici e simmetrie Lezione 3
Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
DERIVATA DI UNA FUNZIONE
Equilibrio chimico in fase gassosa
PROPRIETA’ TERMICHE TEMPERATURA DI FUSIONE
DERIVATA DI UNA FUNZIONE
Analisi dei dati ecologici
Trasformazioni nel piano
MONOMI E POLINOMI.
Prof Riccardi Agostino - ITC "Da Vinci"
Algoritmi di classificazione e reti neurali Seminario su clustering dei dati Università Sapienza di Roma Dipartimento di ingegneria Informatica, Automatica.
LEZIONE A.2 La produzione del dato TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli.
La matematica: linguaggio universale PROGETTO INNOVAMATICA Innovazione & Matematica Corso Galileo Prima lezione - 22 ottobre 2003 Ricerca & consulenza.
Epistemologia delle scienze naturali (II Sem.) La natura del Tempo e la teoria della relatività di Einstein Francesco Orilia.
Università degli Studi di Roma Tor Vergata
ANALISI DEI GRUPPI I. La Cluster analysis è uno strumento di classificazione capace di scomporre una realtà complessa di osservazioni plurime in tipologie.
Rappresentazione dell’informazione
Master in Neuropsicologia ClinicaElementi di Statistica I 14 giugno / 20 Repetita iuvant Relazione simmetrica tra variabili (X ←→ Y) Variabili qualitative.
Misurazione Raccolta sistematica e organizzata di elementi per classificare quantificare.
La localizzazione di ambulanze Un approccio attraverso la Teoria dei Giochi.
Ecologia delle comunità
a’ = f(a) Definizione e proprietà
Il Moto. Partendo da una quesito assegnato nei test di ingresso alla facoltà di medicina, si analizza il moto di un oggetto.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
ANALISI DEI GRUPPI I.
Similarità e dissimilarità
Transcript della presentazione:

Similarità, distanza, associazione

Misure di similarità Variano da 1 (massima somiglianza, osservazioni identiche) a 0 (nessuna somiglianza, osservazioni completamente diverse) Possono essere simmetriche (l’assenza di una specie è considerata informativa) o asimmetriche (l’assenza non è un dato certo) Se trasformate in dissimilarità (D=1-S), possono godere di proprietà metriche o meno

a = 4 b = 3 c = 2 d = 1 Osservazione j 1 Osservazione k a b c d Osservazione k a b c d p = a + b + c + d   St. A St. B Sp. 1 3 Sp. 2 4 2 Sp. 3 Sp. 4 5 Sp. 5 1 16 Sp. 6 Sp. 7 12 Sp. 8 Sp. 9 Sp. 10 a = 4 b = 3 c = 2 d = 1

Alcune misure di similarità simmetriche asimmetriche concordanza semplice Jaccard Rogers & Tanimoto Sørensen

Gower Bray-Curtis Steinhaus per descrittori binari si=1 nei casi di concordanza e si=0 altrimenti (la concordanza da doppio zero viene trattata in accordo con il significato dello zero) per descrittori semi-quantitativi ordinali e quantitativi: si=1-|xij-xik| Ri-1 (dove Ri è l'intervallo di variazione dell'i-mo descrittore) Gower Bray-Curtis Steinhaus D=1-S

Dissimilarità metriche se… 1. Djk=0 se j=k 2. Djk>0 se jk 3. Djk=Dkj 4. Djk+DkhDjh (assioma della diseguaglianza triangolare) semimetrica

Misure di distanza Canberra euclidea Bray-Curtis Manhattan Minkowski corda Czekanowski

Misure di associazione Fager & McGowan …ma possono essere utilizzati anche i coefficienti di correlazione.

quantitativa qualitativa Manhattan Canberra qualitativa Jaccard