Chiara Scapoli Dipartimento di Biologia Università di Ferrara

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Advertisements

LA VARIABILITA’ IV lezione di Statistica Medica.
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Programma 1 (a) Diversità genetica (b) Equilibrio di Hardy-Weinberg
DISTANZE GENETICHE qK pK qL pL Prendiamo due popolazioni: K e L
Variabili casuali a più dimensioni
Analisi preliminari dei dati
1° legge di Mendel: Principio della Segregazione
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
ALCUNI METODI STATISTICI PER LA SELEZIONE DELLE VARIABILI NELL’ANALISI DISCRIMINANTE Eliminazione di variabili con contributo discriminatorio statisticamente.
L’altro importante equilibrio genetico è un EQUILIBRIO APLOIDE
Per avere una utilità pratica un marcatore deve essere polimorfico
Selezione stabilizzatrice per alcune mutazioni cromosomiche
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
CAMPIONAMENTO Estratto dal Cap. 5 di:
DIFFERENZA TRA LE MEDIE
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Il riconoscimento dei fattori di rischio
ALCUNI TERMINI: POPOLAZIONE CAMPIONE CAMPIONAMENTO INFERENZA STATISTICA PARAMETRI (ad es. ) STIMATORI (ad es. x) n: DIMENSIONE DEL CAMPIONE MISURE.
Misurazione Le osservazioni si esprimono in forma di misurazioni
Caratteri complessi Vincenzo Nigro Dipartimento di Patologia Generale
Intelligenza Artificiale Algoritmi Genetici
Algoritmi Genetici Alessandro Bollini
Verifica delle ipotesi su due campioni di osservazioni
Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
TRATTAMENTO DEI DATI ANALITICI
Caratteristiche e applicazioni
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Accoppiamento non casuale Mutazione
Nella Genetica Umana l’oggetto di studio è sia il fine che il mezzo
Metodi per l’integrazione tra la base dati Health Search e l’indagine Istat sulle condizioni di salute Marco Di Zio Di Consiglio L., Falorsi S., Solari.
La Genetica di popolazioni studia i fattori che influenzano la trasmissione dei caratteri ereditari a livello di popolazioni e i processi evolutivi che.
Nelle popolazioni naturali la variabilità genetica (ovvero ereditaria) può essere di tipo qualitativo o quantitativo La variabilità qualitativa si riscontra.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli zigoti, possiamo definirlo quindi un equilibrio diploide L’altro.
IL CAMPIONE.
Il Principio di Hardy-Weinberg
Test basati su due campioni Test Chi - quadro
Analisi discriminante lineare - contesto
Lezione Novembre 2009 corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione 11 Dicembre.
Intervalli di confidenza
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Corso di Laurea in Scienze e tecniche psicologiche
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Correlazione e regressione lineare
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Cos’è la ricerca sociale? La raccolta di informazioni relative ad una realtà, ad un fenomeno sociale secondo obiettivi specifici:
Cause delle alterazioni dell’equilibrio di Hardy- Weinberg Accoppiamento assortativo Accoppiamento assortativo Mutazioni Mutazioni Migrazioni Migrazioni.
Concetti di base. Per biodiversità si intende l'insieme di tutte le forme viventi geneticamente diverse e degli ecosistemi ad esse correlati Il termine.
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli zigoti, possiamo definirlo quindi un equilibrio diploide L’altro.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Il principale zucchero del latte è il disaccaride lattosio. Non viene assorbito come tale dalla parete intestinale ma deve essere scisso nei due monosaccaridi.
Transcript della presentazione:

Chiara Scapoli Dipartimento di Biologia Università di Ferrara Analisi genetica di patologie complesse attraverso studi di associazione: Sclerosi Multipla e Parodontite Aggressiva Chiara Scapoli Dipartimento di Biologia Università di Ferrara

Con il termine di patologie complesse multifattoriali vengono indicate una serie di malattie comuni causate da interazioni multiple di diversi geni che interagendo tra loro e con fattori ambientali di rischio creano un gradiente di suscettibilità genetica alla patologia

Associazione allelica o Linkage disequilibrium (LD) Con il termine di LD si intende l’associazione statistica non casuale tra alleli a due diversi loci SELEZIONE NATURALE TEMPO (n° generazioni) DERIVA GENETICA STORIA della popolazione MUTAZIONI RICOMBINAZIONE

i figli ereditano differenti regioni cromosomiche dai loro genitori effetti della ricombinazione sui cromosomi all’interno di una famiglia il nipote eredita regioni cromosomiche appartenenti a tutti i 4 cromosomi dei nonni i figli ereditano differenti regioni cromosomiche dai loro genitori

a b c d e f g h a b c d f g h E a b c d f g h Fondatore Discendenteattuale

Popolazione attuale affetta Fondatore Popolazione attuale affetta Regione cromosomica condivisa “per discesa”

Associazione allelica o Linkage disequilibrium (LD) Con il termine di LD si intende l’associazione statistica non casuale tra alleli a due diversi loci Locus malattia ? (allele D) Locus malattia ? (allele d) Locus marcatore: allele B AC CE FG BA BE BC Locus marcatore: allele -

Misura dell’associazione allelica B b A B A b a B a b Siano pAB, pAb, paB, pab le frequenze dei quattro possibili aplotipi (=combinazioni di alleli) La misura di associazione allelica tra i due loci nello stesso gamete è: D = pAB * pab - pAb * paB La condizione di equilibrio è caratterizzata da D=0 (gli alleli A e B sono egualmente distribuiti negli aplotipi in accordo con le loro frequenze alleliche); D=1 indica “disequilibrio completo”

Misure di associazione allelica Coefficiente D (Lewontin & Kojima, 1960) D=PAB - PAPB = PAB Pab - PAbPaB Coefficiente D’ (Lewontin, 1964) D’ = D/DMAX DMAX min{ PAPb, PaPB } per D>0 DMAX min{ PaPb, PAPB } per D<0 Coefficiente r² (Hill & Robertson, 1968) r²=D/(PA*Pa*PB*Pb) Coefficiente  (Malécot, 1943, 1966) =D/(PA*PB) Coefficiente d (Nei & Li, 1980) d = D/(PB*Pb) Coefficiente Q (Yule, 1960) Q=D/(PAB*Pab + PAPb*PaPB)

Matrice del parametro di associazione r²

Difficoltà negli studi di Linkage disequilibrium Caratteristiche del Linkage disequilibrium Diverso pattern di LD tra popolazioni Diverso pattern di LD tra regioni cromosomiche Segmenti cromosomici conservati (blocchi) separati da punti caldi di ricombinazione Estensione variabile del blocco conservato Difficoltà negli studi di Linkage disequilibrium Il pattern di associazione tra SNPs e patologia solitamente si rileva molto complesso; Le fluttuazioni della forza di associazione riflettono le diverse “età” degli SNPs e di conseguenza anche il “rumore” introdotto sia dai processi stocastici (mutazioni, drift… ) che direzionali (selezione…)

Popolazione Inglese Popolazione Italiana

Cromosoma 6 Popolazione Inglese Popolazione Italiana

Misure di associazione allelica

Potere Statistico degli studi di LD Una delle maggiori difficoltà con i test di associazione che coinvolgono un numero molto elevato di SNPs è imputabile all’esecuzione di numerosi test multipli. Una notevole riduzione del potere statistico degli studi di associazione indiretti è dovuto alla riduzione del p-value dopo l’aggiustamento di Bonferroni (Ohashi et al., 2001). Livelli di significatività estremamente bassi sono stati proposti anche per controllare il numero degli errori di I° tipo (Risch and Merikangas, 1996). Tali livelli di significatività sono raramente raggiungibili con dimensioni campionarie realistiche.

(1)Dep. of Biology and (3)Research Center for the Study of Periodontal Diseases, University of Ferrara, Italy (2)Human Genetics Research Division, University of Southampton, United Kingdom

La frequenza dell’allele malattia (Q) non è nota; Gli aplotipi non sono facilmente ricostruibili I test statistici classici usati per la stima del LD non sono applicabili

Distribuzioni Genotipiche e alleliche per uno SNP in uno studio caso-controllo Il calcolo del  di regressione tra stato di affezione e genotipo al marcatore è basato sull’utilizzo delle seguenti tabelle:

Ricostruzione di un campione casuale di alleli Collins e Morton (1998) hanno definito un fattore di arricchimen-to  per correggere l’eccesso di casi presenti nel disegno di studio Data la frequenza di affezione, Z, nella popolazione generale si definisce:  = [(n11+n12+n13)/(n01+n02+n03)] * [(1-Z)/Z)] Il parametro di regressione , può essere ottenuto per aggiustamento del numero dei controlli come: = | a(d)-b(c)| / (a+c)(b+d) e K=2/2 Incorporando le informazioni derivanti dai marcatori multipli in una likelihood composita, l’analisi è più potente rispetto a quando ogni SNP è considerato separatamente, inoltre l’associazione può essere stimata anche senza la ricostruzione degli aplotipi.

Associatione Allelica e modello di Malécot Questo approccio si basa sul modello di Malécot che descrive il declino della associatione (della malattia) con la distanza. Applicando il metodo di Maniatis et al (AJHG, 2004) il modello stima un coeff. di regressione, , tra un marcatore (SNP) e la patologia in funzione di 4 parametri: dove S è la posizione dello SNP (Kb o LDU); è la posizione stimata per lo SNP causale,  è 1 se S> e -1 altrimenti.  è il declino esponenziale dell’associazione con la distanza L’asintoto L può o essere derivato dal campione [Lp] (Morton et al, 2001) o può essere stimato M rappresenta l’intercetta.

Mappe di Linkage Disequilibrium Che cosa si intende per mappa di LD? E’ una mappa espressa in unità di LD (LDU) che discrimina tra blocchi conservati di LD con distanze additive e localizzazione colineare con le mappe fisiche (Kb) b = (1-L)Me- d+L d => stimato per ogni singolo intervallo tra marcatori si è rivelato un’unità di misura per il LD

Mappe di LD: il modello di Malécot Collins & Morton, PNAS, 1998 b = (1-L)Me- d+L

Hot spot di ricombinazione (Jeffreys et al. 2001)

Mappa in LDU della regione cromosomica 5q31

Mappa in LD Units (Elahi et al Mappa in LD Units (Elahi et al.) 93 SNPs che coprono una regione di 490.25 Kb (1 SNP ogni 5.3 Kb) tipizzati in 250 trios IL-1A IL-1B IL-1F5 IL-1RN TIC

Evidenze di Associazione sotto il modello di Malécot Le evidenze di un’associazione si ricavano dall’adattamento ai dati di quattro modelli (A-D). Modello A  ‘ipotesi nulla’, H0: M=0 e L=Lp. Qualsiasi associazione è attribuita al ‘background’. Modello B modello ‘piatto’, H1:M=0 e L= . Uno scostamento significativo di L sopra Lp implica un’associazione positiva nella regione, senza poterla attribuire ad una posizione o sub-regione specifica. Modello C  H2: assume L=Lp ma stima M e la posizione S. Il parametro  è assunto pari a 1 per le mappein LDU o è stimato dell’eq. di Malécot per le mappe in Kb. Modello D  H3: L’ipotesi alternativa più complessa, stima L, M ed S.

Modelli di Associazione

Mappe basate sulla Metrica di LD Recemente sono state sviluppate mappe basate sulla “Metrica di LD” (Maniatis et al, 2002, Zhang et al, 2002). Tali mappe assegnano una posizione ai marcatori sulla base di unità di linkage disequilbrium (LDUs). La mappa in LDU viene costruita assumendo LDU =idi, dove (i) è la stima iterativa del parametro dell’equazione di Malécot e (di) è l’i-esima distanza in kb tra coppie adiacenti di k SNPs (i = 1, . . . , k-1). Dopo la convergenza, la mappa in LDU è ri-tarata in modo tale che 1 LDU corrisponda al "swept radius" 1/, definito come l’estensione del LD “utile” (Morton et al, 2001). Le stime di M e L non sono influenzate dall’assunzione di questa nuova scala, ciò assicura che il valore atteso di () rimane conforme a (1-L)Me-D+L, dove D è la distanza in LDU

La regione del cluster dell’IL-1 (2q14)

Marcatori studiati e Mappe

La regione del cluster dell’IL-1 : Verifica delle ipotesi