La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Analisi genetica di patologie complesse attraverso studi di associazione: Sclerosi Multipla e Parodontite Aggressiva Chiara Scapoli Dipartimento di Biologia.

Presentazioni simili


Presentazione sul tema: "Analisi genetica di patologie complesse attraverso studi di associazione: Sclerosi Multipla e Parodontite Aggressiva Chiara Scapoli Dipartimento di Biologia."— Transcript della presentazione:

1 Analisi genetica di patologie complesse attraverso studi di associazione: Sclerosi Multipla e Parodontite Aggressiva Chiara Scapoli Dipartimento di Biologia Università di Ferrara

2 patologie complesse multifattoriali comuni diversi geni fattori ambientali suscettibilità genetica Con il termine di patologie complesse multifattoriali vengono indicate una serie di malattie comuni causate da interazioni multiple di diversi geni che interagendo tra loro e con fattori ambientali di rischio creano un gradiente di suscettibilità genetica alla patologia

3 Associazione allelica o Linkage disequilibrium (LD) Con il termine di LD si intende l’associazione statistica non casuale tra alleli a due diversi loci RICOMBINAZIONE TEMPO (n° generazioni) STORIA della popolazione DERIVA GENETICA SELEZIONE NATURALE MUTAZIONI

4 effetti della ricombinazione sui cromosomi all’interno di una famiglia i figli ereditano differenti regioni cromosomiche dai loro genitori il nipote eredita regioni cromosomiche appartenenti a tutti i 4 cromosomi dei nonni

5 a b c d e f g h a b c d f g h E a b c d f g h E a b c d f g h E a b c d f g h E a b c d f g h E Fondatore Discendente attuale

6 Fondatore Popolazione attuale affetta Regione cromosomica condivisa “per discesa”

7 Associazione allelica o Linkage disequilibrium (LD) Con il termine di LD si intende l’associazione statistica non casuale tra alleli a due diversi loci ACCE FG BABEBC Locus malattia ? (allele D) Locus malattia ? (allele d) Locus marcatore: allele B Locus marcatore: allele -

8 Misura dell’associazione allelica n Siano p AB, p Ab, p aB, p ab le frequenze dei quattro possibili aplotipi (=combinazioni di alleli) n La misura di associazione allelica tra i due loci nello stesso gamete è: a b AaaaAA BBbbbB a B A B A b D = p AB * p ab - p Ab * p aB D=1 indica “disequilibrio completo” La condizione di equilibrio è caratterizzata da D=0 (gli alleli A e B sono egualmente distribuiti negli aplotipi in accordo con le loro frequenze alleliche); D=1 indica “disequilibrio completo”

9 Misure di associazione allelica n Coefficiente D (Lewontin & Kojima, 1960) D=P AB - P A P B = P AB P ab - P Ab P aB n Coefficiente D’ (Lewontin, 1964) D’ = D/D MAX D MAX min{ P A P b, P a P B } per D>0 D MAX min{ P a P b, P A P B } per D<0 n Coefficiente r² (Hill & Robertson, 1968) r²=D/  (P A* P a* P B* P b ) n Coefficiente  (Malécot, 1943, 1966)  =D/(P A* P B ) n Coefficiente d (Nei & Li, 1980) d = D/(P B* P b ) n Coefficiente Q (Yule, 1960) Q=D/(P AB* P ab + P A P b* P a P B )

10

11 Matrice del parametro di associazione r²

12

13

14 n Il pattern di associazione tra SNPs e patologia solitamente si rileva molto complesso; n Le fluttuazioni della forza di associazione riflettono le diverse “età” degli SNPs e di conseguenza anche il “rumore” introdotto sia dai processi stocastici (mutazioni, drift… ) che direzionali (selezione…) Caratteristiche del Linkage disequilibrium Difficoltà negli studi di Linkage disequilibrium n Diverso pattern di LD tra popolazioni n Diverso pattern di LD tra regioni cromosomiche n Segmenti cromosomici conservati (blocchi) separati da punti caldi di ricombinazione n Estensione variabile del blocco conservato

15 Popolazione Inglese Popolazione Italiana

16 Cromosoma 6 Popolazione Inglese Popolazione Italiana

17 Misure di associazione allelica

18 Potere Statistico degli studi di LD Potere Statistico degli studi di LD Una delle maggiori difficoltà con i test di associazione che coinvolgono un numero molto elevato di SNPs è imputabile all’esecuzione di numerosi test multipli. n Una notevole riduzione del potere statistico degli studi di associazione indiretti è dovuto alla riduzione del p- value dopo l’aggiustamento di Bonferroni (Ohashi et al., 2001). n Livelli di significatività estremamente bassi sono stati proposti anche per controllare il numero degli errori di I° tipo. n Livelli di significatività estremamente bassi sono stati proposti anche per controllare il numero degli errori di I° tipo (Risch and Merikangas, 1996). Tali livelli di significatività sono raramente raggiungibili con dimensioni campionarie realistiche.

19 (1) Dep. of Biology and (3) Research Center for the Study of Periodontal Diseases, University of Ferrara, Italy (2) Human Genetics Research Division, University of Southampton, United Kingdom

20 La frequenza dell’allele malattia (Q) non è nota; Gli aplotipi non sono facilmente ricostruibili I test statistici classici usati per la stima del LD non sono applicabili

21 Distribuzioni Genotipiche e alleliche per uno SNP in uno studio caso-controllo  di regressione Il calcolo del  di regressione tra stato di affezione e genotipo al marcatore è basato sull’utilizzo delle seguenti tabelle:

22 Ricostruzione di un campione casuale di alleli fattore diarricchimen- to  Collins e Morton (1998) hanno definito un fattore di arricchimen- to  per correggere l’eccesso di casi presenti nel disegno di studio frequenza di affezione, Z, Data la frequenza di affezione, Z, nella popolazione generale si definisce:  = [(n 11 +n 12 +n 13 )/(n 01 +n 02 +n 03 )] * [(1-Z)/Z)] parametro di regressione  Il parametro di regressione , può essere ottenuto per aggiustamento del numero dei controlli come:  = | a(  d)-b(  c)| / (a+  c)(b+  d) e K  =  2 /  2 Incorporando le informazioni derivanti dai marcatori multipli in una likelihood composita, l’analisi è più potente rispetto a quando ogni SNP è considerato separatamente, inoltre l’associazione può essere stimata anche senza la ricostruzione degli aplotipi.

23 declino della associationecon la distanza in funzione di 4 parametri Questo approccio si basa sul modello di Malécot che descrive il declino della associatione (della malattia) con la distanza. Applicando il metodo di Maniatis et al ( AJHG, 2004 ) il modello stima un coeff. di regressione, , tra un marcatore (SNP) e la patologia in funzione di 4 parametri: – –dove S è la posizione dello SNP (Kb o LDU); – – è la posizione stimata per lo SNP causale, – –  è 1 se S> e -1 altrimenti. – –  è il declino esponenziale dell’associazione con la distanza – –L’asintoto L può o essere derivato dal campione [Lp] (Morton et al, 2001) o può essere stimato – –M rappresenta l’intercetta. Associatione Allelica e modello di Malécot

24 Mappe di Linkage Disequilibrium  = (1-L)Me -  d +L  d => stimato per ogni singolo intervallo tra marcatori si è rivelato un’unità di misura per il LD Che cosa si intende per mappa di LD? E’ una mappa espressa in unità di LD (LDU) che discrimina tra blocchi conservati di LD con distanze additive e localizzazione colineare con le mappe fisiche (Kb)

25 Mappe di LD: il modello di Malécot  = (1-L)Me -  d +L Collins & Morton, PNAS, 1998

26 Hot spot di ricombinazione Hot spot di ricombinazione (Jeffreys et al. 2001)

27 Mappa in LDU della regione cromosomica 5q31

28 Mappa in LD Units (Elahi et al.) 93 SNPs che coprono una regione di Kb (1 SNP ogni 5.3 Kb) tipizzati in 250 trios IL-1A IL-1B IL-1F5 IL-1RN TIC

29 Modello A  ‘ipotesi nulla’, H 0 : M=0 e L=Lp. Qualsiasi associazione è attribuita al ‘background’. Modello B  modello ‘piatto’, H 1 :M=0 e L=. Uno scostamento significativo di L sopra Lp implica un’associazione positiva nella regione, senza poterla attribuire ad una posizione o sub-regione specifica. Modello C  H 2 : assume L=Lp ma stima M e la posizione S. Il parametro  è assunto pari a 1 per le mappein LDU o è stimato dell’eq. di Malécot per le mappe in Kb. Modello D  H 3 : L’ipotesi alternativa più complessa, stima L, M ed S. Evidenze di Associazione sotto il modello di Malécot Le evidenze di un’associazione Le evidenze di un’associazione si ricavano dall’adattamento ai dati di quattro modelli (A-D).

30 Modelli di Associazione

31 Mappe basate sulla Metrica di LD unità dilinkage disequilbrium (LDUs) Recemente sono state sviluppate mappe basate sulla “Metrica di LD” (Maniatis et al, 2002, Zhang et al, 2002). Tali mappe assegnano una posizione ai marcatori sulla base di unità di linkage disequilbrium (LDUs). LDU =  i d i, La mappa in LDU viene costruita assumendo LDU =  i d i, dove (  i ) è la stima iterativa del parametro dell’equazione di Malécot e (d i ) è l’i-esima distanza in kb tra coppie adiacenti di k SNPs (i = 1,..., k-1). 1 LDU corrisponda al "swept radius" Dopo la convergenza, la mappa in LDU è ri-tarata in modo tale che 1 LDU corrisponda al "swept radius" 1/ , definito come l’estensione del LD “utile” (Morton et al, 2001). D è la distanza in LDU Le stime di M e L non sono influenzate dall’assunzione di questa nuova scala, ciò assicura che il valore atteso di (  ) rimane conforme a (1-L)Me -D +L, dove D è la distanza in LDU

32 La regione del cluster dell’IL-1 (2q14)

33 Marcatori studiati e Mappe

34 La regione del cluster dell’IL-1 : Verifica delle ipotesi


Scaricare ppt "Analisi genetica di patologie complesse attraverso studi di associazione: Sclerosi Multipla e Parodontite Aggressiva Chiara Scapoli Dipartimento di Biologia."

Presentazioni simili


Annunci Google