Linkage HapMap Lezione 4 By NA.

Slides:



Advertisements
Presentazioni simili
Malattie genetiche monogeniche
Advertisements

- le Medie la Moda la Mediana
MEIOSI Quelli che seguono sono elementi di base per comprendere la meiosi. Per semplicità non viene preso in considerazione il fenomeno del crossing over.
2. Introduzione alla probabilità
1. Nelle cavie il pelo ruvido ( R ) è dominante sul pelo liscio ( r )
1 2. Introduzione alla probabilità Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari : è linsieme.
Programma 1 (a) Diversità genetica (b) Equilibrio di Hardy-Weinberg
Lez. 3 - Gli Indici di VARIABILITA’
La Drosophila Melanogaster (o moscerino della frutta)
1° legge di Mendel: Principio della Segregazione
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
L’altro importante equilibrio genetico è un EQUILIBRIO APLOIDE
Per avere una utilità pratica un marcatore deve essere polimorfico
Principali difficoltà nello studio dei caratteri genetici nell’uomo
Genetica dei caratteri complessi
Test - Sreening - Acondroplasia
Identificazione di geni nei mammiferi
Evoluzione del genoma Lezione 13 By NA.
Il concetto di aplotipo
Queuing or Waiting Line Models
Clonaggio funzionale Clonaggio posizionale
Clonaggio funzionale Clonaggio posizionale
OPERAZIONI CON TRINOMI DI II° GRADO
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Analisi di linkage Vincenzo Nigro Dipartimento di Patologia Generale
Caratteri complessi Vincenzo Nigro Dipartimento di Patologia Generale
Intelligenza Artificiale Algoritmi Genetici
Esercizio.
Sequenze Ripetitive di Dna
Teoria cromosomica dell’ereditarietà
UNIVERSITA’ DEGLI STUDI DI CASSINO FACOLTA’ DI SCIENZE MOTORIE
Elementi di Informatica di base
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
1 Questionario di soddisfazione ATA - a. sc. 2008/09 Il questionario è stato somministrato nel mese di aprile Sono stati restituiti 29 questionari.
Cap. 13 Mappatura dei geni negli Eucarioti pp
1101 = x 10 x 10 x x 10 x = CORRISPONDENZE
Difetti congeniti del metabolismo III
Distribuzione del numero di alleli condivisi da coppie di fratelli e di non-parenti tipizzati rispettivamente per 5, 9 e 13 markers.
Polimorfismi, mutazioni e metodi per evidenziarli
Identificazione e tipizzazione di minisatelliti
Nella Genetica Umana l’oggetto di studio è sia il fine che il mezzo
Natura della variabilità genetica
La trasmissione dei caratteri ereditari
OPERAZIONI CON TRINOMI DI II° GRADO
La Genetica di popolazioni studia i fattori che influenzano la trasmissione dei caratteri ereditari a livello di popolazioni e i processi evolutivi che.
Nelle popolazioni naturali la variabilità genetica (ovvero ereditaria) può essere di tipo qualitativo o quantitativo La variabilità qualitativa si riscontra.
Difetti congeniti del metabolismo II
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Le combinazioni teoricamente possibili sono 223, cioè > 8 milioni
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli zigoti, possiamo definirlo quindi un equilibrio diploide L’altro.
UN GENE UNA MALATTIA ETEROGENEITÀ GENETICA TEST DI COMPLEMENTAZIONE
Il Principio di Hardy-Weinberg
Fibrosi Cistica II Lezione 8 By NA.
Chiara Scapoli Dipartimento di Biologia Università di Ferrara
Computational analysis of data by statistical methods
UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA Corso di BIOINFORMATICA: TECNICHE DI BASE Prof. Giancarlo Mauri Lezione 3 Mappe genetiche.
Fibrosi Cistica I Lezione 7 By NA.
Lezione Novembre 2009 corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione 11 Dicembre.
Il matrimonio negli studi demografici Stretta relazione tra nuzialità e fecondità Rilevanza per lo studio delle dinamiche e dei processi familiari Radici.
Esercitazione di Genetica - 5
Genomica strutturale.
Test Prenatale Non Invasivo NIPT – PGT2 PGT1 Property of Lamberto Camurri Ph.D. Benvenuti State entrando nel percorso NIPT, test non invasivi di previsione.
Concetti di base. Per biodiversità si intende l'insieme di tutte le forme viventi geneticamente diverse e degli ecosistemi ad esse correlati Il termine.
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli zigoti, possiamo definirlo quindi un equilibrio diploide L’altro.
La mancanza di pigmentazione nell’uomo (e non solo) è definita albinismo e dipende da un fattore ereditario recessivo “a”. Il dominante “A” è invece responsabile.
Transcript della presentazione:

Linkage HapMap Lezione 4 By NA

Linkage:fase di piu locus Definizione della regione candidata con analisi di linkage: ricostruzione degli aplotipi studiando la segregazione nelle famiglie. E’ necessario risalire alla fase e identificare i ricombinanti 7 5 4 6 2 8 3 1 9 8 3 2 7 10 10 4 6 1 8 3 2 7 10 10 3 2 5 8 8 3 2 7 10 5 3 1 7 8 3 4 2 10 3 2 5 8 Possedere un particolare polimorfismo non vuol dire avere il fenotipo, lo studio di linkage e’ a livello di popolazione, serve ad individuare una regione non la mutazione By NA

Linkage possibili inconvenienti Ci possono essere inconvenienti che complicano la possibilita’ di assegnare un locus a una regione definita da marcatori: Errori umani: errata lettura dei dati, scambio di campioni, paternita’…… Errori nell’interpretazione del fenotipo: un falso ricombinante.Se i marcatori sono molti e vicini la presenza di un doppio ricombinante fa sospettare un errore Eterogeneita’ genetica: famiglie con fenotipo simile vengono accorpate e non si riesce a trovare il linkage. Sclerosi tuberosa: due loci distinti E’ importante disporre di numerosi siti polimorfici, che non siano soggetti a dominanza e recessivita’. I polimorfismi del DNA sono l’ideale! By NA

Probabilita’ di trovare ricombinanti NB non si conosce la loro posizione reciproca quindi ci sono due possibilita’ A B a b SE I LOCI NON SONO ASSOCIATI LA PROBABILITA’ E’ 1/2 X 1/2 X 1/2 X1/2 = 1/16=0.0625 SE I LOCI SONO ASSOCIATI LA PROBABILITA DIPENDE DA QUANTO SONO DISTANTI SE LA FREQUENZA DI RICOMBINAZIONE E’ 10% RICOMBINANTE LA P DI 3 NR E 1R= 0.1X0.9X0.9X0.9=0.073=7.3% NON RICOMBINANTI Non ho la possibilita’ di scegliere fra le due ipotesi: solo un gran numero di osservazioni mi potrebbe permettere di riconoscere quale e’ la situazione piu’ probabile NON ESISTE NULLA CHE POSSA SOSTITUIRE I GRANDI NUMERI….COME POSSIAMO OTTENERE GRANDI NUMERI NELL’UOMO??? By NA

come si fa visto che le famiglie umane sono di solito piccole? Come fare il linkage Il calcolo del linkage e’ quindi statistico: occorre una progenie numerosa e bisogna conoscere la fase (aplotipo) dei parentali. come si fa visto che le famiglie umane sono di solito piccole? Si ricorre al lod score By NA

Linkage-lod score Il linkage e’ una relazione di vicinanza fra due loci ed e’ funzione della loro distanza. La definizione di un linkage fra due loci si basa su calcoli statistici che permettono di quantizzare la probabilta’ che i risultati ottenuti non siano dovuti al caso . Nel caso dell’uomo l’analisi della progenie di una singola famiglia raramente fornisce informazioni sia per lo scarso numero di meiosi sia per la difficolta’ di risalire alla fase. Bisogna mettere insieme i dati provenienti da piu’ famiglie. (1-n r P di un assortimento genetico in una progenie se i geni sono associati Odds ratio= (1/2)n+r P di un assortimento genetico nella progenie se i geni sono indipendenti Lod score: logaritmo in base 10 dei singoli rapporti di ogni famiglia, si possono cosi sommare. Un valore di 3 indica linkage. By NA

LOD SCORE LOD SCORE (Z): logaritmo della probabilita’ che i loci siano associati (data la frazione di ricombinazione q ) piuttosto che non associati (q=0.5). La probabilita’ complessiva di un gruppo di famiglie e’ il prodotto delle probabilta’ di ciascuna famiglia, percio’ la somma dei lod score. Per q = 0.5, Z=0: infatti sono il rapporto fra probabilta’ identiche e log10(1)=0. Z=3(1000:1) e’ la soglia per accettare il linkage con una probabilita’ di errore del 5%. Z=-2 esclude il linkage. 4 3 2 1 0 0.1 0.2 0.3 0.4 0.5 Frequenza di ricombinazione Z Z Odds ratio= P di un assortimento genetico in una progenie se i geni sono associati P di un assortimento genetico nella progenie se i geni sono indipendenti (1-n r (1/2)n+r By NA

La connessione fra mappe Quindi si hanno due tipi di mappe: fisica e genetica. Il problema e’ trovare il modo di legarle: la mappa fisica mi dice in che un gruppo di sequenze formano un contiguo su un frammento di cromosoma, ma non mi permette di identificare geni candidati. La mappa genetica me lo permetterebbe perche’ non riguarda specifiche sequenze, ma anche locus di cui non conosco la sequenza. Non posso pero’ studiare il gene candidato perche’ non ho la sequenza corrispondente. La possibilita’ di utilizzare STS e EST polimorfici ha permesso di risolvere il problema By NA

Gli STS: Sequence Target Site L’automazione del sequenziamento permette di sequenziare corte sequenze (300pb) clonate a caso da cui ricavare primers per “screenare” con la PCR ormai automatizzata le librerie e costruire mappe fisiche attraverso la creazione di contigui . Quando sono polimorfiche sono marcatori comuni alle mappe sia genetiche che fisiche e permettono di legarle fra loro H F* Q A* C B* D G* mappa fisica:contiguo 1 2 A C B D G H F Q DNA genomico A+,B-,C+.. A-,B+,C+.. B+,D+,G+ H+,F+,T-.. F+,T-,Q+.. Clonaggio mappa genetica: A, G e F sono in linkage il loro ordine e’ F-A-G Sequenziamento A C B D G H F Q I due contigui sono sullo stesso cromosoma e via cosi.... screening library con PCR GACTTAG........CATAGCA ~300bp scelta dei primers x A,B,C.. STS A,B,C.. By NA

Confronto fra mappa fisica e genetica By NA

Linkage possibili inconvenienti Ci possono essere inconvenienti che complicano la possibilita’ di assegnare un locus a una regione definita da marcatori: Errori umani: errata lettura dei dati, scambio di campioni, paternita’…… Errori nell’interpretazione del fenotipo: un falso ricombinante.Se i marcatori sono molti e vicini la presenza di un doppio ricombinante fa sospettare un errore Eterogeneita’ genetica: famiglie con fenotipo simile vengono accorpate e non si riesce a trovare il linkage. Sclerosi tuberosa: due loci distinti E’ importante disporre di numerosi siti polimorfici, che non siano soggetti a dominanza e recessivita’. I polimorfismi del DNA sono l’ideale! By NA

Riconoscere i ricombinanti By NA

Doppio ricombinante? By NA

Linkage disequilibrium Il linkage disequilibrium e’ una situazione per cui un particolare aplotipo e’ statisticamente piu’ probabile in un sottogruppo di una popolazione. Indica che la popolazione deriva da un comune ancestore o, nel caso delle mutazioni patogene, che la mutazione e’ avvenuta su un cromosoma ancestrale comune alla popolazione. Il linkage disequilibrium non ha niente a che fare con la presenza della mutazione patogena e’ una osservazione che facilita la mappatura genetica. Indica che fisicamente associato al locus A polimorfico c’e’ un altro locus che, quando mutato origina la malattia. Essendo un fenomeno legato all’origine comune degli individui della popolazione, in un’altra popolazione il disequilibrium riguardera’ un altro allele del locus A By NA

Linkage disequilibrium E’ necessario considerare tutte le cause dell’associazione: il linkage disequilibrium e’ solo una delle cause Causa-effetto e selezione naturale: Un certo allele rende piu’ suscettibili a manifestare la malattia o permette alle persone malate di sopravvivere e di avere figli Errori per la stratificazione della popolazione o per mancata correzione statistica: se una popolazione e’ composta di sottoinsiemi geneticamente distinti entrambi i marker possono essere piu’ frequenti, ma senza che questo implichi un’associazione. Nel secondo caso i dati non vengono confermati da studi successivi By NA

Fibrosi Cistica e linkage disequilibrium Il gene della Fibrosi Cistica e’ stato clonato grazie alla presenza del linkage disequilibrium. CHR CF (254 con mut) CHR NORMALI (318 wild-type) APLOTIPO ALLELE di XV-2C KM-19 numero percentuale A 1 17 6.7 74 28.9 B 2 218 86.5 35 16.4 C 7 2.8 110 44 D 10 4 31 10.7 Incerto Dati ottenuti su 114 famiglie britanniche con un figlio affetto. Il cromosoma CF, identificato perche’ presente nell’affetto, tende a portare gli alleli X1 e K2. By NA

Possibili cause del linkage disequilibrium Potrebbe essere causa dell’effetto del fondatore: la mutazione potrebbe essere comparsa in un antenato della popolazione Nord-Europea che portava l’aplotipo B e probabilmente gli eventi di ricombinazione non hanno avuto sufficiente tempo per rispristinare una situazione di equilibrio, cioe’ ad una associazione casuale. Cio’ significa anche che gli eventi di ricombinazione sono rari tra il gene CF e i due marcatori cioe’ il locus malattia e’ strettamente associato ai due marcatori XV-2C e KM-19 La presenza di un particolare aplotipo potrebbe conferire un vantaggio selettivo nell’individuo che lo porta (come accade per gli antigeni HLA: particolari aplotipi sembrano migliorare la risposta immunitaria e percio’ sono sottoposti a pressione selettiva) La conoscenza del linkage disequilibrium oltre a dare una indicazione della localizzazione precisa del locus malattia, risulta utile per la consulenza: permette di calcolare con maggiore precisione il rischio di trasmissione. Es: normalmente 1/25 portatori nella popolozione nord-europea, ma se un individuo ha aplotipo BB il rischio e’ maggiore, mentre e’ molto ridotto per aplotipi AA. By NA

Origine del linkage disequilibrium (LD) Alla sua comparsa, una nuova mutazione è in LD (grigio) con tutti I loci dello stesso cromosoma. Attraverso le generazioni la ricombinazione riduce progressivamente l’area di LD. Contano soprattutto: 1. Tasso di ricombinazione 2. Numero di generazioni By NA

Consortium. 2005. A haplotype map of the human genome Consortium. 2005. A haplotype map of the human genome. Nature 437: 1299-1320. Nature 449: 851-861, 2007. By NA 19

HapMap I By NA 20

HapMap I ... more than one million SNPs for which accurate and complete genotypes have been obtained in 269 DNA samples from four populations, including ten 500-kilobase regions in which essentially all information about common DNA variation has been extracted. These data document the generality of recombination hotspots, a block-like structure of linkage disequilibrium and low haplotype diversity, leading to substantial correlations of SNPs with many of their neighbours. We show how the HapMap resource can guide the design and analysis of genetic association studies, shed light on structural variation and recombination, and identify loci that may have been subject to natural selection during human evolution. By NA 21

HapMap II We show that 10–30% of pairs of individuals within a population share at least one region of extended genetic identity arising from recent ancestry We demonstrate increased differentiation at non-synonymous, compared to synonymous, SNPs, resulting from systematic differences in the strength or efficacy of natural selection between populations. By NA 22

HapMap I La % di ricombinazione, in una regione campione di 500kb e’ discontinua: 80% delle ricombinazioni in 15% della sequenza. HOT SPOT di ricombinazione By NA 23

HapMap II Hotspots account for approximately 60% of recombination in the human genome and about 6% of sequence Il genoma e’ ereditato a blocchetti By NA 24

linkage disequilibrium By NA 25

linkage disequilibrium conseguenze: HapMap linkage disequilibrium conseguenze: The number of tag SNPs that contain most of the information about the patterns of genetic variation is estimated to be about 300,000 to 600,000, which is far fewer than the 10 million common SNPs. By NA 26

Science 319:1100-1104 (2008) By NA 27

Nature 451:998-1003 (2008). By NA 28

Science 22 febbraio 2008 Heterozigosity By NA 29

Linkage disequilibrium / distanza Nature 21 febbraio 2008 Linkage disequilibrium / distanza By NA 30

By NA 31

By NA 32