Nella Genetica Umana l’oggetto di studio è sia il fine che il mezzo Difficoltà nello studio della GU: non è possibile programmare gli incroci le fratrie sono di piccole dimensioni il tempo di generazione dello sperimentatore è uguale a quello dell’organismo oggetto di studio Aspetti positivi: le conoscenze riguardanti l’uomo sono molto vaste un fenotipo, anche se raro, è difficile che non capiti all’osservazione esiste una documentazione storica sia per gli individui che per le popolazioni no incroci programmati per verificare una determinata ipotesi
MAPPATURA GENETICA Costruzione di mappe genetiche, cioè di mappe in cui la posizione relativa dei geni (e la distanza tra di essi) viene stabilita attraverso la stima delle frequenze di ricombinazione. Si basano sul fatto che : la frequenza di ricombinazione tra due geni è funzione della distanza fisica che li separa. Il requisito minimo per mappare due geni l’uno rispetto all’altro è che di ENTRAMBI si conoscano almeno due alleli locus A alleli A1 e A2 locus B alleli B1 e B2
Perché ci interessa mappare il genoma? interesse di tipo evolutivo applicazioni pratiche il restringimento della regione cromosomica in cui mappa un gene-malattia costituisce il primo passo nella sua identificazione l’individuazione della regione cromosomica in cui mappa un gene-malattia ed il linkage con altri marcatori trova un’immediata applicazione nella consulenza genetica (diagnosi prenatale, diagnosi presintomatica, diagnosi dello stato di portatore sano) topografia del genoma
MAPPATURA GENETICA NELL’UOMO METODO DEI LOD SCORE (Morton 1955) E’ in grado di distinguere tra associazione e indipendenza Non dipende necessariamente dalla fase degli alleli del doppio eterozigote (cis o trans) Permette di combinare dati provenienti da famiglie diverse In caso di associazione non assoluta è in grado di stimare la frazione di ricombinazione ad es. in drosofila e nei batteri si possono ottenere progenie molto numerose su cui confrontare attesi ed osservati in caso di associazione o di indipendenza. La percentuale di ricombinanti se calcolata su grandi numeri dà una buona stima della frequenza di ricombinazione
METODO DELLA MASSIMA VEROSIMIGLIANZA (ML = Maximum Likelihood) Metodo che viene applicato quando non è possibile verificare direttamente la veridicità di un’ipotesi Data un’ipotesi A e un certo risultato R la verosimiglianza di A viene calcolata come probabilità che si verifichi R se A fosse vera
Esempio: abbiamo un sacchetto contenente 3 tipi di monete in ugual numero: monete con testa su entrambe le facce (TT) monete con croce su entrambe le facce (CC) monete con croce su una faccia e testa sull’altra (CT) Dobbiamo stabilire che tipo di moneta peschiamo senza poterla guardare ma effettuando 4 lanci
L’ipotesi TT è 16 volte più verosimile dell’ipotesi TC possibili risultati della serie di 4 lanci e loro probabilità nel caso in cui la moneta sia: TT TC CC 4T 1 1/16 0 3 T, 1 C 0 4/16 0 2T, 2C 0 6/16 0 1T, 3C 0 4/16 0 4C 0 1/16 1 Risultato ottenuto (R) = 4T R ci fa scartare l’ipotesi CC e ci fa ritenere più verosimile l’ipotesi TT rispetto alla TC. Ma quanto più verosimile? Dato il risultato R: Verosimiglianza di TT 1 Verosimiglianza di TC 1/16 Verosimiglianza di CC 0 L’ipotesi TT è 16 volte più verosimile dell’ipotesi TC
Rapporto di verosimiglianze TT:TC ‘a priori’ 1:1 ‘a posteriori’ 16:1 Questo metodo si può applicare anche quando il rapporto tra le verosimiglianze ‘a priori’ è diverso da 1:1 Esempio sappiamo che le monete TT sono 20 volte più numerose delle TC VEROSIMIGLIANZA ‘A PRIORI’ A FAVORE DI TT = 20:1 R = 4 T, cioè VEROSIMIGLIANZA ‘A POSTERIORI’ A FAVORE DI TT = 16:1 VEROSIMIGLIANZA GLOBALE A FAVORE DI TT = = (20 x 16) : 1, cioè 320 : 1
Quanto deve essere la verosimiglianza a favore di TT per accettare questa ipotesi come vera? Prima di iniziare l’esperimento si decide una soglia allo scopo di: 1) ridurre al minimo i casi in cui si accetta per buona un’ipotesi che invece è sbagliata; 2) ridurre al minimo i casi in cui si lascia senza risposta il problema in esame Il valore della soglia dipende soprattutto da quanto gravi sarebbero le conseguenze di una decisione errata
MAPPATURA GENETICA NELL’UOMO METODO DEI LOD SCORE (Morton 1955) E’ in grado di distinguere tra associazione e indipendenza Non dipende necessariamente dalla fase degli alleli del doppio eterozigote (cis o trans) Permette di combinare dati provenienti da famiglie diverse In caso di associazione non assoluta è in grado di stimare la frazione di ricombinazione
METODO DEI LOD SCORE, come si procede: reperimento delle famiglie informative (requisito minimo almeno un genitore deve essere doppio eterozigote) e costruzione dei pedigree; determinazione del genotipo di tutti gli individui per uno o più marcatori polimorfici; individuazione e conta dei gameti parentali e dei ricombinanti; valutazione della verosimiglianza ‘a posteriori’ sulla base del risultato osservato, e questo per una serie di ipotesi di linkage, cioè di valori di ricombinazione (); calcolo, per ciascuna frazione di ricombinazione, dell’ODD (= verosimiglianza dell’ipotesi / verosimiglianza dell’ipotesi di indipendenza); calcolo del logaritmo degli ODD (LOD) calcolati al punto 5; costruzione del grafico dei LOD
UN GENITORE DEVE ESSERE DOPPIO ETEROZIGOTE PER I DUE LOCI METODO DEI LOD SCORE: 1) Reperimento di famiglie informative UN GENITORE DEVE ESSERE DOPPIO ETEROZIGOTE PER I DUE LOCI
MEIOSI INFORMATIVE E NON INFORMATIVE Locus marcatore A, alleli A1, A2 ; Locus malattia (ignoto); malattia Autosomica Dominante individuo sano individuo malato A1 A1 A2 A2 A1 A2 A) NON INFORMATIVA Gli alleli del marcatore in omozigosi nel padre non possono essere distinti Queste famiglie NON sono MAI informative
MEIOSI INFORMATIVE E NON INFORMATIVE B) NON INFORMATIVA A1 A2 La figlia ha ereditato dal padre l’allele A1, ma può averlo ereditato insieme ad A1 OPPURE insieme ad A2 C) INFORMATIVA La figlia ha ereditato dal padre A1 INSIEME all’allele malattia A1 A2 A1 A1 I genitori della famiglia B) sono uguali a quelli della C), ma nel primo caso la famiglia è informativa, nel secondo no
MEIOSI INFORMATIVE E NON INFORMATIVE La figlia ha ereditato A1 dal padre insieme all’allele malattia Queste famiglie sono SEMPRE informative D) INFORMATIVA D) INFORMATIVA A1 A2 A3 A4 A1 A4 A1 A2 A3 A4 A1 A4
Per poter identificare senza ambiguità i gameti parentali e i ricombinanti è necessario avere informazioni su almeno 3 generazioni II-1 ha ricevuto dalla madre l’allele malattia del locus malattia E l’allele A1 del locus marcatore NR R II-1 ha ricevuto dalla madre l’allele malattia ma non sappiamo se abbia ricevuto dalla madre l’allele A1 o l’allele A2 del marcatore
1) sono associati? cioè θ < 0.5 I loci A e B 1) sono associati? cioè θ < 0.5 questa ipotesi è costituita da n ipotesi, una per ciascuno degli n valori compresi tra 0 e 0.5 oppure 2) sono indipendenti? cioè θ = 1 – θ = 0.5 ?
Il risultato R è rappresentato dal numero dei gameti P e NP Per cercare di rispondere a questa domanda applichiamo il metodo dei LOD SCORE Il risultato R è rappresentato dal numero dei gameti P e NP probabilità di un gamete P = 1 – θ probabilità di un gamete NP = θ tutte le ipotesi 1 (associazione) prevedono che P > NP l’ipotesi 2 (indipendenza) prevede che P = NP
Famiglia 1 5 P e 2 R Verosimiglianza di una dell’ipotesi 1 (associazione con θ = 0.01) (1 – θ)5 θ2 = 0.57 = 7.8125 x 10-3 Verosimiglianza dell’ipotesi 2 (indipendenza, quindi θ = 0.5) (1 – θ)5 θ2 = 0.992 x 0.015 = 9.5099 x 10-5 ODD = Rapporto di questi 2 valori a/b = 0.0122 LOD = log ODD = - 1.9146
LOD SCORE Z (0) = LOD SCORE Z (0.01) = - 1.9146 LOD SCORE Z (0.05) = - 0.6062 LOD SCORE Z (0.10) = - 0.1216 LOD SCORE Z (0.15) = 0.1065 ECC. IN QUESTO ESEMPIO IL LOD SCORE MASSIMO SI RAGGIUNGE IN CORRISPONDENZA DEL VALORE DI RICOMBINAZIONE = 0.286 (0.2884) Con questi dati si costruisce un grafico dei LOD
LOD + 3 Ipotesi di linkage accettata VALORI DI LOD CRITICI (valori soglia) LOD + 3 Ipotesi di linkage accettata verosimiglianza ‘a posteriori’ a favore del linkage 1000:1 verosimiglianza ‘a priori’ che due loci siano linked 1:50 (a sfavore dell’associazione) verosimiglianza globale 1000:50, cioè 20:1 LOD - 2 Ipotesi di linkage scartata verosimiglianza ‘a posteriori’ a favore dell’indipendenza 100:1 verosimiglianza ‘a priori’ a favore dell’indipendenza 49:1 verosimiglianza globale a favore dell’indipendenza 5000:1
Esempi di curve di lod score Evidenza di linkage assoluto Evidenza di linkage per θ = 0.23 Linkage escluso per valori di θ < 0.12 Risultato non conclusivo per tutti i valori di θ 1 linkage assoluto; 2 linkage per valori di ricombinazione 0.23; 3 linkage escluso per teta < 0.12; 4 non informativo
Il marcatore ideale per studi di mappatura genetica deve essere: altamente polimorfico; analizzabile con una tecnica semplice e a basso costo; analizzabile su un materiale biologico facilmente reperibile; Marcatori ideali sono STR (Simple Tandem Repeats) e SNP (Single Nucleotide Polymorphism)
Metodo dei LOD SCORE: range di efficienza: Massima per linkage assoluti. Teoricamente è in grado di scoprire qualsiasi grado di linkage, ma in pratica non è così per scoprire gradi di associazione modesti (= elevata frequenza di ricombinazione) è necessaria una quantità di dati non realisticamente ottenibile. Esempio con 25 gameti informativi si può arrivare a dimostrare che due loci sono linked solo se la frequenza di ricombinazione tra di essi non supera il 10% Se non ci sono ricombinanti 10 meiosi informative sono sufficienti a fornire prova di linkage. Se = 0.3 sono necessarie 85 meiosi informative per dare una prova convincente dell’esistenza di linkage Con la mappatura genetica si può restringere la regione in cui si trova un gene malattia a qualcosa dell’ordine di 1-2 cM (equivalenti a 1-2 Mb)
Con il metodo dei LOD SCORE si producono gruppi di associazione (o di sintenia). L’assegnazione ad un particolare cromosoma è possibile solo se un (o più) marcatore facente parte del gruppo di associazione è stato assegnato ad uno specifico cromosoma