Genetica di popolazioni Guido Barbujani Dip. Biologia ed Evoluzione Università di Ferrara g.barbujani@unife.it
Capire le basi genetiche dell’evoluzione Obiettivi del corso: Capire le basi genetiche dell’evoluzione Arrivare a poter leggere criticamente un articolo Arrivare a porsi domande scientificamente corrette
Cose da ricordare Cos’è un gene, un allele, un aplotipo Com’è fatto il DNA Com’è fatto un gene Eucariote Com’è fatto un gene procariote Com’è la struttura dei geni (siti codificanti, siti di regolazione, introni, esoni) Come funzionano i geni
Programma del corso 1. Equilibrio e fattori di scostamento: linkage disequilibrium e mutazione 2. Equilibrio e fattori di scostamento: deriva, flusso genico e selezione 3. Mantenimento dei polimorfismi 4. Introduzione al coalescente
Programma 1 (a) Diversità genetica (b) Equilibrio di Hardy-Weinberg (c) Linkage disequilibrium (d) Mutazione
Prima di tutto: non c’è genetica senza variabilità Variabilità morfologica
Variabilità genetica: proteine
I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il 10% del genoma Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra parte contiene importanti siti di regolazione
Tipi di polimorfismo studiati nel DNA Di restrizione Single Nucleotide Polymorphisms: SNPs Numero di copie di elementi ripetuti Inserzione/delezione: Indel
Variabilità genetica: DNA
Variabilità genetica: DNA
Variabilità genetica in Arabidopsis thaliana: SNPs Nordborg et al., 2005 PLoS Biology
Tipi di polimorfismo studiati nel DNA 1. Di restrizione
Tipi di polimorfismo studiati nel DNA 2. SNP Almeno 3 milioni di SNP nel genoma umano
Tipi di polimorfismo studiati nel DNA 3. Numero di copie di elementi ripetuti: STR e VNTR
Tipi di polimorfismo studiati nel DNA 3. Numero di copie di elementi ripetuti: STR
Tipi di polimorfismo studiati nel DNA 4. Inserzione/delezione: Indel
Tipi di polimorfismo studiati nel DNA 4. Inserzione/delezione: Inserzione di retrovirus
Tassi medi di mutazione per vari polimorfismi (per locus per generazione) VNTR 10-1 – 10-2 STR 10-2 – 10-4 SNPs 10-6 – 10-8 Indel (retrovirus) 10-10 – 10-11 Nella regione ipervariabile del DNA mitocondriale, valori fino a 5 x 10-5 per sito per generazione
Quand’è che una popolazione può dirsi variabile?
Misure di diversità genetica N di alleli Eterozigosi osservata: Ho = N genotipi eteroz./N genotipi totali Eterozigosi attesa: H = 1 –Σ pi2 (la frazione di individui che ci si aspetta siano eterozigoti a un gene sconosciuto)
Quand’è che una popolazione può dirsi variabile? N alleli = 5 N alleli = 2 HO = 0.4 HO = 0.6 H = 0.35 H = 0.5 Quando il genotipo individuale è difficile da prevedere
Quand’è che una popolazione può dirsi variabile? Quando molti siti del DNA sono variabili diversità nucleotidica: π = N siti polimorfici / N totale siti Quando ci sono grandi differenze molecolari fra I suoi membri mismatch medio: k = Σ dij / [N (N-1) / 2]
Il mismatch è il numero di sostituzioni fra coppie di individui TCTAGA CCTAGA CCTAGG CTTAGA CTTAAA 1 2 2 2 1 2 2 1 3 1 Σ dij = 17 k = 1.7
(Ricostruzioni parsimoniose) TCTAGA CCTAGA CCTAGG CTTAGA CTTAAA 1 1 1 1 Σ dij = 17 k = 1.7
Un’applicazione: variabilità STR in popolazioni di lupi scandinavi (Flagstad et al. 2003) N alleli HO H 1829-1889 5.0 0.66 0.74 1890-1939 4.4 0.61 0.68 1940-1980 3.1 0.45 0.52 Finlandia 4.9 0.69 0.72
Nota bene La variabilità interna di una popolazione è solo uno degli aspetti della variabilità genetica: Variabilità tra individui della stessa popolazione Variabilità tra individui di popolazioni diverse Variabilità tra individui di gruppi di popolazioni diverse eccetera
Programma 1 (a) Diversità genetica (b) Equilibrio di Hardy-Weinberg (c) Linkage disequilibrium (d) Mutazione
Frequenze Un locus: frequenza allelica genotipi: AA, Aa, aa oppure H1H7, H4H4, H1H2 oppure *6*9, *7*10, *7*7 Due o più loci: frequenza aplotipica genotipi: A2B1C2/A1B1C1, o 212/111 A2B2C2/A1B2C1, o 222/121 Si può immaginare la frequenza di un aplotipo come la frequenza dei gameti che portano quella combinazione di alleli fase
L’equilibrio di Hardy-Weinberg Dopo una generazione di accoppiamento casuale: Genotipo AA Aa aa Frequenza p2 2pq q2
Accoppiamento casuale o random mating MAT. FREQ. PROGENIE AA Aa aa AA x AA (p2)(p2) p4 AA x Aa (p2)(2pq) 2p3q p3q AA x aa (p2)(q2) p2q2 Aa x AA (2pq)(p2) Aa x Aa (2pq)(2pq) 4p2q2 2p2q2 Aa x aa (2pq)(q2) 2pq3 pq3 aa x AA (q2)(p2) aa x Aa (q2)(2pq) aa x aa (q2)(q2) q4
E alla fine nella progenie f(AA) = p4 + 2p3q + p2q2= p2 (p2+ 2pq +q2) = p2 f(Aa) = 2p3q + 4p2q2 + 2pq3 = 2pq (p2 + 2pq +q2) = 2pq f(aa) = p2q2 + 2pq3 + q4 = q2 (p2 + 2pq +q2) = q2 Cioè esattamente le frequenze che si ottengono immaginando di accoppiare a caso I gameti del pool genico parentale
Se una popolazione è in equilibrio Le frequenze genotipiche dipendono esclusivamente dalle frequenze alleliche o aplotipiche della generazione precedente Le frequenze alleliche o aplotipiche non cambiano attraverso le generazioni Quindi, se c’è equilibrio non c’è evoluzione, e viceversa
Condizioni per l’equilibrio di Hardy-Weinberg Organismo diploide, riproduzione sessuata Generazioni non sovrapposte Unione casuale Popolazione grande Mutazione trascurabile Migrazione trascurabile Mortalità indipendente dal genotipo Fertilità indipendente dal genotipo
Se non si incontrano queste condizioni: Unione casuale Inbreeding Popolazione grande Deriva genetica Mutazione trascurabile Mutazione Migrazione trascurabile Migrazione Mortalità indipendente dal genotipo Selezione Fertilità indipendente dal genotipo Selezione In caso si studi più di un locus: Associazione casuale degli alleli Linkage disequilibrium sui cromosomi
Unione non casuale Quando la scelta del partner riproduttivo non è casuale rispetto al suo genotipo si parla di unione assortativa L’unione assortativa è positiva quando si scelgono preferenzialmente partner geneticamente affini, negativa quando avviene il contrario
Unione non casuale L’unione assortativa positiva provoca un deficit di eterozigoti rispetto alle attese di Hardy-Weinberg Il deficit di eterozigoti viene misurato dal coefficiente F di inbreeding Coefficienti di inbreeding possono essere stimati dalle frequenze genotipiche o dagli alberi genealogici L’inbreeding è conseguenza anche del fatto che il numero di antenati di ognuno raddoppia ad ogni generazione, mentre le popolazioni hanno dimensioni finite
Unione assortativa positiva: autofecondazione f(AA) = ¼ f(Aa) = ½ f(aa) = ¼ ¼ AA x AA 100% AA ½ Aa x Aa ¼ AA, ½ Aa, ¼ aa ¼ aa x aa 100% aa f(AA) = ¼ + (½ x ¼) f(Aa) = ½ f(aa) = ¼ + (½ x ¼) f(AA) = 3/8 f(Aa) = ¼ f(aa) = 3/8
Unione assortativa positiva: autofecondazione f(AA) = 3/8 f(Aa) = ¼ f(aa) = 3/8 3/8 AA x AA 100% AA ¼ Aa x Aa ¼ AA, ½ Aa, ¼ aa 3/8 aa x aa 100% aa f(AA) = 3/8 + (¼ x ¼) f(Aa) = ¼ f(aa) = 3/8 + (¼ x ¼) f(AA) = 7/16 f(Aa) = 1/8 f(aa) = 7/16
Unione assortativa positiva: autofecondazione Generazione AA Aa aa 1 ¼ ½ ¼ 2 3/8 1/4 3/8 3 7/16 1/8 7/16 4 15/32 1/16 15/32 N 1/2N
Effetti dell’inbreeding La tendenza ad accoppiarsi fra consanguinei determina la comparsa nella progenie di un eccesso di omozigoti:
Unione assortativa positiva: inbreeding Se Foss(Aa) = H Fatt(Aa) = H0 = 2pq (H0 – H) / H0 = F coefficiente di inbreeding FH0 = H0 – H H = H0 – FH0 , ma H0 = 2pq H = 2pq - 2pqF = 2pq(1-F) Un coefficiente di inbreeding pari a F porta a un deficit di eterozigoti pari a (1-F): metà AA e metà aa
Effetto dell’inbreeding Genotipo Hardy-Weinberg con inbreeding AA p2 p2 + pqF Aa 2pq 2pq (1-F) aa q2 q2 + pqF L’inbreeding non altera le frequenze alleliche
Depressione da inbreeding Pony delle Shetland
Nessuno è immune dall’inbreeding 40 generazioni fa (1000 dC): 1 000 000 000 000 antenati Popolazione stimata della terra: 100 000 000 80 generazioni fa: 1030 antenati 1000 generazioni fa: 10300 antenati Popolazione stimata della terra: 1 000 000 Quindi: Del milione di individui presenti 25 000 anni fa, molti non hanno lasciato discendenti, molti non sono nostri antenati, altri lo sono miliardi di volte Le nostre genealogie sono tutte fortemente intrecciate
Stima del coefficiente di inbreeding da pedigree
Stima del coefficiente di inbreeding da pedigree ½ Aa ½ ½ F = (½)5 = 1/32
Stima del coefficiente di inbreeding da pedigree F = (½)5 x 2 = 1/32 x 2 = 1/16
Stima del coefficiente di inbreeding da pedigree Il valore di F è pari a ½ elevato a una potenza pari al numero di passaggi nel pedigree. Valore di F nella progenie di varie unioni consanguinee: Autofecondazione: ½ Fra fratello e sorella: ¼ Fra zio e nipote: 1/8 Fra cugini primi: 1/16 Fra cugini 1 e ½: 1/32 Fra cugini secondi: 1/64 …