Genetica delle popolazioni a.a. 07-08 prof S. Presciuttini Variabilità genetica - Frequenze genotipiche e geniche Questo documento è pubblicato sotto licenza.

Slides:



Advertisements
Presentazioni simili
Genetica delle popolazioni a.a prof S. Presciuttini FREQUENZE GENOTIPICHE E GENICHE Questo documento è pubblicato sotto licenza Creative Commons.
Advertisements

Genetica delle Popolazioni a.a prof S. Presciuttini LA STRUTTURA GENETICA DELLE POPOLAZIONI Questo documento è pubblicato sotto licenza Creative.
Genetica delle popolazioni a.a prof S. Presciuttini GLI EFFETTI DELL'ININCROCIO Questo documento è pubblicato sotto licenza Creative Commons Attribuzione.
Genetica delle popolazioni a.a prof S. Presciuttini POLIMORFISMI GENETICI Questo documento è pubblicato sotto licenza Creative Commons Attribuzione.
Genetica delle Popolazioni a.a prof S. Presciuttini L'INDICE DI FISSAZIONE “F” DI WRIGHT Questo documento è pubblicato sotto licenza Creative Commons.
Genetica delle Popolazioni a.a prof S. Presciuttini LA DERIVA GENETICA Questo documento è pubblicato sotto licenza Creative Commons Questo documento.
Genetica delle popolazioni a.a prof S. Presciuttini L'equilibrio di Hardy-Weinberg Questo documento è pubblicato sotto licenza Creative Commons.
MAPPE CROMOSOMICHE E FREQUENZA DI RICOMBINAZIONE
Genetica delle Popolazioni a.a prof S. Presciuttini DIMENSIONE EFFETTIVA DELLA POPOLAZIONE Questo documento è pubblicato sotto licenza Creative.
INDICI DI VARIABILITÀ GENETICA
13/11/
La chimica della vita Ogni organismo vivente è una macchina sofisticata, risultato di un complesso insieme di reazioni chimiche. La costruzione e il funzionamento.
Corso di Genetica Docente: Dott.ssa Valeria Specchia
L’altro importante equilibrio genetico è un EQUILIBRIO APLOIDE
Precorso di Statistica per le Lauree Magistrali
laboratorio evoluzione Marcello Sala
Mendel e la genetica S.M.S «Q.MAIORANA» Catania A.S.2015/2016
Ereditarietà di due o più geni indipendenti
GREGORIO MENDEL
GENETICA delle POPOLAZIONI
PILLOLE DI GENETICA parte 2
ASSOCIAZIONE E RICOMBINAZIONE DEI GENI
13/11/
DISTRIBUZIONI TEORICHE DI PROBABILITA’
13/11/
A Phenotypic Null Hypothesis for the Genetics of Personality E
Precorso di Statistica per le Lauree Magistrali
Esercizi su segregazione mendeliana
Mendel, il padre della genetica
GENETICA delle POPOLAZIONI
APPUNTI DI STATISTICA INFERENZIALE
Il DNA è un polimero di nucleotidi
13/11/
Esercizi.
Legge di Hardy-Weinberg
Parte 7 Misure di variabilità genetica e
Ereditarietà dei caratteri Geni e alleli Ogni carattere ereditario si trova sotto il controllo di una coppia di fattori detti geni. Le differenti caratteristiche.
Qual è la ragione di questa eterogeneità ?
L’analisi monovariata
Corso di Genetica -Lezione 2- Cenci
Statistica Scienza che studia i fenomeni collettivi.
Parte 9 Misure di variabilità genetica e
13/11/
AVVISO Il materiale riportato in queste diapositive è di esclusiva proprietà del Prof. Liborio Stuppia. La pubblicazione.
GREGORIO MENDEL
Corso di Genetica -Lezione 4- Cenci
VARIABILITA’ GENETICA
1.
PILLOLE DI GENETICA parte 2
AVVISO Il materiale riportato in queste diapositive è di esclusiva proprietà del Prof. Liborio Stuppia. La pubblicazione.
Teoria sintetica dell’evoluzione
Altre indagini di criminalistica… sinergia tra diverse discipline
MARCATORI POLIMORFICI DEL DNA
L’altro importante equilibrio genetico è un EQUILIBRIO APLOIDE
13/11/
Cominciano le indagini
MALATTIE DA ESPANSIONE (instabile) DI BREVI TRATTI RIPETUTI
13/11/
Precorso di Statistica per le Lauree Magistrali
Test per campioni indipendenti
Principi mendeliani: 1865 G. Mendel ( ).
Definizione di GENETICA
Evoluzione molecolare
13/11/
Le leggi di Mendel
Transcript della presentazione:

Genetica delle popolazioni a.a prof S. Presciuttini Variabilità genetica - Frequenze genotipiche e geniche Questo documento è pubblicato sotto licenza Creative Commons Attribuzione – Non commerciale – Condividi allo stesso modo

Genetica delle popolazioni a.a prof S. Presciuttini Linee pure di topo I ceppi di topo da laboratorio rappresentano il paradigma della minima possibile variabilità genetica che si può ottenere in una specie animale. I ceppi di topo da laboratorio rappresentano il paradigma della minima possibile variabilità genetica che si può ottenere in una specie animale. Nel 1909 fu fondato il primo ceppo di topo inincrociato (detto “DBA”, dalle sigle degli alleli per il colore del mantello di quel particoalre ceppo: dilute, d; brown, b; non-agouti, a), con l’esplicito scopo di ottenere una linea completamente omozigote da usare negli esperimenti di genetica. Nel 1909 fu fondato il primo ceppo di topo inincrociato (detto “DBA”, dalle sigle degli alleli per il colore del mantello di quel particoalre ceppo: dilute, d; brown, b; non-agouti, a), con l’esplicito scopo di ottenere una linea completamente omozigote da usare negli esperimenti di genetica. Lo schema era (e tuttora è) quello di accoppiare ad ogni generazione fratelli con sorelle: in questo modo la percentuale di loci che sono resi isogenici aumenta di generazione in generazione, fino a rendere tutto il genoma perfettamente omozigote. Lo schema era (e tuttora è) quello di accoppiare ad ogni generazione fratelli con sorelle: in questo modo la percentuale di loci che sono resi isogenici aumenta di generazione in generazione, fino a rendere tutto il genoma perfettamente omozigote. A quel punto solo la mutazione genetica può introdurre variabilità genetica A quel punto solo la mutazione genetica può introdurre variabilità genetica

Genetica delle popolazioni a.a prof S. Presciuttini L’inincrocio in accoppiamenti fratello-sorella In un accoppiamento fratello-sorella, la probabilità che uno qualunque di quattro tratti omologhi di DNA dei loro genitori si trovi identico per duplicazione in un loro figlio è del 25% In un accoppiamento fratello-sorella, la probabilità che uno qualunque di quattro tratti omologhi di DNA dei loro genitori si trovi identico per duplicazione in un loro figlio è del 25% Se i quattro tratti omologhi vengono designati A1, A2, A3 e A4, i genotipi possibili di ciascun figlio sono 4 (A1/A3, A1/A4, ecc.) Se i quattro tratti omologhi vengono designati A1, A2, A3 e A4, i genotipi possibili di ciascun figlio sono 4 (A1/A3, A1/A4, ecc.) Se ora consideriamo le probabilità con cui i figli formano i propri gameti troviamo ¼ A1, ¼ A2, ¼ A3, e ¼ A4. Se ora consideriamo le probabilità con cui i figli formano i propri gameti troviamo ¼ A1, ¼ A2, ¼ A3, e ¼ A4. Le probabilità dei genotipi dei figli di una coppia di fratelli pieni si trovano quindi facilmente con un diagramma di Punnett: ¼ di tutti i possibili figli risulta omozigote per l'uno o l'altro dei geni dei due nonni

Genetica delle popolazioni a.a prof S. Presciuttini L'aumento dell'omozigosità Ad ogni generazione di inincrocio una quota ulteriore dei loci rimanenti viene ridotta in omozigosi, cosicchè il coefficiente di inincrocio si approssima rapidamente a 1 (quando gli individui diventano tutti omozigoti e tutti geneticamente identici) In un sistema di accoppiamento fratello- sorella, il 98,6% del genoma è stato reso isogenico alla ventesima generazione, che è il limite convenzionalmente usato per definire commercialmente una linea di topo “pura”

Genetica delle popolazioni a.a prof S. Presciuttini La depressione da inincrocio Se il 98,6% del genoma è stato reso isogenico, tutti gli individui che nascono da quel momento da qualsiasi coppia del ceppo inincrociato sono quasi geneticamente identici e omozigoti per quasi tutti i geni Se il 98,6% del genoma è stato reso isogenico, tutti gli individui che nascono da quel momento da qualsiasi coppia del ceppo inincrociato sono quasi geneticamente identici e omozigoti per quasi tutti i geni Resta un 1,4% del genoma che ancora rappresenta la variabilità genetica esistente prima dell’inizio dell’inincrocio, la quale continua a ridursi continuando con lo stesso sistema di accoppiamento Resta un 1,4% del genoma che ancora rappresenta la variabilità genetica esistente prima dell’inizio dell’inincrocio, la quale continua a ridursi continuando con lo stesso sistema di accoppiamento I topi isogenici sono organismi molto particolari. Sono animali che possono sopravvivere solo nelle condizioni particolarmente permissive dell’allevamento artificiale, sono poco fertili (nonostante per definizione siano selezionati per dare prole fertile in condizione di inincrocio) e in generale sono poco “vitali” se confrontati con i ceppi selvatici. I topi isogenici sono organismi molto particolari. Sono animali che possono sopravvivere solo nelle condizioni particolarmente permissive dell’allevamento artificiale, sono poco fertili (nonostante per definizione siano selezionati per dare prole fertile in condizione di inincrocio) e in generale sono poco “vitali” se confrontati con i ceppi selvatici. Questo è il fenomeno della depressione da inincrocio Questo è il fenomeno della depressione da inincrocio

Genetica delle popolazioni a.a prof S. Presciuttini Il problema della variabilità genetica In generale, quanta variabilità genetica esiste nelle popolazioni naturali, tale che si manifesta sotto forma di quelle variazioni morfologiche, fisiologiche e comportamentali che sono la base dell'”adattamento” nella vita “selvaggia”? In generale, quanta variabilità genetica esiste nelle popolazioni naturali, tale che si manifesta sotto forma di quelle variazioni morfologiche, fisiologiche e comportamentali che sono la base dell'”adattamento” nella vita “selvaggia”? Considerando i ceppi isogenici, quanta variabilità genetica era presente nella popolazione selvatica da cui sono stati campionati gli animali fondatori, e che in questi animali è stata ridotta fino quasi a zero? Considerando i ceppi isogenici, quanta variabilità genetica era presente nella popolazione selvatica da cui sono stati campionati gli animali fondatori, e che in questi animali è stata ridotta fino quasi a zero?  Il caso del cane è paradigmatico: la variabilità genetica che sottostà alla variazione fra razze riflette evidentemente l’entità della diversità genetica presente nel progenitore del cane, il lupo, a parte poche mutazioni insorte dopo la domesticazione e conservate in alcune razze. Questo ci dice che le popolazioni naturali devono possedere una riserva considerevole di variabilità genetica: il problema è capirne la natura e darne una descrizione esauriente Questo ci dice che le popolazioni naturali devono possedere una riserva considerevole di variabilità genetica: il problema è capirne la natura e darne una descrizione esauriente

Genetica delle popolazioni a.a prof S. Presciuttini Tecniche di studio della variabilità genetica Storicamente lo studio della variabilità genetica nelle popolazioni naturali ha seguito il percorso delle tecniche che sono state via via messe a punto nella genetica sperimentale Storicamente lo studio della variabilità genetica nelle popolazioni naturali ha seguito il percorso delle tecniche che sono state via via messe a punto nella genetica sperimentale  per i primi decenni del secolo scorso erano disponibili per l’analisi i rari mutanti visibili, alcuni gruppi sanguigni e i loci polimorfici responsabili delle differenze della pigmentazione cutanea  a partire dalla metà degli anni ’60 l’elettroforesi delle proteine rivelò una quota insospettata di variabilità genetica, soprattutto per gli enzimi coinvolti nel metabolismo delle fonti energetiche  solo con lo sviluppo delle tecniche di manipolazione del DNA (anni ’80) e soprattutto con lo sviluppo della reazione a catena della polimerasi è diventato possibile studiare direttamente la variabilità genetica al suo livello fondamentale.

Genetica delle popolazioni a.a prof S. Presciuttini Polimorfismi genetici Consideriamo un singolo tratto di DNA non eccessivamente lungo (diciamo un migliaio di coppie di basi) preso a caso dal genoma di una popolazione selvatica, e supponiamo di esaminare un campione non proibitivamente grande di individui (diciamo 500 fra maschi e femmine, quindi in tutto 1000 tratti omologhi indipendenti). Consideriamo un singolo tratto di DNA non eccessivamente lungo (diciamo un migliaio di coppie di basi) preso a caso dal genoma di una popolazione selvatica, e supponiamo di esaminare un campione non proibitivamente grande di individui (diciamo 500 fra maschi e femmine, quindi in tutto 1000 tratti omologhi indipendenti). Possiamo distingure vari casi possibili Possiamo distingure vari casi possibili  tutte le sequenze di tutti gli individui del campione sono identiche: in questa situazione si dice che il nostro locus è monomorfico.  se in un piccolo numero (diciamo da 1 a 10) dei cromosomi campionati identifichiamo una sequenza diversa parliamo di variante rara  se troviamo una variante più frequente, diciamo presente in più di 10 cromosomi del nostro campione (frequenza >1%), parliamo di polimorfismo genetico  Se nel nostro campione sono presenti più di due diverse sequenze a frequenza apprezzabile parliamo di locus multiallelico  se infine sono presenti molti alleli diversi (diciamo più di 5) a frequenze apprezzabili, parleremo di locus ipervariabile.

Genetica delle popolazioni a.a prof S. Presciuttini La relatività del polimorfismo genetico Come è distribuito il polimorfismo genetico rispetto alle sequenze reali del DNA di una popolazione naturale? Come è distribuito il polimorfismo genetico rispetto alle sequenze reali del DNA di una popolazione naturale?  La risposta dipende molto dal tipo di sequenza che stiamo esaminando, a seconda cioè se si tratta di un segmento codificante o meno, se fa parte di un gene (introne) o no, se al suo interno è presente un microsatellite, ecc. Quindi i generale i livelli di polimorfismo genetico devono essere riferiti a classi specifiche di elementi genetici.  A quel punto si possono confrontare fra loro i livelli osservati di variabilità genetica, fra loci o fra popolazioni, perchè si stanno esaminando oggetti omogenei fra loro.  A quel punto si possono confrontare fra loro i livelli osservati di variabilità genetica, fra loci o fra popolazioni, perchè si stanno esaminando oggetti omogenei fra loro. Qual’è significato fenotipico delle varianti genetiche? Qual’è significato fenotipico delle varianti genetiche?  La grande maggioranza della variazione genetica presente in natura è neutrale, in quanto si trova in DNA la cui sequenza non ha uno specifico rilievo funzionale. È comunque un compito difficile quello di stabilire se una certa variante è coinvolta, e quanto, nell’espressione di un tratto fenotipico.

Genetica delle popolazioni a.a prof S. Presciuttini Un esempio: proteine seriche Un esempio di variazione genetica entro e fra popolazioni è riportato nell’articolo di M. K. Das, K. Das e S. S. Mastana: Genetic Variation of Serum Proteins Among the Koch Sub-populations of West Bengal, India (Int J Hum Genet, 2(4): , 2002), relativo a tre popolazioni umane del Bengala occidentale tipizzate per quattro proteine seriche. Un esempio di variazione genetica entro e fra popolazioni è riportato nell’articolo di M. K. Das, K. Das e S. S. Mastana: Genetic Variation of Serum Proteins Among the Koch Sub-populations of West Bengal, India (Int J Hum Genet, 2(4): , 2002), relativo a tre popolazioni umane del Bengala occidentale tipizzate per quattro proteine seriche.  Le “proteine seriche” fanno parte dei marcatori genetici classici, che erano già disponibili prima dell’avvento dell’analisi del DNA. La tipizzazione fa uso della tecnica di elettroforesi in gel d’amido sviluppata a metà degli anni ’50, che consente di separare miscele di proteine diverse sulla base delle loro dimensioni e cariche elettriche. Miglioramenti successivi sono stati l’introduzione della focalizzazione isoelettrica (elettroforesi in gradiente di pH), che consente una ulteriore separazione delle proteine non risolte, e l’introduzione del gel di poliacrilamide.  L'analisi di alcune proteine seriche fa parte degli esami routinari del sangue, mentre altre hanno interesse solo per la variabilità genetica che mostrano nelle popolazioni

Genetica delle popolazioni a.a prof S. Presciuttini Numerosità osservate Una parte della tabella di Das et al., relativa ad uno dei marcatori tipizzati, è riportata nella figura seguente. La colonna di sinistra mostra il nome del locus (Componente Gruppo Specifico o GC), i fenotipi individuati e il nome degli alleli; a destra seguono i dati di due delle tre popolazioni studiate. Una parte della tabella di Das et al., relativa ad uno dei marcatori tipizzati, è riportata nella figura seguente. La colonna di sinistra mostra il nome del locus (Componente Gruppo Specifico o GC), i fenotipi individuati e il nome degli alleli; a destra seguono i dati di due delle tre popolazioni studiate. Consideriamo la colonna “Obs. No.” (numerosità osservata): vediamo ad es. che 5 soggetti sono “ISIS”, e dall’elenco degli alleli deduciamo che si tratta di soggetti attribuiti al genotipo omozigote per l’allele IS. I totali dei due campioni sono 38 e 45 soggetti

Genetica delle popolazioni a.a prof S. Presciuttini Frequenze alleliche Per questo locus sono stati individuati 3 alleli, denominati *IS, *IF e *2, che sono presenti nei campioni in 5 delle 6 combinazioni possibili, le cui frequenze sono 0,474, 0,329 e 0,197 Per questo locus sono stati individuati 3 alleli, denominati *IS, *IF e *2, che sono presenti nei campioni in 5 delle 6 combinazioni possibili, le cui frequenze sono 0,474, 0,329 e 0,197 Come sono calcolate le frequenze alleliche? In questo caso gli alleli sono distinguibili l'uno dall'altro (codominanza) e il calcolo è elementare. Come sono calcolate le frequenze alleliche? In questo caso gli alleli sono distinguibili l'uno dall'altro (codominanza) e il calcolo è elementare. Si tratta semplicemente di contare la numerosità di ciascun allele nel campione e di riportarla a 1 Si tratta semplicemente di contare la numerosità di ciascun allele nel campione e di riportarla a 1  per l’allele *IS, 10 copie sono presenti nei 5 genotipi ISIS, e 13 copie sono presenti sia nel genotipo ISIF che nel genotipo 2IS; quindi abbiamo 36 copie *IS, che riportate al totale dei geni esaminati per il sistema GC (che è il doppio degli individui tipizzati, 2N =76) fa esattamente 0,474. (Nota: c’è un errore di stampa nella frequenza di questo allele nella seconda popolazione). Analogamente si contano le numerosità degli altri due alleli e si riportano in frequenza relativa

Genetica delle popolazioni a.a prof S. Presciuttini Frequenze alleliche per sistemi codominanti Dunque nel caso di sistemi codominanti si può scrivere la regola generale p i = (2n ii +  j  i n ij )/(2n), cioè anche p i = (n ii + ½  j  i n ij )/n (1) dove p i è la frequenza dell’allele i (i = 1, 2, o 3 nel caso del sistema GC), n ii è la numerosità del genotipo omozigote per l'allele i e  j  i n ij indica la somma di n ij per tutti i valori di j ( j = 1, 2, 3), tranne quando j = i; n è il numero totale degli individui del campione Se le frequenze genotipiche sono espresse in frequenze relative (a somma 1), f ij (= n ij /N,  f ij = 1), esse possono essere usate al posto di n ii nell’eq. (1).

Genetica delle popolazioni a.a prof S. Presciuttini La stima delle frequenze alleliche e del loro errore In effetti noi non siamo interessati tanto alla frequenza allelica osservata in un dato campione quanto piuttosto alla frequenza allelica nella popolazione che quel campione rappresenta. In effetti noi non siamo interessati tanto alla frequenza allelica osservata in un dato campione quanto piuttosto alla frequenza allelica nella popolazione che quel campione rappresenta. Cioè noi esaminiamo un campione assumendo che esso sia rappresentativo della popolazione cui esso appartiene, e inferiamo le proprietà di questa dal campione stesso. Cioè noi esaminiamo un campione assumendo che esso sia rappresentativo della popolazione cui esso appartiene, e inferiamo le proprietà di questa dal campione stesso. Nel caso di sistemi codominanti si può mostrare che la miglior stima della frequenza (  i ) dell’i-esimo allele nella popolazione è data dall’eq. (1). Quindi semplicemente poniamo  i = p i. Nel caso di sistemi codominanti si può mostrare che la miglior stima della frequenza (  i ) dell’i-esimo allele nella popolazione è data dall’eq. (1). Quindi semplicemente poniamo  i = p i. Però ci dobbiamo porre il problema dell’errore dovuto al campionamento: se si estraggono a caso un numero limitato di genotipi, ci sarà inevitabilmente una certa variazione casuale delle frequenze alleliche calcolate nel campione rispetto a quelle della popolazione, e più è piccolo il campione, più grande è la deviazione che mediamente ci aspettiamo. Però ci dobbiamo porre il problema dell’errore dovuto al campionamento: se si estraggono a caso un numero limitato di genotipi, ci sarà inevitabilmente una certa variazione casuale delle frequenze alleliche calcolate nel campione rispetto a quelle della popolazione, e più è piccolo il campione, più grande è la deviazione che mediamente ci aspettiamo.

Genetica delle popolazioni a.a prof S. Presciuttini Errore standard delle frequenze alleliche Assumendo che il campionamento sia multinomiale, la varianza teorica delle frequenze alleliche V(  i ) è data da Assumendo che il campionamento sia multinomiale, la varianza teorica delle frequenze alleliche V(  i ) è data da V(  i ) =  i (1 -  i )/(2N) Questa è la varianza attesa in un gran numero di campioni della stessa dimensione estratti a caso da una popolazioni in cui la frequenza allelica è  i. Quindi l’errore standard delle frequenze alleliche [s.e.(p i )] si stima come s.e.(p i ) = V(  i ) ½. s.e.(p i ) = V(  i ) ½. Ad esempio gli errori standard delle frequenze di *IS, *If e *2 nella prima popolazione di Das et al. sono rispettivamente [0,474 x (1 – 0,474)/76] ½ = 0,057, [0,329 x (1 – 0,329)/76] ½ = 0,054, e [0,197 x (1 – 0,197)/76] ½ = 0,046, come riportato in tabella accanto alla stima delle frequenze alleliche.

Genetica delle popolazioni a.a prof S. Presciuttini Eterogeneità delle frequenze alleliche fra popolazioni ● L’errore standard delle frequenze è essenziale per calcolare la significatività delle differenze osservate fra popolazioni. ● Per esempio, un modo molto semplice per decidere se una differenza osservata fra le frequenze alleliche di due popolazioni è significativa “al livello del 5%” è quello di calcolare i limiti di confidenza del 95% (95% C.L.) delle frequenze stimate, che si trovano come 95% C.I. = p i  1,96 x s.e.(p i ), e controllando se non ci sia sovrapposizione fra i due intervalli delimitati da questi limiti. Si può facilmente verificare che le frequenze alleliche stimate nelle due popolazioni di Das et al. non sono significativamente diverse le une dalle altre; quindi sulla base di questi due campioni non possiamo concludere che ci troviamo in presenza di popolazioni eterogenee per frequenze alleliche