LA STATISTICA F DI WRIGHT Questo documento è pubblicato sotto licenza Creative Commons Attribuzione – Non commerciale – Condividi allo stesso modo http://creativecommons.org/licenses/by-nc-sa/2.5/deed.it
La struttura gerarchica delle popolazioni Nell'esempio visto sopra nell'illustrare l'effetto di Wahlund, abbiamo assunto che le due sottopopolazioni fossero in perfetto equilibrio di Hardy- Weinberg, cioè che fossero panmittiche Nella realtà questo accade di rado, perchè la geografia stessa dei territori impone spesso vincoli locali al flusso genico, e questo si traduce in una deviazione dalla panmissia anche delle piccole popolazioni che fanno parte di una “metapopolazione” Ciò si traduce in una struttura “gerarchica” delle popolazioni, in cui le varie sottopopolazioni costituiscono insiemi via via più grandi con l'aumentare della scale geografica di osservazione
Livelli di frammentazione delle popolazioni Se le popolazioni sono strutturate, si può calcolare un indice di fissazione per ciascun livello della suddivisione gerarchica, ad es. un indice per una popolazioni locale, un indice per una popolazione più grande che la comprende come subunità e un indice per il livello ancora superiore È dunque necessario distinguore con simboli appropriati gli indici di fissazione che misurano gli effetti della frammentazione ai vari livelli Spesso l'analisi della struttura delle popolazioni viene descritta mediante le cosiddette statistiche F, per mezzo delle quali il coefficiente di fissazione viene ripartito negli indici FIT, FST e FIS.
Le statistiche F FIT ≈ FST + FIS FIS è il coefficiente di fissazione degli Individui delle Sottopopolazioni, e corrisponde ad una media degli F calcolati per ciascuna singola sottopopolazione FIT è il coefficiente di fissazione degli Individui calcolato per la popolazione Totale, come se questa fosse una singola popolazione FST è una quota dell'indice di fissazione totale che deriva dal fatto che FIT è maggiore di FIS, e deriva dalla differenza fra le frequenze alleliche delle sottopopolazioni. Nell'esempio visto sopra, dato che il coefficiente di fissazione delle due sottopopolazioni è zero, tutto il valore dell'indice di fissazione degli individui deriva dalla differenza delle frequenze alleliche, quindi FIT = FST. Per valori piccoli dei coefficienti di fissazione (all'incirca <0.05) si può effettivamente scrivere l'equazione approssimata FIT ≈ FST + FIS
Calcolo delle statistiche F I valori delle statistiche F possono essere calcolati utilizzando le eterozigosità osservate e attese calcolate ai vari livelli 𝐅 𝐼𝑆 =𝟏− 𝐇 𝐈 𝐇 𝐒 𝐅 𝑆𝑇 =𝟏− 𝐇 𝐒 𝐇 𝐓 𝐅 𝐼𝑇 =𝟏− 𝐇 𝐈 𝐇 𝐓 Dove HI è l'eterozigosità osservata, mediata su tutte le sottopopolazioni, HS è l'eterozigosità attesa mediata su tutte le sottopopolazioni, e HT é l'eterozigosità attesa nella popolazione totale
Il significato delle statistiche F È importante notare che sia FIT che FIS dipendono dalla conta dei genotipi individuali nelle singole sottopopolazioni; infatti HI è una eterozigosità osservata Ambedue questi indici possono assumere sia valori positivi che negativi, a seconda che nelle popolazioni vi sia un eccesso o un difetto di eterozigoti Invece FST non dipende direttamente dall'osservazione dei genotipi, perchè sia al numeratore che al denominatore compaiono le eterozigopsità attese, e queste sono funzione delle frequenze alleliche Quindi FST è un indice che misura la variazione delle frequenze alleliche fra le sottopopolazioni, e può assumere solo valori positivi
Indici analoghi a FST Nel corso del tempo sono stati sviluppati diversi approcci alla struttura genetica delle popolazioni Gli indici analoghi a FST più comunemente usati sono: Θ (theta) di Weir e Cockerham (1984) GST di Nei (1973) RST di Slatkin (1995), sviluppato nell'ambito della genetica dei microsatelliti