Identificazione e tipizzazione di minisatelliti Come per gli STRs, l’identificazione dei minisatelliti avveniva in passato mediante ibridazione di sonde ripetitive su library di DNA e successivo subclonaggio e sequenziamento dei cloni positivi. Oggi i minisatelliti vengono identificati “in silico” nei database di sequenze genomiche con il software “tandem repeats finder”, esattamente come i microsatelliti. Data la lunghezza dei minisatelliti, non sempre è possibile amplificarli mediante PCR, ed in alcuni casi si utilizza il southern blotting. In questo caso si utilizza spesso una sonda che riconosce un motivo “core” comune a più minisatelliti, e che permette di evidenziare più minisatelliti contemporaneamente (ma senza conoscere la loro identità) DNA fingerprinting
Identificazione e tipizzazione di polimorfismi Alu Identificazione: ricerca in database di elementi Alu giovani (famiglia Alu Y), che hanno una più elevata probabilità di essere stati trasposti durante l’evoluzione umana e quindi di essere polimorfici. Tipizzazione: tramite PCR, con primers che fiancheggiano il sito di inserzione ed elettroforesi su gel d’agarosio. Sono i polimorfismi più facili da analizzare
Identificazione e tipizzazione di polimorfismi LINE1 Identificazione: ricerca in database di elementi LINE1 giovani (famiglia Ta), che hanno una più elevata probabilità di essere stati trasposti durante l’evoluzione umana e quindi di essere polimorfici. Tipizzazione: tramite PCR (vedi figura).
"sigle" di uso comune SNPs: single nucleotide polymorphisms SNS: single nucleotide substitutions UEPs: unique event polymorphisms STRs: short tandem repeats (microsatelliti) VNTRs:variable number of tandem repeats RFLP: restrict fragment length polymorphism LINEs: long interspersed elements SINEs: short interspersed elements DHPLC: denaturing high performance liquid chromatography SSCP: single strand conformational polymorphism ASA: allele specific amplification ASO: allele specific oligonucleotide
LA VARIABILITA’ GENETICA COME “STRUMENTO” APPLICAZIONI BASATE SUL LINKAGE MAPPATURA GENICA MEDIANTE ANALISI DEL LINKAGE NELLE FAMIGLIE MAPPATURA GENICA MEDIANTE ANALISI DEL LINKAGE A LIVELLO DI POPOLAZIONI (LINKAGE DISEQUILIBRIUM MAPPING) DIAGNOSI PRENATALE GENETICA FORENSE IDENTIFICAZIONE PERSONALE PATERNITA’ INCERTA STUDI SULL’EVOLUZIONE INTERSPECIE INTERPOPOLAZIONI DNA “antico”
quale marcatore? In qualsiasi tipo di applicazione dovrete scegliere tra diversi tipi di marcatori. Per fare questo bisogna tener conto di una serie di caratteristiche dei diversi marcatori, che possono essere più o meno importanti a seconda dei casi: distribuzione sul genoma tasso di mutazione grado di eterozigosità tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo Caratteristiche biologiche Caratteristiche tecniche
quale marcatore? distribuzione sul genoma tasso di mutazione grado di eterozigosità tempi tecnici dell’esperimento costi dell’esperimento possibilità di tipizzare con PCR costi dell’attrezzatura precisione del metodo Escludiamo, per tutte le applicazioni, variazioni di numero e grandi variazioni di struttura dei cromosomi Escludiamo, per tutte le applicazioni, polimorfismi di repeats telomeriche, macrosatelliti, varianti strutturali Consideriamo quindi: SNPs (include SNS e insdel di una base); piccole insdel > 1bp; microsatelliti, minisatelliti, polimorfismi Alu e LINE1
esempio: mappatura mediante linkage nelle famiglie quale marcatore? esempio: mappatura mediante linkage nelle famiglie distribuzione nel genoma: fondamentale, omogeneamente distribuiti e comuni nel genoma: OK STRs e SNPs tasso di mutazione: poco rilevante grado di eterozigosità: fondamentale, il numero di meiosi informative è correlato al grado di eterozigosità del marcatore: OK STRs e parte degli SNPs (quelli con H elevata) tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo possibilità di automazione su larga scala: OK SNPs
esempio: mappatura mediante linkage disequilibrium quale marcatore? esempio: mappatura mediante linkage disequilibrium distribuzione nel genoma: fondamentale, omogeneamente distribuiti e comuni nel genoma: OK STRs e SNPs tasso di mutazione: molto importante, OK SNPs grado di eterozigosità: importante OK STRs e parte degli SNPs (quelli con H elevata) tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo possibilità di automazione su larga scala: OK SNPs
esempio: identificazione personale quale marcatore? esempio: identificazione personale distribuzione nel genoma: sufficiente che i geni non siano in LD per una più facile trattazione statistica: OK tutti i marcatori tasso di mutazione: non rilevante OK tutti i marcatori grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore l’informazione. OK minisatelliti, STRs ereditarietà mendeliana: importante per una più facile trattazione statistica tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo tipizzazione mediante PCR: fondamentale: spesso quantità di DNA minime possibilità di automazione su larga scala: non rilevante
esempio: test di paternità quale marcatore? esempio: test di paternità distribuzione nel genoma: sufficiente che i geni non siano in LD per una più facile trattazione statistica: OK tutti i marcatori tasso di mutazione: non fondamentale ma da tenere in considerazione OK tutti i marcatori grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore l’informazione: OK minisatelliti, STR ereditarietà mendeliana: importante per una più facile trattazione statistica OK STR, SNPs tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo tipizzazione mediante PCR: non rilevante se non in relazione ai costi possibilità di automazione su larga scala: non rilevante
esempio: studi evolutivi interspecie quale marcatore? esempio: studi evolutivi interspecie distribuzione nel genoma: non rilevante tasso di mutazione: fondamentale, deve essere contenuto OK SNPs, NO STRs grado di eterozigosità: non rilevante tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo tipizzazione mediante PCR: non rilevante se non in relazione ai costi
esempio: studi evolutivi intraspecie quale marcatore? esempio: studi evolutivi intraspecie distribuzione nel genoma: non rilevante tasso di mutazione: dipende dal contesto, possono essere usati SNPs, Alu, STRs, ma in modo diverso grado di eterozigosità: +/- importante a seconda dei casi tempi tecnici dell’esperimento costi dell’attrezzatura costi dell’esperimento precisione del metodo: fondamentale
Un allele è una variazione ad un locus ad esempio Allele 1: CCGCTACGTACGGCGATCGATGGCGGCCACGCTCGCGATCGCTACGCTA Allele 2: CCGCTACGTACGGCGATCGATGGCGGCTACGCTCGCGATCGCTACGCTA La frequenza allelica è la frequenza di un certo allele in una popolazione. Es. Popolazione composta da 20 omozigoti CC 45 eterozigoti CT 35 omozigoti TT Frequenza allele C = (20 x 2 + 45)/ 2x100 = 0.425 Frequenza allele T = (35 x 2 + 45)/ 2x100 = 0.575 Eterozigosità della popolazione per il locus in esame = 1-0.4252-0.5752 = 0.489
Equilibrio di Hardy-Weinberg Assunzioni: accoppiamento casuale no mutazione no migrazione no selezione popolazione infinita (no deriva genetica) sia p la frequenza di A , e q la frequenza di a . = p2 = q2 = 2pq AA Aa aa Le frequenze genotipiche raggiungono l’equilibrio in una generazione; Le frequenze alleliche rimangono costanti nel tempo All’equilibrio:
La variabilità interpopolazioni Esiste variabilità tra popolazioni, relativamente ad un locus, quando le frequenze degli alleli sono diverse tra le popolazioni La variabilità interpopolazioni si misura mediante distanze genetiche, La misura di distanza genetica più utilizzata è l’indice di fissazione FST Le frecce indicano il tipo di variabilità più frequentemente osservata nelle popolazioni umane Note per gli studenti: per la variabilità intrapopolazioni fai riferimento alle diapositive 24-25
L’indice di fissazione FST Date 2 popolazioni pop1 e pop2 con frequenze alleliche ad un sito polimorfico pari a p1 e q1 (pop1) p2 e q2 (pop2) con p1+ q1=1 e p2+ q2 = 1 (ovvero un sito biallelico) Definiamo “metapopolazione” una popolazione con frequenze alleliche pm e qm che sono la media delle frequenze delle due popolazioni: Pm = (p1 + p2)/2 qm = (q1 + q2)/2 FST = (HT – HS)/HT Dove HT è pari a alla eterozigosità attesa della metapopolazione e HS è la media delle eterozigosità attese delle due popolazioni po1 e pop2 HT = Eterozigosità attesa della metapopolazione secondo HW = 2pmqm HS = media delle eteroz. attese nelle due popolazioni secondo HW = (2p1q1+2p2q2)/2
L’indice di fissazione FST (DEFINIZIONE ALTERNATIVA MA EQUIVALENTE) Date 2 popolazioni pop1 e pop2 Con frequenze alleliche ad un sito polimorfico pari a p1 e q1 (pop1) p2 e q2 (pop2) con p1+ q1=1 e p2+ q2 = 1 (ovvero un sito biallelico) FST = (varianza di p) / p q varianza di p = [(p1-p)2 + (p2-p)2] / 2 p = p medio = (p1 + p2) / 2
FST = (varianza di p) / ( p q ) Alcuni esempi per il calcolo di FST pop1 p1 = 0.3; q1 = 0.7 pop2 p2 = 0.3; q2 = 0.7 FST = [(0.3-0.3)2 + (0.3-0.3)2] / 2 / (0.3 x 0.7) = 0.000 pop1 p1 = 0.6; q1 = 0.4 pop2 p2 = 0.3; q2 = 0.7 FST = [(0.6-0.45)2 + (0.3-0.45)2] / 2 / (0.45 x 0.55) = 0.091 pop1 p1 = 0.9; q1 = 0.1 pop2 p2 = 0.1; q2 = 0.9 FST = [(0.9-0.5)2 + (0.1-0.5)2] / 2 / (0.5 x 0.5) = 0.640 pop1 p1 = 1.0; q1 = 0.0 pop2 p2 = 0.0; q2 = 1.0 FST = [(1.0-0.5)2 + (1.0-0.5)2] / 2 / (0.5 x 0.5) = 1.000
FST = 0 le popolazioni hanno le medesime freq. alleliche FST varia tra 0 ed 1 FST = 0 le popolazioni hanno le medesime freq. alleliche FST = 1 le popolazioni hanno fissato alleli diversi 0 < FST < 1 le popolazioni hanno diverse freq. alleliche