Caratteristiche e applicazioni Marcatori molecolari Caratteristiche e applicazioni Luca Gianfranceschi e Rosanna Marino Luca Gianfranceschi, Dipartimento di Genetica e di Biologia dei Microrganismi Università degli Studi di Milano via Celoria 26, 20133 MILANO
I marcatori molecolari Strumento per l’analisi genetica Strumento non oggetto di studio Molecolari biologia molecolare Analisi genetica studio delle differenze genetiche Marcatori approccio indiretto Prima di entrare nel dettaglio e spiegare le diverse classi di marcatori molecolari è necessario avere bene in mente alcuni concetti fondamentali. Innanzitutto i MM devono essere considerati uno strumento di analisi e non un oggetto dell’analisi. Essi ci permettono di seguire regioni cromosomiche nelle quali potrebbero essere localizzati geni che controllano il nostro o i nostri caratteri di interesse, ma non sono i geni alla base del carattere. I MM, essendo basati su tecniche di biologia molecolare, si sono sviluppati di pari passo con lo sviluppo di questa branca della biologia. L’impiego di MM nell’analisi genetica ci consente di studiare quali sono le differenze genetiche che influenzano il carattere in esame, di localizzarle nel genoma della specie studiata e di valutarne l’importanze relativa. Infine, i MM in quanto marcatori costituiscono un approccio indiretto per identificare le differenze genetiche alla base dei caratteri fenotipici.
Alcune definizioni Marcatore genetico: Locus genico che identifica univocamente una regione cromosomica Mappa genetica: Definisce le RELAZIONI LINEARI tra marcatori molecolari E’ IL RISULTATO DELL’ANALISI GENETICA Distanza genetica: Stima della distanza esistente tra due marcatori calcolata sulla frequenza di ricombinazione - Si esprime in Centimorgan (cM) - 1cM = 1 ricombinante / 100 prodotti meiotici Polimorfismo: Presenza di varianti alleliche per un dato gene o marcatore Polimorfismo molecolare: Differenze evidenziabili a livello di DNA Alcune definizioni basilari: Per marcatore genetico si intende quel locus genico che identifica univocamente una regione di uno specifico cromosoma di una specie. Una mappa genetica è costituita dall’insieme dei marcatori molecolari e delle relazioni lineari, misurate come distanza genetica (vedi dopo), che li caratterizzano. Per creare una mappa genetica è necessario fare una analisi genetica. La distanza genetica è la misura che separa due marcatori e viene calcolata come frequenza di ricombinazione, che viene misurata in centimorgan (cM). 1 cM corrisponde ad una frequenza di 1 individuo ricombinante ogni 100 individui. Per polimorfismo si intende la presenza di varianti alleliche presenti ad un dato marcatore o gene. Infine per polimorfismo molecolare si intende una differenza che è evidenziabile a livello del DNA di una specie.
I marcatori molecolari sono UNIVERSALI
I marcatori molecolari sono EREDITABILI
I marcatori genetici Marcatori morfologici Marcatori molecolari Problemi: 1) non sono molto numerosi 2) dipendono dalla specie (ploidia ecc.) Marcatori molecolari Identificano polimorfismo a livello di DNA Offrono la possibilità di coprire tutto il genoma Sono applicabili universalmente Ci sono due tipi principali di marcatori molecolari: i marcatori morfologici e i marcatori molecolari. I marcatori morfologici sono il primo tipo di marcatori utilizzati nelle analisi genetiche. Sono varianti fenotipiche che sono il prodotto di variazioni a livello genetico. Ad esempio il colore dell’occhio della Drosophila piuttosto che la forma del seme di pisello studiato da Mendel. Questo tipo di marcatori hanno però delle limitazioni legate soprattutto allo scarso numero di questi marcatori, al fatto che molto spesso hanno effetti deleteri sull’organismo che li porta e infine la loro analisi risulta problematica se si ha a che fare con specie poliploidi o con basi genetiche più complesse. I marcatori a molecolare, mettendo in risalto delle differenze a livello del DNA, cioè al livello più alto possibile, offrono la possibilità di analizzare un numero molto elevato di differenze, permettendo la copertura completa del genoma della specie in esame. Inoltre molto spesso queste differenze non hanno effetti così drastici sul fenotipo dell’individuo che li porta, non compromettendone così l’adattabilità e le capacità di sopravvivenza. Infine un altro vantaggio è offerto dal fatto che le tecniche per rivelare questo tipo di differenze a livello del DNA è trasferibile da specie a specie e perciò questi marcatori sono anch’essi applicabili universalmente a tutte le specie, sia animali che vegetali.
Marcatore genetico ideale Non influenzato dall’ambiente Neutrale Stabile Facile da monitorare Numeroso Codominante Polimorfico Presente in qualsiasi tessuto Indipendente da sesso ed età Analisi automatizzabile N.B. Peccato che non ci sia !! Dopo aver visto quali sono le caratteristiche dei marcatori molecolari è giusto vedere quali sarebbero le caratteristiche dei marcatori molecolari ideali. Infatti il marcatore ideale dovrebbe essere in grado di evidenziare un elevato polimorfismo in modo da poter rilevare tutte le varianti alleliche in gioco. Il polimorfismo dovrebbe essere a livello del DNA in modo che queste differenze non siano influenzate da fattori esterni quali l’ambiente e le condizioni di crescita di un individuo ecc. Il marcatore ideale dovrebbe essere stabile e cioè non variare tra generazione e generazione o tra tessuti diversi dello stesso individuo e inoltre dovrebbe essere facilmente riproducibile. Il marcatore dovrebbe essere neutro e cioè non influenzare l’adattabilità dell’individuo che porta quella determinata variante allelica. La tecnica usata per evidenziare il polimorfismo dovrebbe essere facile, affidabile ed economica.
Tecniche per la produzione di marcatori molecolari Ibridazione molecolare Southern blot es. RFLP Amplificazione del DNA PCR (Polymerase Chain Reaction) RAPD, SSR o STR Approcci misti Digestione enzimatica e amplificazione CAPS, AFLP Prendiamo in rassegna alcune delle tecniche utilizzate per generate dei marcatori molecolari. La tecnica classica per mettere in evidenza polimorfismi a livello del DNA è l’ibridazione molecolare. Con questa tecnica si sfrutta la capacità del DNA di riassociarsi correttamente ritrovando la proprio elica complementare una volta che il DNA è stato denaturato. Su questa tecnica sono basati gli RFLP che vedremo in seguito. La seconda tecniche che ha rivoluzionato il mondo della biologia molecolare in generale, e di conseguenza sulle tecniche utilizzate per evidenziare differenze molecolari, è quella dell’amplificazione del DNA o PCR (Polymerase Chain Reaction, Reazione a catena della polimerasi). La maggior parte dei marcatori di ultima generazione fa ora largo uso di questa tecnica, ne sono esempi i RAPD e i microsatelliti. E’ logico che anche dall’uso combinato di tecniche diverse si siano generati marcatori molecolari e ne sono esempi classici i CAPS gli AFLP e diversi altri.
I marcatori RFLP (Restriction Fragment Length Polymorphism) In questa diapositiva viene schematizzata la tecnica del Southern blot che è alla base dei marcatori RFLP (Restriction Fragment Length Polymorphism) e cioè dei marcatori molecolari che sfruttano i polimorfismi della lunghezza dei frammenti generati a seguito del taglio del DNA genomico mediante enzimi di restrizione. Nella diapositiva è schematizzato il DNA di due individui che viene tagliato mediante un enzima di restrizione. La sequenza del DNA dei due individui non è esattamente identica infatti in uno dei due individui un sito riconosciuto dall’enzima di restrizione è mutato e per questo motivo non venga più riconosciuto dall’enzima e di conseguenza tagliato. Dai due individui in esame vengono così generati dei frammenti di restrizione omologhi ma di lunghezza differente. Per poter evidenziare queste differenze, il DNA tagliato viene separato in base alla lunghezza dei frammenti e trasferito sul una membrana di nylon, che ha lo scopo di fissare in maniera permanente questo DNA. Infine la membrana viene messa in una miscela di ibridazione in cui abbiamo aggiunto una sonda marcata (che non è altro che un frammento omologo di DNA che è stato marcato o con traccianti radioattivi e fluorescenti). Questa sonda sarà in grado di riassociarsi solamente al frammento di DNA omologo generato dal taglio enzimatico e quindi metterà in evidenza esclusivamente quel frammento di DNA e di conseguenza anche le eventuali differenze di lunghezza esistenti tra i due individui in esame.
La reazione a catena della polimerasi (Polymerase Chain Reaction - PCR) Inventata da Kary Mullis nel 1985 Gli è valsa il Nobel nel 1993 Fondamenti: Conoscenze sulla replicazione del DNA - DNA polimerasi Sintesi in vitro di DNA a sequenza specifica - Oligonucleotidi Biologia dei batteri estremofili - DNA polimerasi Taq ricavata da Thermus aquaticus Questa diapositiva riporta alcune informazioni riguardanti la tecnica della PCR (Polymerase Chain Reaction - Reazione a catena della polimerasi). Questa tecnica inventata da Mullis nel 1985 ha rivoluzionato la biologia molecolare e attualmente non c’è laboratorio di biologia che non ne faccia uso. L’idea geniale di Mullis è il frutto delle conoscenze accumulate in quegli anni sui processi della replicazione del DNA, sullo sviluppo di tecniche per sintetizzare in vitro corte sequenze di DNA e sull’individuazione di enzimi in grado di lavorare e di ben tollerare le alte temperature.
I marcatori RAPD (Random Amplified Polymorfic DNA) Basati su PCR Non sono necessari dati di sequenza Automatizzabili Oligonucleotidi (primer) sono corti e di sequenza casuale Temperatura di annealing è bassa: 37°C Richiedono poco DNA di partenza La tecnica è facile Problemi Scarsa ripetibilità Non sono locus-specifici Non sono esportabili Difficilmente confrontabili tra mappe e tra genotipi Sono marcatori dominanti In questa diapositiva vengono riassunte le principali caratteristiche dei marcatori RAPD (Random Amplified Polymorphic DNA – DNA polimorfico amplificato casualmente) che sono nati quale modificazione della tecnica della PCR. In questa tecnica si utilizza una sola sequenza innesco ( e non due come nella tecnica classica della PCR ) e si sfrutta la complessità del genoma della specie analizzata, nella quale casualmete risiedono corte sequenze identiche ripetute lungo il DNA. La presenza di polimorfismi a livello del sito di attacco di questi primer porterà all’amplificazione o meno di specifici frammenti di DNA, evidenziando delle differenze tra individui, cioè dei polimorfismi. Nella diapositiva vengono riassunti alcune caratteristiche di questa tecnica ed alcune limitazioni insite in questa tecnica.
Analisi RAPD di 9 varietà di ciliegio 2000 bp 1500 bp 500 bp La foto riporta l’analisi di alcune varietà di ciliegio analizzate mediante la tecnica RAPD. Come si può vedere è possibile distinguere frammenti polimorfici tipici di alcune varietà e assenti in altre. Mettendo insieme le informazioni raccolte con diversi marcatori RAPD è possibile distinguere tutte le varietà permettendo un riconoscimento certo della varietà in esame. 1 2 3 4 5 6 7 8 9 M I campioni 1 e 3 provengono dalla stessa varietà, così come i campioni 2 e 6; nella corsia 9 è stato usato DNA di amareno
I microsatelliti o SSR (Simple Sequence Repeat) Questa diapositiva riporta l’elettroferogramma di una sequenza di DNA contenente una sequenza microsatellite. I microsatelliti sono corte sequenze di DNA (2-6 nucleotidi) ripetute parecchie volte in serie. I microsatelliti sono presenti in praticamente tutti gli eucarioti superiori dagli animali alle piante. Non sembrano avere una funzione specifica, ma si è visto che sono presenti lungo tutto il genoma. Dal punto di vista genetico queste sequenze hanno una notevole importanza in quanto sono molto polimorfiche all’interno di una specie e di conseguenza sono un ottimo marcatore molecolare.
I microsatelliti o SSR (Simple Sequence Repeat) Individuo 1 Individuo 2 1 2 3 4 5 6 Individuo 3 Individuo 4 Individuo 5 Individuo 6 La tecnica che comunemente viene utilizzata per mettere in evidenza delle differenze a livello delle sequenze dei microsatelliti e quella della PCR. Disegnando una coppia di primer che fiancheggia i microsatelliti è possibile amplificare selettivamente il tratto di DNA che contiene il microsatellite. Il frammento generato avrà una lunghezza definita dalla distanza tra i due primer utilizzati. E’ quindi ovvio che la presenza di varianti alleliche per la lunghezza delle ripetizioni all’interno del microsatelliti porti alla generazione di frammenti di amplificazione di lunghezza differente e quindi riconoscibili con le metodiche standard di biologia molecolare (elettroforesi di DNA). Nell’immagine viene riportato l’esempio di 6 individui che portano combinazioni alleliche differenti e che quindi possono essere facilmente distinti mediante l’analisi di questo singolo locus.
Analisi SSR di alcuni individui di una popolazione naturale Individui della popolazione 1 2 3 4 5 6 7 8 9 10 11 12 - 1 2 3 4 5 Esempio di analisi mediante microsatelliti di alcuni individui di una popolazione naturale. Essendo la tecnica universalmente applicabile non ha importanza quale sia la specie in esame. E’comunque possibile distingue la presenza di 6 varianti alleliche tra gli individui analizzati. + 6 Quanti alleli distinguete negli individui di questa popolazione?
La tecnica degli AFLP La tecnica degli AFLP è una tecnica abbastanza complicata che sfrutta le differenze a livello esistenti tra individui a livello dei siti di taglio enzimatico, come era il caso degli RFLP. Tuttavia queste differenze sono messe in luce tramite l’amplificazione selettiva di alcune famiglie di frammenti di restrizione, selezionate in base alle combinazioni di primer utilizzate per l’amplificazione. Non ci interessa entrare nel dettaglio di questa tecnica ma è solo importante capire che questa tecnica offre la possibilità di analizzare un numero elevato di loci genici contemporaneamente, velocizzando enormemente un’eventuale analisi genetica.
Esempio di gel AFLP Esempio di gel AFLP. Sul gel sono stati analizzati un gran numero di individui (colonne) e sono visibili un elevato numero di loci per individuo.
Analisi multiplex di marcatori
Gli SNP (single nucleotide polymorphism) ...C C A T T G A C... …G G T A A C T G... ...C C G T T G A C... …G G C A A C T G... Che cos’è uno SNP ? E’ una differenza, o polimorfismo, di un singolo nucleotide nella sequenza di DNA esistente in alcuni individui della stessa specie. Il loro numero varia notevolmente a seconda della specie In uomo c’è in media uno SNP ogni 300 nucleotidi
Perché utilizzare gli SNPs Sono la base molecolare della maggior parte delle differenze tra individui Possono contribuire alla suscettibilità a malattie e all’adattabilità delle specie Sono presenti in un elevato numero e sono distribuiti lungo tutto il genoma
Impieghi dei marcatori molecolari Analisi di paternità Diagnosi di anomalie genetiche Analisi forensi Identificazione di QTL e geni utili Miglioramento delle specie vegetali ed animali Studio della struttura, evoluzione e biodiversità delle popolazioni Studi di epidemiologia Tracciabilità dei prodotti animali e/o dei GMO Conservazione della natura Studi di filogenesi ed evoluzione
http://www.ncbi.nlm.nih.gov/genome/guide/human/
http://www.ncbi.nlm.nih.gov/mapview/maps.cgi
Programma di queste esercitazioni LUNEDÌ Introduzione sui marcatori molecolari e loro usi Estrazione del vostro DNA dalle cellule della mucosa boccale MARTEDÌ Spiegazione teorica sulla PCR e sull’uso che ne faremo Amplificazione specifica di tre sequenze del vostro genoma Marcatore altamente polimorfico D1S80 sul cromosoma 1 Marcatore Y-GATA-A7.2 sul cromosoma Y Marcatore HUAMEL sul gene dell’amelogenina sulla regione omologa dei cromosomi X e Y Preparazione dei gel di agarosio MERCOLEDÌ Elettroforesi dei prodotti di PCR sul gel di agarosio Protocollo semplificato per l’estrazione di DNA da Kiwi Analisi e discussione dei risultati ottenuti