Identificazione di geni candidati nella regione individuata

Slides:



Advertisements
Presentazioni simili
Clonaggio funzionale Clonaggio posizionale
Advertisements

Genomica strutturale.
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.
Identificazione di geni candidati nella regione individuata
Microarrays di DNA, cDNA e oligonucleotidi
LA TERAPIA GENICA. COSA SIGNIFICA La terapia genica consiste nell'utilizzo del DNA nella cura di particolari malattie geniche. Esso dovrà essere ovviamente.
MAPPE CROMOSOMICHE E FREQUENZA DI RICOMBINAZIONE
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza aminoac.Mappatura genetica con marcatori polimorfici.
CARATTERIZZAZIONE DI UN GENE CANDIDATO 1.Ricostruzione della sequenza genomica completa attraverso un contiguo di cloni 2. Identificazione della sequenza.
BIOTECNOLOGIE MEDICHE E NANOBIOTECNOLOGIE
La chimica della vita Ogni organismo vivente è una macchina sofisticata, risultato di un complesso insieme di reazioni chimiche. La costruzione e il funzionamento.
Clonaggio funzionale Clonaggio posizionale
Microarrays di DNA, cDNA e oligonucleotidi
Identificazione di geni candidati nella regione individuata
Ricombinazione somatica
Linkage Can Be a Family-specific phenomenon:
L’anticipazione è un tipo speciale di espressività variabile
ESERCITAZIONI ANTROPOLOGIA POLIMERASE CHAIN REACTION (PCR)
La maggior parte dei ceppi batterici può essere infettata da fagi specifici. Per Escherichia coli: T2, T4, T6 e λ. lisi batterica placca strato batterico.
Definizioni: genoma trascrittoma proteoma.
Genomica strutturale.
Disgenesia degli ibridi in Drosophila melanogaster
TEST GENETICI  test per identificare il genotipo
CLONAGGIO POSIZIONALE
ESERCITAZIONI ANTROPOLOGIA
CROMOSOMI POLITENICI DI DROSOPHILA
ASSOCIAZIONE E RICOMBINAZIONE DEI GENI
IL GENOMA UMANO Insieme di informazioni genetiche contenute nel DNA delle cellule umane. Due genomi: genoma nucleare, che comprende il 99,9995% dell’informazione.
I MARCATORI MOLECOLARI NEL MIGLIORAMENTO GENETICO
DNA satellite E’ organizzato in cluster molto lunghi di DNA ripetuto in tandem, che costituisce la maggior parte delle regioni eterocromatiche del genoma,
“Legamento” degli embrioni
. Confronto tra procedure di microiniezione 500 mm
13/11/
Il DNA genomico totale e’ costituito da oltre 3
Come si clona un gene Corso di Genetica per la Facoltà di Medicina e Chirurgia dell’Università di Torino Alberto Piazza.
Il DNA è un polimero di nucleotidi
13/11/
DNA RICOMBINANTE.
Malattie da espansioni di triplette
I TEST GENETICI.
I GENI:parte funzionale del DNA
Genomica strutturale.
Corso di Genetica -Lezione 8- Cenci
BIOTECNOLOGIE MEDICHE E NANOBIOTECNOLOGIE
CLASSIFICAZIONE DEI TEST GENETICI diagnostici screening
Definizioni: genoma trascrittoma proteoma.
La regolazione genica negli eucarioti
Mutanti della segmentazione
IL CONSULTORIO GENETICO
Altre indagini di criminalistica… sinergia tra diverse discipline
Costruzione di librerie di cDNA
MARCATORI POLIMORFICI DEL DNA
POSTGENOMICA O GENOMICA FUNZIONALE
Clonaggio funzionale Clonaggio posizionale
CLONAGGIO POSIZIONALE:
CLONAGGIO POSIZIONALE
MALATTIE DA ESPANSIONE (instabile) DI BREVI TRATTI RIPETUTI
CARATTERIZZAZIONE DI UN GENE CANDIDATO
Organizzazione delle unità di ripetizione dei geni per gli istoni in diverse specie.
13/11/
Definizione di GENETICA
Evoluzione molecolare
CLONAGGIO POSIZIONALE:
POSTGENOMICA O GENOMICA FUNZIONALE
ENDONUCLEASI DI RESTRIZIONE
CARATTERIZZAZIONE DI UN GENE CANDIDATO
Le leggi di Mendel
Transcript della presentazione:

Identificazione di geni candidati nella regione individuata Dopo aver localizzato un gene responsabile di una malattia vicino ad un “marcatore polimorfico del DNA” si può pensare ad una strategia per identificare e poi clonare il gene responsabile Catalogazione di tutti i geni della regione: quando il locus del gene di una malattia è stato localizzato in una regione, i ricercatori cercano, all'interno di questa regione, tutte LE SEQUENZE CODIFICANTI. Si possono usare analisi bioinformatiche : -si possono rivelare regioni codificanti cercando schemi di lettura aperti, o usando programmi che riconoscono la struttura dei siti di splicing; -si può verificare se la sequenza genomica compare in uno o più cloni EST ottenuti da diversi tessuti umani Diversi modi per identificare le regioni codificanti in una serie di cloni genomici: 2. Si può analizzare la sequenza mediante ZOO blot: le sequenze codificanti degli esseri umani hanno quasi sempre una sequenza conservata nei mammiferi e spesso le due sequenze ibridano tra loro; questa ricerca si fa per Southern Si può usare la tecnica definita dell’ ”exon trapping” (questa tecnica è stata usata nell‘identificazione del gene della Corea di Huntington, dopo avere associato la malattia ad un polimorfismo)

Descrizione dell’ “exon trapping” Si clonano tutti i frammenti genomici della regione di interesse in un vettore di questo tipo: VETTORE mcs Esone 1 Esone 2 Introne P1 P2 Esone A Esone 1 Esone 2 AAAAAAAA Trascritto PRIMARIO TRASFEZIONE e TRASCRIZIONE Trascritto PRIMARIO AAAAAAAA TRASFEZIONE e TRASCRIZIONE AAAAAAAA SPLICING Trascritto MATURO AAAAAAAA SPLICING Trascritto MATURO AAAAAAAA P2 PRODOTTO DI PCR P1 AMPLIFICAZIONE P1 P2 AMPLIFICAZIONE PRODOTTO DI PCR Se nel SITO MULTIPLO DI CLONAGGIO del vettore si è inserito un frammento che possiede un ESONE, il prodotto di amplificazione risulterà più grande di quello del vettore in cui sia entrato un frammento contenente una regione non codificante che verrà elimita con lo SPLICING

CLONAGGIO POSIZIONALE La capacità di identificare ed isolare geni sulla base di informazioni riguardanti la loro localizzazione cromosomica è stato uno dei maggiori contributi della genomica: questo approccio è detto CLONAGGIO POSIZIONALE (un esempio è dato dal clonaggio del gene della Corea di Huntington) Il CLONAGGIO POSIZIONALE dipende dalla disponibilità di mappe dettagliate della regione cromosomica in cui sono localizzati i geni di interesse. È possibile fare un'analisi di associazione con centinaia di “MARCATORI ANONIMI (come ad esempio gli SNP o i MICROSATELLITI) ed il locus della malattia a cui si è interessati. Se si dimostra un'associazione tra la malattia ed 1 o più marcatori del DNA, mappati in precedenza, allora il gene responsabile è mappato nella regione dove questo "marcatore" è localizzato; ciò facilita il suo CLONAGGIO

La Corea di Huntington è stata la prima malattia per cui si è trovata una associazione con un RFLP La Corea di Huntington è una malattia neurodegenerativa, molto grave che è stata descritta in modo dettagliato verso la fine dell’800 da un medico, George Huntington. Una ricercatrice Wexler, la cui famiglia era stata colpita dalla malattia, si è molto impegnata per l’identificazione del gene responsabile. Ha iniziato una collaborazione con un altro giovane ricercatore Jim Gusella, a Boston, ed insieme hanno immaginato la strategia che si è poi rivelata vincente per l’identificazione del gene. Anche se il mondo accademico, intorno al 1983, era ancora scettico sull’uso dei marcatori molecolari polimorfici, loro hanno deciso di utilizzarli per la Corea di Huntington. Avevano a disposizione 2 famiglie, una americana dell’Iowa non molto numerosa ed una del Venezuela, molto numerosa. Hanno raccolto i campioni di DNA di tutti i possibili componenti delle due famiglie e li hanno analizzati usando, a caso, sonde polimofiche che mappavano su diversi cromosomi. Sono stati molto fortunati, in questa fase, poiché all’ottavo tentativo (avevano solo 12 sonde polimorfiche a disposizione), hanno trovato l’associazione! La sonda si chiamava G8!

Aplotipi identificati Regione genomica in cui mappa la sonda G8 CLONE G8 cromosoma 4 (parte telomerica) H1 (R) H R H2 H R H R R H ( R) H Regione corrispondente nel genoma umano 2Kb H (H)1 H (H)2 H H H 17,5 3,7 1,2 2,3 8,4 15,0 3,7 1,2 2,3 8,4 17,5 4,9 2,3 8,4 15,0 4,9 2,3 8,4 32,6 kb APLOTIPO A B C D Siti HindIII polimorfici H1 H2 - + - - + + + - Aplotipi identificati dal clone G8 2 siti polimorfici H1 e H2!

Ricerca dell’associazione dell’aplotipo rivelato dalla sonda G8 in due famiglie con la Corea di Huntington AB AB AB AB AA AB AA AC AC AB AC AB AA AA AA AB AA AA AB AA AA AA AC Famiglia americana Associazione con l’aplotipo A (sonda G8) AB BB AA AB AB AB BC AB AB AB AB BC AB AB BC BB BC BC AB BB BC AC AB AC AC AB AC AA BC AB BC AA BC BC BC Famiglia venezuelana BC BC BC Associazione con l’aplotipo C (sonda G8)

Analisi di associazione del gene della Corea di Huntington con altre sonde polimorfiche della regione Braccio corto del cromosoma 4 (4p) Telomero del 4p Usando altre sonde posizionate verso il centromero il Lod-score diminuiva e quindi ci si allontanava dal gene; quindi il gene era localizzato tra la sonda G8 ed il telomero ad una distanza di 4cM cioè di circa 6 Mega basi

Identificazione del gene responsabile della Corea di Huntington (IT-15) Dopo che è stata dimostrata l’associazione con la sonda polimorfica, la regione in cui è localizzato il gene è saturata e tutte le sonde sono analizzate per l’identificazione di trascritti, con la tecnica dell’”exon trapping”. Usando poi confronti tra sani e malati si identifica il GENE RESPONSABILE 500 kb D4S10 (G8) D4S180 D4S127 D4S95 D4S98 CROMOSOMA 4 centromero telomero Il trascritto è di 11 kb, la proteina è di 3144 aa (348 kda) 17 alleli con 11-34 Q affetti 48 Q 200 kb 67 E IT-15 IT-11 IT-10C ADDA

la malattia con quella di individui con un fenotipo normale. Scoperta del gene responsabile della malattia L’ identificazione del gene responsabile richiede anche l’analisi di espressione dei geni “candidati”. Ad esempio il gene responsabile del fenotipo neurodegenerativo della Corea di Huntington deve essere espresso nel cervello, mentre un gene responsabile di un tumore alla mammella deve essere espresso in quel tessuto. Negli organismi molto studiati le informazioni sull'espressione possono essere già disponibili nelle banche dati pubbliche delle sequenze EST. Se il pattern non è noto si effettua un Northern blot. Se la sequenza del DNA o del trascritto del gene candidato è alterato in tutti gli individui con la malattia con buona probabilità quello è il gene candidato. Per confermare che uno dei geni identificati sia proprio il GENE RESPONSABILE della malattia, bisogna confrontare la sequenza del gene candidato nel gruppo di individui con la malattia con quella di individui con un fenotipo normale. Oltre al pattern di espressione e la sequenza, alcune ulteriori conferme che il gene identificato è il gene RESPONSABILE del fenotipo alterato sono: 1. Il recupero del fenotipo mutato attraverso l’inserimento di un gene funzionale 2. Il “knock out” del gene Queste prove ulteriori sono ovviamente da compiere in sistemi modello e costituiscono la “GENOMICA FUNZIONALE”

(Cystic Fibrosis Transmembrane Regulator) RFLP e clonaggio posizionale del gene responsabile della fibrosi cistica CFTR (Cystic Fibrosis Transmembrane Regulator) La relazione approssimativa tra la distanza tra loci nella mappa genetica e la loro effettiva distanza in coppie di basi è la seguente: 1 cM = 1 Unità di Mappa = 1% di frequenza di ricombinazione = 1 Megabase 106 bp (2cM) 5’ 3’ quattro geni candidati IDENTIFICAZIONE DEI GENI CANDIDATI

Identificazione del gene responsabile della Fibrosi Cistica I bambini affetti da CF hanno una varietà di sintomi che derivano dalla anormale viscosità delle secrezioni polmonari, del pancreas e delle ghiandole sudoripare. L'analisi per Northern, dei 4 geni candidati, ha dimostrato che solo uno, chiamato CFTR, era espresso in tutti i tessuti interessati e non in altri. Il gene, sequenziato nei pazienti, conteneva piccole delezioni o sostituzioni nucleotidiche che ne sopprimevano la funzione. Alcune delle proteine mutanti non si localizzano nella membrana

Alcuni dei geni identificati con il “CLONAGGIO POSIZIONALE” Cromosoma 4 Malattia di Huntington Cromosoma 5 Poliposi familiare (APC) Cromosoma 7 Fibrosi cistica Cromosoma 11 Tumore di Wilms Atassia-telangiectasica Cromosoma 13 Retinoblastoma Cromosoma 16 Malattia policistica del rene Cromosoma 17 Cancro della mammella (BRCA1) Neurofibromatosi Cromosoma 19 Distrofia miotonica Cromosoma 21 Sclerosi laterale amiotriofica Cromosoma X Distrofia muscolare di Duchenne Sindrome X fragile Adrenoleucodistrofia

PROGETTO GENOMA UMANO

Aspettative per la realizzazione del Progetto Genoma Umano La spinta verso la realizzazione del PROGETTO GENOMA è stata la consapevolezza che la conoscenza della sequenza del genoma completo avrebbe potuto permettere più facilmente l’identificazione di geni responsabili di MALATTIE GENETICHE Ciò si sarebbe ottenuto attraverso la “reverse genetics” che mette in relazione pezzi di DNA (di cui è nota la localizzazione sui cromosomi) a funzione sconosciuta con una malattia, allo scopo di identificare il gene responsabile L’identificazione di un gene responsabile della malattia può fornire informazioni sul suo ruolo, sul tipo di proteina che produce, rendendo più semplici anche le ricerche su nuovi farmaci; può inoltre permettere di allestire test diagnostici per la malattia e di applicare la terapia genica. I geni responsabili di malattie già noti sono disponibili al sito OMIM : http://www3.ncbi.nlm.nih.gov/Omim/.

Progetto Genoma Umano Costo del progetto -> circa 3 milioni di euro Gruppi coinvolti nel progetto: Pubblico: Internartional Human Genome Sequencing Consortium Privato: Celera Genomics. Costo del progetto -> circa 3 milioni di euro Pubblicazione della prima bozza sul numero di Nature 15 Febbraio 2001 Sito web-> www. nature.com

Risultati del sequenziamento del Genoma Umano Sono state sequenziate 3.2 Gigabasi di DNA (3200 Megabasi, 3.200.000 kilobasi, 3 miliardi e duecentomila basi). Si è calcolato un numero di geni (ancora non definitivo) pari a circa 25.000- 35.000 (sono di meno di quanto la comunità scientifica si aspettasse). Sono stati anche sequenziati completamente i genomi di alcuni organismi modello. I geni sono : 6000 nel lievito, 13000 nella Drosophila, 18000 in C. elegans, 26000 in Arabidopsis Thaliana. Lo studio dei GENOMI interi di organismi prende il nome di GENOMICA

Mappe fisiche La base per il SEQUENZIAMENTO DEI GENOMI è stata la produzione di MAPPE FISICHE; a loro volta queste sono ottenute da mappe di associazione (GENETICHE) e mappe CITOGENETICHE La MAPPA FISICA è una costellazione di frammenti di DNA sovrapposti ordinati ed orientati che si localizzazano su ciascun cromosoma in un genoma; e quindi indicano l’ EFFETTIVO NUMERO DI COPPIE DI BASI che definiscono un locus e lo separano da quello adiacente in una determinata regione cromosomica. Per generare una MAPPA FISICA completa è necessario ottenere un insieme di cloni ordinati (contig) che si sovrappongono e che nel loro insieme rappresentino un INTERO CROMOSOMA O ADDIRITTURA UN INTERO GENOMA. 1) I MARCATORI GENETICI, eventualmente presenti nei cloni, possono essere ORDINATI contribuendo alla MAPPATURA DEL GENOMA 2) Si ottengono dei CLONI CONTIGUI che rappresentano una GENOTECA ORDINATA di sequenze di DNA utilizzabile per analisi genetiche successive (caratterizzazione di particolari regioni o identificazione di geni non ancora caratterizzati) 3) Questi cloni ordinati sono la base per il sequenziamento del GENOMA COMPLETO

Correlazione tra mappa GENETICA, CITOLOGICA e FISICA di un cromosoma 0 20 50 80 100 125 150 cM Gene X RFLP 1 RFLP 2 RFLP 3 Gene Y Gene Z MAPPA GENETICA MAPPA CITOLOGICA 0 25 50 75 100 125 150 Megabasi La MAPPA FISICA a cui si tende in ultima analisi è il sequenziamento dei vari cloni che fornisce l’esatto numero di coppie di basi che separano un locus dall’altro Eco RI Sst I Hind III Mappa di restrizione Kb 0 5 10 Kb 0 500 1000 Clone YAC 1 2 3 4 Kb 0 500 1000 STS 1 STS 2 STS 3 Mappa di “contig” di STS MAPPE FISICHE

Che cos’è un “contig” Un insieme di cloni che si sovrappongono è chiamato CONTIG Nelle fasi iniziali di un progetto di mappatura genomica i “contig” sono numerosi e rappresentano cosiddette “ isole” di genoma clonato. Con l’aumentare del numero dei cloni caratterizzati, i “contig” si ingrandiscono e si fondono l’uno con l’altro finchè alla fine del PROGETTO non rimane un numero di CONTIG pari a quello dei singoli cromosomi dell’organismo in esame.

Ottenere un “contig” Per ottenere dei contig è fondamentale ordinare i cloni ottenuti, cercando le SOVRAPPOSIZIONI tra i cloni. 3) FISH I cloni ottenuti si possono ordinare in vario modo: Ordinamento mediante “ MAPPE DI RESTRIZIONE” dei cloni ottenuti 2) Ordinamento mediante STS (sequence tagged sites) presenti nei cloni Un buon punto di partenza per ottenere cloni che si ordinano facilmente è l’utilizzo di GENOTECHE cromosoma-specifiche

Costruzione di genoteche cromosoma-specifiche

Separazione dei cromosomi mediante FACS (Fluorescence Activated Cell Sorter) Hoechst 33258 (AT) Cromomicina A3 (GC) Miscela di cromosomi laser Rivelatore di fluorescenza caricatore Piastra di deflessione Le gocce che non hanno la specifica fluorescenza impostata sono deviate Campione contenente tutti i tipi di cromosoma Campione contenente un solo tipo di cromosoma

Ottenere un “contig” 1) Ordinamento mediante “ MAPPE DI RESTRIZIONE” dei cloni ottenuti 2) Ordinamento mediante STS (sequence tagged sites) presenti nei cloni 3) FISH

Ordinamento dei cloni mediante “MAPPE DI RESTRIZIONE” 1. Identificare una serie di cloni genomici che si sovrappongono cromosoma Clone 1 2 3 4 5 2. Analizzare ciascun clone per i siti di restrizione e per la localizzazione dei geni identificati A B C D E F G Clone 1 geni -> 3. Creare mappe di cloni genomici che si sovrappongono Clone 1 Clone 3 Clone 2 A B C F G H I L A B C D E F G X Y Z 4. Combinare tutte le informazioni in un’unica mappa fisica che si estende per tutto il cromosoma A B C D E F G H I L X Y Z

Ottenere un “contig” 1) Ordinamento mediante “ MAPPE DI RESTRIZIONE” dei cloni ottenuti 2) Ordinamento mediante STS (sequence tagged sites) presenti nei cloni 3) FISH

Mappa fisica generata per STS BAC 1 STS 2 BAC 2 STS 3 BAC 3 STS 4 BAC 4 BAC 5 STS 5 BAC 6 STS 6 BAC 7 STS 7 BAC 8 È possibile usare brevi sequenze uniche entro lunghi inserti clonati come se fossero delle etichette (tag) al fine di allineare in “contig” i vari cloni. In base a questa caratterizzazione i cloni che hanno in comune particolari STS devono avere inserti parzialmente sovrapposti, quindi possono essere allineati in CONTIG. Spesso gli STS sono ottenuti da cDNA clonati, per cui sono chiamati EST (Espressed Sequence Tags), siti di sequenze etichetta espresse.

Approccio top down per la sovrapposizione di cloni contenenti marcatori genetici Questo tipo di approccio permette di ottenere cloni associati a marcatori già mappati in regioni vicine tra loro. Ad es. i marcatori M1 ed M2 sono stati localizzati in una determinata regione del cromosoma. Si usa il marcatore M1 come sonda di ibridazione per analizzare una genoteca in YAC Si usa il marcatore M2 come sonda di ibridazione per analizzare una genoteca in YAC sonda M1 sonda M2 clone yM1 clone yM2 Risultato dopo analisi della genoteca in YAC con 7 marcatori polimorfici (M1-M7) M1 M2 M3 M4 M5 M6 M7 contig Intervallo non coperto da cloni Megabasi Contig completo che comprende l’intera regione M1-M7 yM1 ed yM2 si sovrappongono? clone yM1 Si isola un’estremità del clone M1, si marca e si utilizza come sonda sul clone M2 digerito e trasferito su un filtro Estrazione, restrizione ed elettroforesi del clone M2 Risultato dell’ ibridazione con la sonda M1 L’ibridazione dimostra che l’estremità del clone M1 è presente nel clone M2

Approccio (dal basso) bottom up: per la sovrapposizione di cloni ottenuti a caso Questo tipo di approccio permette di ottenere cloni ordinati in “contig” partendo da cloni “a caso” privi di informazioni sulla loro localizzazione Genoma umano aploide 1) Digerire con enzimi di restrizione e clonare in cosmidi per ottenere una genoteca cosmidica 3) Inserire i dati della mappe di restrizione in un computer per ottenere le sovrapposizioni Clone 1 Clone 3 Clone 2 Clone 4 6 5 4 3,5 3 2,5 2 1 2) Tipizzare ciascun cosmide mediante mappe di restrizione Clone 1 Clone 2 Contig lungo un intero cromosoma 4) Ordinare tutti i cloni cosmidici ottenuti in 24 contig mediante FISH

Mappa fisica del cromosoma 17 umano 17Q21 17Q21 BAC 283 BRCA1 Cromosoma 17 intero milioni di coppie di basi Segmento 17Q21 due milioni di coppie di basi Segmento 17Q21 di 600.000 coppie di basi BAC 283 130.000 coppie di basi Gene BRCA1 80.000 coppie di basi

Mappa fisica del cromosoma Y umano YAC geni STS Bande cromosomiche PSEUDOAUTOSOMALE YAC geni STS Bande cromosomiche Sequenze omologhe X-Y Sequenze ripetute dell’Y