Identificazione di geni candidati nella regione individuata

Slides:

Advertisements

Presentazioni simili

Organizzazione del genoma umano I

Advertisements

La GENETICA DI POPOLAZIONI

Genetica dei Microrganismi ed Applicata

Progetto genoma umano Il genoma tappe dello studio del genoma umano

Marcatori Molecolari Introduzione Marcatori proteici DNA

METODICHE MOLECOLARI APPLICATE A CAMPIONI PARAFFINATI DI

Biologia.blu B - Le basi molecolari della vita e dell’evoluzione

Metodi di sequenziamento

Corso di ingegneria genetica

Epidemiologia Genetica del Retinoblastoma (1)

Le biotecnologie IN QUESTO NUMERO => Cosa sono le biotecnologie?

Il concetto di aplotipo

Clonaggio funzionale Clonaggio posizionale

CARATTERISTICHE VETTORE PLASMIDICO DI CLONAGGIO

Amplificazione DNA Clonaggio PCR.

Editing dellRNA. Editing dellmRNA per la Apolipoproteina B umana.

Array di oligonucleotidi

CLONAGGIO DNA RICOMBINANTE: DUE MOLECOLE DI DNA VENGONO

Clonaggio: vettori plasmidici

Clonaggio posizionale

Caratteristiche e applicazioni

Il progetto GENOMA Marta Franceschetti.

Sequenziamento enzimatico del DNA (Sanger)

Polimorfismi, mutazioni e metodi per evidenziarli

Il progetto genoma umano

La varietà dei genomi valore C: quantità totale di DNA contenuta in un genoma aploide Il genoma comprende geni e sequenze non codificanti. Le dimensioni.

La vita in codice Prof.ssa Carmela Allocca.

Possibile programma Corso di Biologia applicata Finalit à della biologia applicata applicazioni di metodologie per lo studio della biologia moderna : metodi.

Dip. Scienze Biomolecolari e Biotecnologie

Difetti congeniti del metabolismo II

Identificare le proteine che sono in grado di interagire

UN GENE UNA MALATTIA ETEROGENEITÀ GENETICA TEST DI COMPLEMENTAZIONE

Applicazioni genetica umana e molecolare II parte

Fibrosi Cistica II Lezione 8 By NA.

IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.

Computational analysis of data by statistical methods

UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA Corso di BIOINFORMATICA: TECNICHE DI BASE Prof. Giancarlo Mauri Lezione 3 Mappe genetiche.

Fibrosi Cistica I Lezione 7 By NA.

Dal neolitico al Xxi secolo.

IV LEZIONE Dati d'espressione genica: ESTs SAGE Microarray NCBI GEO.

AVVISO Il materiale riportato in queste diapositive è di esclusiva proprietà del Prof. Liborio Stuppia. La pubblicazione.

Gli studi di mendel A mano a mano che gli studi di genetica procedevano, divenne chiaro che le caratteristiche dominanti e recessive non sono sempre così.

POSTGENOMICA O GENOMICA FUNZIONALE

Tecniche genetico molecolari per la produzione di ceppi di lievito

La Drosophila è un ottimo sistema modello:

Tecniche della Biologia Molecolare

Definizione di genoteca (o library) di DNA

Cosa sono gli enzimi di restrizione

Il progetto genoma umano e gli altri progetti genoma: importanza degli organismi-modello.

POLIMERASE CHAIN REACTION (PCR)

Clonaggio per espressione e clonaggio funzionale

Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.

LABORATORIO 2: ANALISI DI RESTRIZIONE DI DNA GENOMICO In questa esercitazione campioni di DNA (es.: da fago λ e da plasmide pET28) verranno digeriti con.

Esercitazione di Genetica - 5

Genomica strutturale.

CLONAGGIO POSIZIONALE

Concetti di base. Per biodiversità si intende l'insieme di tutte le forme viventi geneticamente diverse e degli ecosistemi ad esse correlati Il termine.

Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.

UD5 Fase I Le Mutazioni Ovvero quando il codice genetico è errato o viene erroneamente decodificato.

Jacob, Monod – Parigi,1961 il modello dell’Operon-lac

Clonaggio funzionale Clonaggio posizionale

Microarrays di DNA, cDNA e oligonucleotidi

Genetica diretta e Genetica inversa: approcci sperimentali classici e metodologie recenti per lo studio della funzione dei geni.

Identificazione di geni candidati nella regione individuata

Come si clona un gene Corso di Genetica per la Facoltà di Medicina e Chirurgia dell’Università di Torino Alberto Piazza.

Identificazione di geni candidati nella regione individuata

Clonaggio funzionale Clonaggio posizionale

Transcript della presentazione:

Identificazione di geni candidati nella regione individuata Dopo aver localizzato un gene responsabile di una malattia vicino ad un “marcatore polimorfico del DNA” si può pensare ad una strategia per identificare e poi clonare il gene responsabile Catalogazione di tutti i geni della regione: quando il locus del gene di una malattia è stato localizzato in una regione, i ricercatori cercano, all'interno di questa regione, tutte LE SEQUENZE CODIFICANTI. Si possono usare analisi bioinformatiche : -si possono rivelare regioni codificanti cercando schemi di lettura aperti, o usando programmi che riconoscono la struttura dei siti di splicing; -si può verificare se la sequenza genomica compare in uno o più cloni EST ottenuti da diversi tessuti umani Diversi modi per identificare le regioni codificanti in una serie di cloni genomici: 2. Si può analizzare la sequenza mediante ZOO blot: le sequenze codificanti degli esseri umani hanno quasi sempre una sequenza conservata nei mammiferi e spesso le due sequenze ibridano tra loro; questa ricerca si fa per Southern Si può usare la tecnica definita dell’ ”exon trapping” (questa tecnica è stata usata nell‘identificazione del gene della Corea di Huntington, dopo avere associato la malattia ad un polimorfismo)

Descrizione dell’ “exon trapping” Si clonano tutti i frammenti genomici della regione di interesse in un vettore di questo tipo: VETTORE mcs Esone 1 Esone 2 Introne P1 P2 Esone A Esone 1 Esone 2 AAAAAAAA Trascritto PRIMARIO TRASFEZIONE e TRASCRIZIONE Trascritto PRIMARIO AAAAAAAA TRASFEZIONE e TRASCRIZIONE AAAAAAAA SPLICING Trascritto MATURO AAAAAAAA SPLICING Trascritto MATURO AAAAAAAA P2 PRODOTTO DI PCR P1 AMPLIFICAZIONE P1 P2 AMPLIFICAZIONE PRODOTTO DI PCR Se nel SITO MULTIPLO DI CLONAGGIO del vettore si è inserito un frammento che possiede un ESONE, il prodotto di amplificazione risulterà più grande di quello del vettore in cui sia entrato un frammento contenente una regione non codificante che verrà elimita con lo SPLICING

CLONAGGIO POSIZIONALE La capacità di identificare ed isolare geni sulla base di informazioni riguardanti la loro localizzazione cromosomica è stato uno dei maggiori contributi della genomica: questo approccio è detto CLONAGGIO POSIZIONALE (un esempio è dato dal clonaggio del gene della Corea di Huntington) Il CLONAGGIO POSIZIONALE dipende dalla disponibilità di mappe dettagliate della regione cromosomica in cui sono localizzati i geni di interesse. È possibile fare un'analisi di associazione con centinaia di “MARCATORI ANONIMI (come ad esempio gli SNP o i MICROSATELLITI) ed il locus della malattia a cui si è interessati. Se si dimostra un'associazione tra la malattia ed 1 o più marcatori del DNA, mappati in precedenza, allora il gene responsabile è mappato nella regione dove questo "marcatore" è localizzato; ciò facilita il suo CLONAGGIO

La Corea di Huntington è stata la prima malattia per cui si è trovata una associazione con un RFLP La Corea di Huntington è una malattia neurodegenerativa, molto grave che è stata descritta in modo dettagliato verso la fine dell’800 da un medico, George Huntington. Una ricercatrice Wexler, la cui famiglia era stata colpita dalla malattia, si è molto impegnata per l’identificazione del gene responsabile. Ha iniziato una collaborazione con un altro giovane ricercatore Jim Gusella, a Boston, ed insieme hanno immaginato la strategia che si è poi rivelata vincente per l’identificazione del gene. Anche se il mondo accademico, intorno al 1983, era ancora scettico sull’uso dei marcatori molecolari polimorfici, loro hanno deciso di utilizzarli per la Corea di Huntington. Avevano a disposizione 2 famiglie, una americana dell’Iowa non molto numerosa ed una del Venezuela, molto numerosa. Hanno raccolto i campioni di DNA di tutti i possibili componenti delle due famiglie e li hanno analizzati usando, a caso, sonde polimofiche che mappavano su diversi cromosomi. Sono stati molto fortunati, in questa fase, poiché all’ottavo tentativo (avevano solo 12 sonde polimorfiche a disposizione), hanno trovato l’associazione! La sonda si chiamava G8!

Aplotipi identificati Regione genomica in cui mappa la sonda G8 CLONE G8 cromosoma 4 (parte telomerica) H1 (R) H R H2 H R H R R H ( R) 1Kb H Regione corrispondente nel genoma umano 2Kb H (H)1 H (H)2 H H H 17,5 3,7 1,2 2,3 8,4 15,0 3,7 1,2 2,3 8,4 17,5 4,9 2,3 8,4 15,0 4,9 2,3 8,4 32,6 kb APLOTIPO A B C D Siti HindIII polimorfici H1 H2 - + - - + + + - Aplotipi identificati dal clone G8 2 siti polimorfici H1 e H2!

Ricerca dell’associazione dell’aplotipo rivelato dalla sonda G8 in due famiglie con la Corea di Huntington AB AB AB AB AA AB AA AC AC AB AC AB AA AA AA AB AA AA AB AA AA AA AC Famiglia americana Associazione con l’aplotipo A (sonda G8) AB BB AA AB AB AB BC AB AB AB AB BC AB AB BC BB BC BC AB BB BC AC AB AC AC AB AC AA BC AB BC AA BC BC BC Famiglia venezuelana BC BC BC Associazione con l’aplotipo C (sonda G8)

Analisi di associazione del gene della Corea di Huntington con altre sonde polimorfiche della regione Braccio corto del cromosoma 4 (4p) Telomero del 4p Usando altre sonde posizionate verso il centromero il Lod-score diminuiva e quindi ci si allontanava dal gene; quindi il gene era localizzato tra la sonda G8 ed il telomero ad una distanza di 4cM cioè di circa 6 Mega basi

Identificazione del gene responsabile della Corea di Huntington (IT-15) Dopo che è stata dimostrata l’associazione con la sonda polimorfica, la regione in cui è localizzato il gene è saturata e tutte le sonde sono analizzate per l’identificazione di trascritti. Usando poi confronti tra sani e malati si identifica il GENE RESPONSABILE 500 kb D4S10 (G8) D4S180 D4S127 D4S95 D4S98 CROMOSOMA 4 centromero telomero Il trascritto è di 11 kb, la proteina è di 3144 aa (348 kda) 17 alleli con 11-34 Q affetti 48 Q 200 kb 67 E IT-15 IT-11 IT-10C ADDA

la malattia con quella di individui con un fenotipo normale. Scoperta del gene responsabile della malattia L’ identificazione del gene responsabile richiede anche l’analisi di espressione dei geni “candidati”. Ad esempio il gene responsabile del fenotipo neurodegenerativo della Corea di Huntington deve essere espresso nel cervello, mentre un gene responsabile di un tumore alla mammella deve essere espresso in quel tessuto. Negli organismi molto studiati le informazioni sull'espressione possono essere già disponibili nelle banche dati pubbliche delle sequenze EST. Se il pattern non è noto si effettua un Northern blot. Se la sequenza del DNA o del trascritto del gene candidato è alterato in tutti gli individui con la malattia con buona probabilità quello è il gene candidato. Oltre al pattern di espressione e la sequenza, alcune ulteriori conferme che il gene identificato è il gene RESPONSABILE del fenotipo alterato sono: 1. La modificazione transgenica del fenotipo 2. Il “knock out” del gene Queste prove ulteriori sono ovviamente da compiere in sistemi modello e costituiscono la “GENOMICA FUNZIONALE” Per confermare che uno dei geni identificati sia proprio il GENE RESPONSABILE della malattia, bisogna confrontare la sequenza del gene candidato nel gruppo di individui con la malattia con quella di individui con un fenotipo normale.

(Cystic Fibrosis Transmembrane Regulator) RFLP e clonaggio posizionale del gene responsabile della fibrosi cistica CFTR (Cystic Fibrosis Transmembrane Regulator) La relazione approssimativa tra la distanza tra loci nella mappa genetica e la loro effettiva distanza in coppie di basi è la seguente: 1 cM = 1 Unità di Mappa = 1% di frequenza di ricombinazione = 1 Megabase 106 bp (2cM) 5’ 3’ quattro geni candidati IDENTIFICAZIONE DEI GENI CANDIDATI

Identificazione del gene responsabile della Fibrosi Cistica I bambini affetti da CF hanno una varietà di sintomi che derivano dalla anormale viscosità delle secrezioni polmonari, del pancreas e delle ghiandole sudoripare. L'analisi per Northern, dei 4 geni candidati, ha dimostrato che solo uno, chiamato CFTR, era espresso in tutti i tessuti interessati e non in altri. Il gene, sequenziato nei pazienti, conteneva piccole delezioni o sostituzioni nucleotidiche che ne sopprimevano la funzione. Alcune delle proteine mutanti non si localizzano nella membrana

Alcuni dei geni identificati con il “CLONAGGIO POSIZIONALE” Cromosoma 4 Malattia di Huntington Cromosoma 5 Poliposi familiare (APC) Cromosoma 7 Fibrosi cistica Cromosoma 11 Tumore di Wilms Atassia-telangiectasica Cromosoma 13 Retinoblastoma Cromosoma 16 Malattia policistica del rene Cromosoma 17 Cancro della mammella (BRCA1) Neurofibromatosi Cromosoma 19 Distrofia miotonica Cromosoma 21 Sclerosi laterale amiotriofica Cromosoma X Distrofia muscolare di Duchenne Sindrome X fragile Adrenoleucodistrofia

PROGETTO GENOMA UMANO

Aspettative per la realizzazione del Progetto Genoma Umano La spinta verso la realizzazione del PROGETTO GENOMA è stata la consapevolezza che la conoscenza della sequenza del genoma completo avrebbe potuto permettere più facilmente l’identificazione di geni responsabili di MALATTIE GENETICHE Ciò si sarebbe ottenuto attraverso la “reverse genetics” che mette in relazione pezzi di DNA (di cui è nota la localizzazione sui cromosomi) a funzione sconosciuta con una malattia, allo scopo di identificare il gene responsabile L’identificazione di un gene responsabile della malattia può fornire informazioni sul suo ruolo, sul tipo di proteina che produce, rendendo più semplici anche le ricerche su nuovi farmaci; può inoltre permettere di allestire test diagnostici per la malattia e di applicare la terapia genica. I geni responsabili di malattie già noti sono disponibili al sito OMIM : http://www3.ncbi.nlm.nih.gov/Omim/.

Progetto Genoma Umano Costo del progetto -> circa 3 milioni di euro Gruppi coinvolti nel progetto: Pubblico: Internartional Human Genome Sequencing Consortium Privato: Celera Genomics. Costo del progetto -> circa 3 milioni di euro Pubblicazione della prima bozza sul numero di Nature 15 Febbraio 2001 Sito web-> www. nature.com

Risultati del sequenziamento del Genoma Umano Sono state sequenziate 3.2 Gigabasi di DNA (3200 Megabasi, 3.200.000 kilobasi, 3 miliardi e duecentomila basi). Si è calcolato un numero di geni (ancora non definitivo) pari a circa 25.000- 35.000 (sono di meno di quanto la comunità scientifica si aspettasse). Sono stati anche sequenziati completamente i genomi di alcuni organismi modello. I geni sono : 6000 nel lievito, 13000 nella Drosophila, 18000 in C. elegans, 26000 in Arabidopsis Thaliana. Lo studio dei GENOMI interi di organismi prende il nome di GENOMICA

Mappe fisiche La base per il SEQUENZIAMENTO DEI GENOMI è stata la produzione di MAPPE FISICHE; a loro volta queste sono ottenute da mappe di associazione (GENETICHE) e mappe CITOGENETICHE La MAPPA FISICA è una costellazione di frammenti di DNA sovrapposti ordinati ed orientati che si localizzazano su ciascun cromosoma in un genoma; e quindi indicano l’ EFFETTIVO NUMERO DI COPPIE DI BASI che definiscono un locus e lo separano da quello adiacente in una determinata regione cromosomica. Per generare una MAPPA FISICA completa è necessario ottenere un insieme di cloni ordinati (contig) che si sovrappongono e che nel loro insieme rappresentino un INTERO CROMOSOMA O ADDIRITTURA UN INTERO GENOMA. 1) I MARCATORI GENETICI, eventualmente presenti nei cloni, possono essere ORDINATI contribuendo alla MAPPATURA DEL GENOMA 2) Si ottengono dei CLONI CONTIGUI che rappresentano una GENOTECA ORDINATA di sequenze di DNA utilizzabile per analisi genetiche successive (caratterizzazione di particolari regioni o identificazione di geni non ancora caratterizzati) 3) Questi cloni ordinati sono la base per il sequenziamento del GENOMA COMPLETO

Correlazione tra mappa GENETICA, CITOLOGICA e FISICA di un cromosoma 0 20 50 80 100 125 150 cM Gene X RFLP 1 RFLP 2 RFLP 3 Gene Y Gene Z MAPPA GENETICA MAPPA CITOLOGICA 0 25 50 75 100 125 150 Megabasi La MAPPA FISICA a cui si tende in ultima analisi è il sequenziamento dei vari cloni che fornisce l’esatto numero di coppie di basi che separano un locus dall’altro Eco RI Sst I Hind III Mappa di restrizione Kb 0 5 10 Kb 0 500 1000 Clone YAC 1 2 3 4 Kb 0 500 1000 STS 1 STS 2 STS 3 Mappa di “contig” di STS MAPPE FISICHE

Che cos’è un “contig” Un insieme di cloni che si sovrappongono è chiamato CONTIG Nelle fasi iniziali di un progetto di mappatura genomica i “contig” sono numerosi e rappresentano cosiddette “ isole” di genoma clonato. Con l’aumentare del numero dei cloni caratterizzati, i “contig” si ingrandiscono e si fondono l’uno con l’altro finchè alla fine del PROGETTO non rimane un numero di CONTIG pari a quello dei singoli cromosomi dell’organismo in esame.

Ottenere un “contig” Per ottenere dei contig è fondamentale ordinare i cloni ottenuti, cercando le SOVRAPPOSIZIONI tra i cloni. 3) FISH I cloni ottenuti si possono ordinare in vario modo: Ordinamento mediante “ MAPPE DI RESTRIZIONE” dei cloni ottenuti 2) Ordinamento mediante STS (sequence tagged sites) presenti nei cloni Un buon punto di partenza per ottenere cloni che si ordinano facilmente è l’utilizzo di GENOTECHE cromosoma-specifiche

Costruzione di genoteche cromosoma-specifiche

Separazione dei cromosomi mediante FACS (Fluorescence Activated Cell Sorter) Hoechst 33258 (AT) Cromomicina A3 (GC) Miscela di cromosomi laser Rivelatore di fluorescenza caricatore Piastra di deflessione Le gocce che non hanno la specifica fluorescenza impostata sono deviate Campione contenente tutti i tipi di cromosoma Campione contenente un solo tipo di cromosoma

Ottenere un “contig” 1) Ordinamento mediante “ MAPPE DI RESTRIZIONE” dei cloni ottenuti 2) Ordinamento mediante STS (sequence tagged sites) presenti nei cloni 3) FISH

Ordinamento dei cloni mediante “MAPPE DI RESTRIZIONE” 1. Identificare una serie di cloni genomici che si sovrappongono cromosoma Clone 1 2 3 4 5 2. Analizzare ciascun clone per i siti di restrizione e per la localizzazione dei geni identificati A B C D E F G Clone 1 geni -> 3. Creare mappe di cloni genomici che si sovrappongono Clone 1 Clone 3 Clone 2 A B C F G H I L A B C D E F G X Y Z 4. Combinare tutte le informazioni in un’unica mappa fisica che si estende per tutto il cromosoma A B C D E F G H I L X Y Z

Ottenere un “contig” 1) Ordinamento mediante “ MAPPE DI RESTRIZIONE” dei cloni ottenuti 2) Ordinamento mediante STS (sequence tagged sites) presenti nei cloni 3) FISH

Mappa fisica generata per STS BAC 1 STS 2 BAC 2 STS 3 BAC 3 STS 4 BAC 4 BAC 5 STS 5 BAC 6 STS 6 BAC 7 STS 7 BAC 8 È possibile usare brevi sequenze uniche entro lunghi inserti clonati come se fossero delle etichette (tag) al fine di allineare in “contig” i vari cloni. In base a questa caratterizzazione i cloni che hanno in comune particolari STS devono avere inserti parzialmente sovrapposti, quindi possono essere allineati in CONTIG. Spesso gli STS sono ottenuti da cDNA clonati, per cui sono chiamati EST (Espressed Sequence Tags), siti di sequenze etichetta espresse.

Approccio top down per la sovrapposizione di cloni contenenti marcatori genetici Questo tipo di approccio permette di ottenere cloni associati a marcatori già mappati in regioni vicine tra loro Si usa il marcatore M1 come sonda di ibridazione per analizzare una genoteca in YAC Si usa il marcatore M2 come sonda di ibridazione per analizzare una genoteca in YAC sonda M1 sonda M2 clone yM1 clone yM2 Risultato dopo analisi della genoteca in YAC con 7 marcatori polimorfici (M1-M7) M1 M2 M3 M4 M5 M6 M7 contig Intervallo non coperto da cloni Megabasi Contig completo che comprende l’intera regione M1-M7 yM1 ed yM2 si sovrappongono? clone yM1 Si isola un’estremità del clone M1, si marca e si utilizza come sonda sul clone M2 digerito e trasferito su un filtro Estrazione, restrizione ed elettroforesi del clone M2 Risultato dell’ ibridazione L’ibridazione dimostra che l’estremità del clone M1 è presente nel clone M2

Approccio (dal basso) bottom up: per la sovrapposizione di cloni ottenuti a caso Questo tipo di approccio permette di ottenere cloni ordinati in “contig” partendo da cloni “a caso” privi di informazioni sulla loro localizzazione Genoma umano aploide 1) Digerire con enzimi di restrizione e clonare in cosmidi per ottenere una genoteca cosmidica 3) Inserire i dati della mappe di restrizione in un computer per ottenere le sovrapposizioni Clone 1 Clone 3 Clone 2 Clone 4 6 5 4 3,5 3 2,5 2 1 2) Tipizzare ciascun cosmide mediante mappe di restrizione Clone 1 Clone 2 Contig lungo un intero cromosoma 4) Ordinare tutti i cloni cosmidici ottenuti in 24 contig mediante FISH

Mappa fisica del cromosoma 17 umano 17Q21 17Q21 BAC 283 BRCA1 Cromosoma 17 intero milioni di coppie di basi Segmento 17Q21 due milioni di coppie di basi Segmento 17Q21 di 600.000 coppie di basi BAC 283 130.000 coppie di basi Gene BRCA1 80.000 coppie di basi

Mappa fisica del cromosoma Y umano YAC geni STS Bande cromosomiche PSEUDOAUTOSOMALE YAC geni STS Bande cromosomiche Sequenze omologhe X-Y Sequenze ripetute dell’Y