La regolazione dell’espressione genica

Slides:



Advertisements
Presentazioni simili
Geni costitutivi e non costitutivi
Advertisements

Ogni essere vivente è dotato di
MICROSCOPIA.
Regolazione dell’espressione genica
Le biotecnologie Prof. Elisa Prearo LST 2007/2008.
GENE: segmento di DNA che trasporta l’informazione per un determinato
Bioinformatica Corso di Laurea specialistica in Informatica RNA: trascrizione e maturazione 21/03/2011.
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
La regolazione dell’espressione genica
Metodi di sequenziamento
Sottolineare i diversi elementi chimici presenti nei nucleotidi
TRASCRIZIONE del DNA.
DUPLICAZIONE del DNA.
Escherichia coli Molto studiato da un punto di vista genetico, fisiologico e strutturale Molto studiato da un punto di vista genetico, fisiologico e strutturale.
LICEO SCIENTIFICO STATALE “LEONARDO da VINCI” di FIRENZE
La Sintesi Proteica.
Prodotti da geni clonati nativi e manipolati
Clonaggio funzionale Clonaggio posizionale
DAL DNA ALLE PROTEINE la trascrizione genica
Espressione genica.
LICEO STATALE «Antonio Meucci»
P. CODICE GENETICO E SINTESI PROTEICA
FACOLTA’ DI MEDICINA E CHIRURGIA
D N A LA MOLECOLA DELLA VITA.
Biotecnologie ed OGM.
Ivana Calarco DIFFERENZIAMENTO 29/03/2017.
Prof. Paolo Abis Speranzina Ferraro - 14 dicembre 2006.
CLONAGGIO DNA RICOMBINANTE: DUE MOLECOLE DI DNA VENGONO
Clonaggio: vettori plasmidici
La varietà dei genomi valore C: quantità totale di DNA contenuta in un genoma aploide Il genoma comprende geni e sequenze non codificanti. Le dimensioni.
CORSO DI BIOLOGIA - Programma
CORSO DI BIOLOGIA - Programma
CORSO DI BIOLOGIA - Programma
PROTEINE: “TRASCRIZIONE” e “TRADUZIONE”
La regolazione dell’espressione genica
Cosa sono i GENI I geni rappresentano l’unità strutturale e funzionale della genetica Un gene è una successione lineare di unità chimiche semplici (nucleotidi)
Involucro proteico del fago T2 circondato dal suo DNA
DNA – REPLICAZIONE (1) Semiconservativa: Catene genitrici
LEZIONE 8 Ingegneria cellulare
Identificare le proteine che sono in grado di interagire
TERMINAZIONE IN PROCARIOTI ED EUCARIOTI
Applicazioni genetica umana e molecolare II parte
Genetica e biotecnologie
Struttura dei geni batterici
Dal neolitico al Xxi secolo.
Le tecniche della biologia molecolare
La trascrizione del DNA
Tecniche della Biologia Molecolare
Cosa sono gli enzimi di restrizione
POLIMERASE CHAIN REACTION (PCR)
Clonaggio per espressione e clonaggio funzionale
Struttura di alcuni batteriofagi modello
LABORATORIO 2: ANALISI DI RESTRIZIONE DI DNA GENOMICO In questa esercitazione campioni di DNA (es.: da fago λ e da plasmide pET28) verranno digeriti con.
Sintesi dell’ RNA.
La Fabbrica delle Proteine
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.
Tecnica che permette di manipolare il materiale genetico LE NUOVE BIOTECNOLOGIE utilizzano L’ INGEGNERIA GENETICA.
Trascrizione Processo mediante il quale l’informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall’enzima.
Jacob, Monod – Parigi,1961 il modello dell’Operon-lac
Biotecnologie Il DNA ricombinante.
Transcript della presentazione:

La regolazione dell’espressione genica Tutte le cellule di un organismo multicellulare possiedono tutti i geni della propria specie; tuttavia solo una piccolissima frazione è attiva in ogni cellula; per esempio, in una cellula delle isole del pancreas è attivo il gene per l’insulina, non quelli per l’emoglobina (attivi nelle cellule dei midollo osseo, progenitrici dei globuli rossi) o per la pepsina (attivi nelle cellule della mucosa gastrica) Durante lo sviluppo embrionale di un organismo multicellulare, le cellule destinate a costituire i diversi tessuti e organi attivano in momenti precisi i geni che codificano le proteine che stimolano o inibiscono la proliferazione cellulare e quelle caratteristiche del tessuto in formazione (per esempio osseina per le ossa, cheratina per la pelle) Anche gli organismi unicellulari hanno bisogno di attivare alcuni geni solo in particolari circostanze (per esempio la presenza di un nutrimento che richiede particolari enzimi) per non sprecare l’energia e le molecole necessarie Finora si è spiegato cosa sono i geni, come vengono ereditati, come sono organizzati nei cromosomi, come mutano, qual è la loro natura molecolare (DNA), quali sono i loro prodotti (RNA e proteine) ma non come funzionano: l’espressione genica, cioè la trascrizione di specifici RNA, non è un’attività costante e comune a tutti i geni di una cellula; in ogni cellula sono attivi in ogni momento i geni “utili” in quel momento, grazie a “segnali” che provengono dall’ambiente e che la cellula riceve attraverso i suoi “recettori” e, mediante un passaggio interno dei segnali, trasmette ai propri geni. Tutte le cellule hanno tutti i geni caratteristici della specie; quindi fenomeni come il differenziamento cellulare durante l’embriogenesi (una cellula embrionale può diventare un neurone, una cellula del sangue, una cellula ossea), la produzione di particolari proteine in tessuti specifici dopo il differenziamento (l’insulina nel pancreas, la pepsina nello stomaco), la perdita di regolazione della proliferazione cellulare nelle cellule tumorali, l’adattamento degli organismi unicellulari alle condizioni ambientali (la formazione di spore resistenti in condizioni sfavorevoli) possono essere interpretati nei termini della regolazione dell’espressione genica; intere branche della genetica moderna (la genetica dello sviluppo, la genetica della cancerogenesi) si occupano di questi processi. Nella prima parte delle diapositive di questa serie (1-5) verrà descritto un semplice sistema di regolazione dell’espressione genica relativo al sistema lac di Escheirichia coli, studiato da Jacob e Monod negli anni ’60 del secolo scorso, costituito da un gruppo di geni che consente di utilizzare il lattosio come fonte di carbonio e di energia al posto del glucosio. Le cellule tumorali hanno perduto, anche in seguito a mutazioni somatiche, la capacità di regolare l’espressione genica relativa alle proteine che controllano la proliferazione cellulare Dunque nelle prossimità dei geni ci devono essere recettori in grado di percepire segnali provenienti dall’ambiente esterno e veicolati all’interno della cellula; tali recettori devono quindi segnalare ai geni se trascrivere o no, in funzione dei segnali provenienti dall’esterno

Il sistema lac in E. coli Lattosio H O C1’ C5’ C2’ C3’ HOC6’H2 C4’ OH Lattosio + H2O L’enzima b-galattosidasi, che consente di utilizzare il lattosio come fonte di carbonio e di energia, viene sintetizzato in presenza di lattosio che quindi oltre che esserne il substrato è anche l’induttore della sua sintesi b-galattosidasi O C1’ C5’ C2’ C3’ HOC6’H2 C4’ OH H OH O C1’ C5’ C2’ C3’ HOC6’H2 C4’ H Il lattosio è un disaccaride, cioè un polimero costituito da due molecole di zuccheri; le 2 molecole appartengono a 2 zuccheri diversi: il glucosio e il galattosio; l’enzima capace di sciogliere il legame fra le 2 molecole e di rendere quindi il glucosio disponibile per il metabolismo cellulare, è la beta-galattosidasi. Ciò che rende interessante questo enzima per lo studio sulla regolazione dell’espressione genica è il fatto che quando nell’ambiente non è presente il lattosio, il gene che codifica per questo enzima non è attivo, quindi l’enzima non è presente nella cellula batterica; quando invece si somministra lattosio nel terreno di coltura, il gene viene attivato e l’enzima viene prodotto; quando la scorta di lattosio finisce, il gene viene inattivato e l’enzima non viene più prodotto; quindi il lattosio non è solo il substrato dell’enzima, è anche l’induttore dell’espressione del suo gene. I geni che codificano per altri 2 enzimi, la permeasi, che facilita l’ingresso del lattosio, e la trans-acetilasi, vengono attivati in presenza di lattosio e inattivati in sua assenza. Dal lattosio è indotta la sintesi di altri 2 enzimi: permeasi e transacetilasi; anche la permeasi è coinvolta nel metabolismo del lattosio, poiché facilita l’ingresso del lattosio nella cellula. Glucosio Galattosio

I geni strutturali e il gene I I+ = allele normale:Z, Y, A trascrivono in presenza dell’induttore; I- = mutante costitutivo: Z, Y, A trascrivono sempre; Is = allele inibente la risposta all’induttore: Z, Y, A non trascrivono mai I Z Y A trascrizione Merodiploidi per definire le relazioni funzionali tra gli alleli Un unico mRNA policistronico I+Z-/I-Z+ Trascrive* con l’induttore I-Z-/I+Z+ I-Z-/I-Z+ Trascrive* sempre IsZ+/I+Z+ Non trascrive mai IsZ+/I-Z+ traduzione b-galattosidasi transacetilasi F’(lac) I geni Z (che codifica per la beta-galattosidasi), Y (per la permeasi) e A (per la trans-acetilasi) vengono trascritti insieme e il prodotto della trascrizione è un unico mRNA policistronico, che cioè è la trascrizione di più cistroni (si ricordi che il cistrone coincide con il gene, definito in base alla sua funzione; vedere serie 2, diapositiva 24), cioè di più geni; successivamente, durante la traduzione, vengono prodotte 3 diverse catene polipeptidiche che costituiscono i 3 enzimi. I 3 geni che codificano direttamente per gli enzimi vengono chiamati “geni strutturali”, per distinguerli dai “geni regolativi” che hanno solo una funzione di attivazione-inattivazione dei geni strutturali. Per questi 3 geni è stato possibile ottenere alleli non funzionali, cioè alleli i cui prodotti non presentano attività enzimatica (Z-, Y-, A-). Nei ceppi normali di E. coli i geni Z, Y, A sono trascritti in presenza di lattosio e non trascritti in sua assenza; tuttavia ci sono ceppi mutanti in cui la trascrizione di Z, Y, A avviene anche in assenza di lattosio (“mutanti costitutivi”), mentre vi sono altri ceppi mutanti in cui la trascrizione di Z, Y, A non avviene nemmeno in presenza di lattosio (inibizione della risposta all’induttore). Si è chiamato I il gene responsabile dell’induzione della trascrizione dei geni Z, Y, A; mediante mappatura si è verificato che tale gene non è vicino ai geni Z, Y, A. Per definire le relazioni funzionali fra i 3 alleli scoperti (I+, l’allele normale; I-, l’allele “costitutivo”; Is, l’allele inibitore) si è fatto ricorso a ceppi batterici merodiploidi stabili, appositamente costruiti, in cui tutti i geni del sistema lac (incluso I) fossero in condizione diploide, cioè presenti in 2 copie nella stessa cellula. Per questo si è trasmesso, mediante coniugazione batterica, un fattore F’ (lac), cioè un fattore F in cui sono inseriti tutti i geni del sistema lac (serie 2, diapositiva 19), con alleli adatti allo studio, in batteri F- che hanno i geni del sistema lac sul loro cromosoma, anch’essi con alleli adatti. Con adeguate combinazioni di alleli (funzionali o non funzionali per Z, Y, A; I+, I-, Is) in diversi ceppi merodiploidi, come si vede nella tabella in basso a destra nella diapositiva, si è visto che Is è dominante su I+ e su I- e che I+ è dominante su I-. Questa relazione di dominanza è indipendente dalla posizione sullo stesso cromosoma o sui 2 cromosomi diversi degli alleli di I rispetto agli alleli funzionali di Z, Y, A; ovvero la dominanza si esprime sia in cis (l’allele di I studiato è sullo stesso cromosoma degli alleli funzionali di Z, Y, A) che in trans (l’allele di I studiato è sull’altro cromosoma rispetto agli alleli funzionali di Z, Y, A). Questo risultato si spiega se si ammette che il gene I codifichi per un prodotto diffusibile che può avere effetto su entrambi i cromosomi. permeasi Geni lac 1) Is è dominante su I+ che a sua volta è dominante su I- *un mRNA per un enzima funzionale 2) I+ è dominante su I- indipendentemente dalla posizione in cis o in trans rispetto a Z+

Operatore, promotore e operone I P O Z Y A operone O+ = allele normale:Z, Y, A trascrivono in presenza dell’induttore; Oc = mutante costitutivo: Z, Y, A trascrivono sempre O+Z+/OcZ+ Trascrive* sempre O+Z+/OcZ- Trascrive* con l’induttore O+Z-/OcZ+ IsO+Z+/I+OcZ+ Il prodotto del gene I è una proteina diffusibile che, in assenza dell’induttore, si lega ad O e impedisce la trascrizione di Z, Y , A; in presenza dell’induttore non si lega ad O e consente la trascrizione di Z, Y, A Con lo stesso sistema dei batteri merodiploidi con F’ (lac) si sono studiate le relazioni di dominanza degli alleli mutati di altri 2 geni: il gene O (operatore) e il gene P (promotore; ma in generale il promotore è considerato una porzione dello stesso gene: serie 4, diapositiva 14). Prima di tutto i geni P ed O sono adiacenti fra loro e O è adiacente a Z. Gli alleli di O sono l’allele normale O+, che blocca la trascrizione di Z, Y, A in assenza di lattosio e la consente in sua presenza; Oc, allele “costitutivo”, che consente la trascrizione di quei geni anche in assenza di lattosio. Questi risultati hanno consentito di verificare che il prodotto dell’allele I+ del gene I è una proteina diffusibile, detta repressore, che, in assenza dell’induttore (il lattosio) si lega ad O e impedisce la trascrizione di Z, Y, A e in sua presenza non si lega ad O e consente la trascrizione di Z, Y, A; quando, invece dell’allele normale O+, è presente l’allele Oc, il repressore non si lega mai ad O, nemmeno in assenza dell’induttore, e la trascrizione di Z, Y, A avviene sempre, incondizionatamente. I risultati che hanno consentito questa interpretazione ed hanno consentito di identificare le relazioni di dominanza sono esposti nella tabella al centro, a sinistra nella diapositiva. In un merozigote, Oc è dominante rispetto a O+, ma solo quando è in cis (sullo stesso cromosoma) rispetto agli alleli funzionali di Z, Y, A; quando Oc è in trans rispetto a questi ultimi, non esprime la propria dominanza rispetto a O+. Oc, quando è in cis rispetto agli alleli funzionali di Z, Y, A, sopprime l’effetto degli alleli I+ e Is di I; cioè consente la trascrizione incondizionata dei geni Z, Y, A anche in presenza di questi alleli di I, che altrimenti ne impedirebbero la trascrizione sempre (Is) o in assenza di lattosio (I+). L’allele funzionale del promotore P+, in presenza degli alleli normali I+ e O+, blocca la trascrizione di Z, Y, A in assenza di lattosio e la consente in sua presenza, mentre l’allele non funzionale del promotore P- non consente mai la trascrizione, in assenza come in presenza dell’induttore, quali che siano gli alleli di I ed O. In un merozigote, P- è dominante rispetto a P+, ma solo quando è in cis (sullo stesso cromosoma) rispetto agli alleli funzionali di Z, Y, A; quando P- è in trans rispetto a questi ultimi, non esprime la propria dominanza rispetto a P+. P-, quando è in cis rispetto agli alleli funzionali di Z, Y, A, sopprime l’effetto degli alleli I+ e I- di I e O+ e Oc di O; cioè non consente mai la trascrizione dei geni Z, Y, A anche in presenza di questi alleli di I ed O, che altrimenti ne consentirebbero la trascrizione sempre (I-e Oc) o in presenza di lattosio (I+ e O+); questo effetto è comprensibile se si ricorda che il promotore è la regione a monte del gene da trascrivere cui si lega l’RNA polimerasi (serie 4, diapositiva 14); una mutazione del promotore che impedisse il “riconoscimento” del promotore e il legame ad esso da parte dell’RNA polimerasi impedirebbe in ogni condizione la trascrizione di quel gene. L’insieme dei geni adiacenti P (promotore), O (operatore), Z, Y, A (geni strutturali), che insieme rispondono, consentendo o non consentendo la trascrizione in funzione della presenza o dell’assenza dell’induttore (in questo caso il lattosio), costituiscono un’unica unità funzionale regolata, chiamata operone dai suoi scopritori; altri operpni sono stati successivamente scoperti nei procarioti. *un mRNA per un enzima funzionale 1) Oc è dominante su O+, ma solo in cis rispetto a Z+ (cis-dominanza) 2) Gli alleli normali di P sono cis-dominanti sui mutanti difettivi di P, che impediscono incondizionatamente la trascrizione di Z, Y, A, impedendo l’inserimento della RNA polimerasi

Controllo negativo dell’espressione genica nell’operone lac repressore non legato all’induttore, che si lega ad O e impedisce la trascrizione RNA polimerasi I P O Z Y A induttore repressore legato all’induttore, che non si lega ad O e non impedisce la trascrizione mRNA I- I P O Z Y A repressore I- senza affinità per O, con cui non si lega mai e non impedisce mai la trascrizione repressore Is senza affinità per l’induttore, che si lega sempre ad O e impedisce sempre la trascrizione I P O Z Y A Is Questa diapositiva riassume i meccanismi attraverso cui si esprimono i fenotipi dei diversi alleli del sistema lac. Nella prima riga è descritto quanto avviene quando sono presenti gli alleli normali per tutti i geni coinvolti: l’RNA polimerasi si lega al promotore; il repressore normale, codificato dal gene I ha una parte della propria molecola che “riconosce” e si lega all’operatore; in questo modo blocca fisicamente il percorso dell’RNA polimerasi e impedisce la trascrizione di Z, Y, A; il repressore tuttavia ha un’altra parte della propria molecola che“riconosce” e si lega all’induttore, se questo è presente nella cellula. Se l’induttore è presente e si lega al repressore, quest’ultimo subisce un cambiamento di forma (“allosteria”) che altera la parte della sua molecola responsabile del legame all’operatore e ne annulla la funzione, impedendo il riconoscimento e il legame all’operatore; in questo caso il repressore legato all’induttore non si lega all’operatore, l’RNA polimerasi trova la strada sgombra e la trascrizione di Z, Y, A procede. L’allele I- produce una molecola di repressore che ha alterata la parte della sua molecola responsabile del legame all’operatore; quindi, anche in assenza dell’induttore, il repressore non si lega mai all’operatore e la trascrizione di Z, Y, A procede. L’allele Is produce una molecola di repressore che ha alterata la parte della sua molecola responsabile del legame all’induttore; quindi, anche in presenza dell’induttore, il repressore si lega sempre all’operatore e la trascrizione di Z, Y, A non procede. L’allele Oc ha perduto la sua affinità per il repressore; quindi, anche in assenza dell’induttore, il repressore non si lega mai all’operatore e la trascrizione di Z, Y, A procede. L’allele P- ha perduto la sua affinità per l’RNA polimerasi; quindi, anche in presenza dell’induttore, l’RNA polimerasi non si lega mai al promotore e la trascrizione di Z, Y, A non procede. Questa modalità di controllo dell’espressione dell’operone lac è chiamata “controllo negativo”, poiché la molecola di cotrollo ( il repressore) impedisce la trascrizione. operatore senza affinità per il repressore che non lega mai e non impedisce mai la trascrizione I P O Z Y A Oc I P O Z Y A promotore senza affinità per l’RNA polimerasi che impedisce sempre la trascrizione P-

Controllo positivo dell’espressione genica nell’operone lac A basse concentrazioni di glucosio aumenta la concentrazione di AMP ciclico (cAMP). cAMP si lega a una proteina attivatrice (CAP). P O Z Y A mRNA RNA polimerasi cAMP …e, in presenza di lattosio, che “blocca” il repressore,… Il complesso CAP-cAMP si lega al promotore e ne aumenta l’affinità per l’RNA polimerasi… CAP …intensifica la trascrizione di Z, Y ed A. Controllo negativo dell’espressione genica nell’operone trp Un sistema di controllo positivo dell’operona lac è legato alla concentrazione del nucleotide adenosin-monofosfato ciclico (cAMP), che è presente nella cellula batterica in concentrazioni crescenti quando cala la concentrazione di glucosio. Nella cellula è presente una proteina attivatrice (CAP) che, in assenza di cAMP, non è in grado di legarsi al promotore. Quando c’è poco glucosio e cAMP è abbondante, CAP forma un complesso con cAMP, si modifica allostericamente e si lega al promotore dell’operone lac, aumentandone l’affinità per l’RNA polimerasi. Questo sistema è di controllo positivo perché la molecola regolatrice (il complesso CAP-cAMP), legandosi al promotore incrementa la trascrizione. Complessivamente, solo se è disponibile il lattosio, la trascrizione dei geni dell’operone lac è consentita, ma è molto intensificata solo se nella cellula batterica scarseggia il glucosio. Un altro sistema di controllo negativo in E. coli è descritto di seguito: l’operone trp che controlla la biosintesi dell’aminoacido triptofano. Questo sistema funziona alla rovescia, rispetto all’operone lac: il repressore, in assenza di triptofano, non è in grado di legarsi all’operatore, consentendo così la trascrizione dell’operone trp e, in ultima analisi, la produzione di triptofano; il repressore ha una parte della propria molecola che “riconosce” e si lega al triptofano, se questo è presente nella cellula; come conseguenza di questo legame, attraverso una modificazione allosterica, un’altra parte della propria molecola acquista l’affinità per l’operatore trp e la capacità di legarsi ad esso; legandosi all’operatore, il repressore blocca fisicamente il percorso dell’RNA polimerasi e impedisce la trascrizione di dei geni strutturali dell’operone trp. repressore non legato al triptofano, che non si lega ad O e consente la trascrizione P O trpE trpD trpC trpB trpA triptofano mRNA RNA polimerasi repressore legato al triptofano, che si lega ad O e non consente la trascrizione

Organizzazione della cromatina e controllo della trascrizione negli eucarioti L’acetilazione degli istoni, mediata dalle proteine attivatrici e da trans-acetilasi, allenta il legame con il DNA, che diventa accessibile ai fattori di trascrizione e alla RNA polimerasi Nei nuclei in interfase i cromosomi hanno domini separati, che si possono vedere con sonde specifiche Le regioni che devono trascrivere si spostano alla superficie dei domini attivatore transacetilasi deacetilasi Il controllo dell’espressione genica negli eucarioti può avvenire a livello di trascrizione ma anche di traduzione. Per il controllo della trascrizione è importante l’architettura della cromatina come rimodellamento dei dominii cromosomici in qualità di comparti nucleari. Su un’altra scala sono decisive le modificazioni chimiche degli istoni che, modificando l’affinità tra il DNA e gli istoni, cambiano la compattezza della romatina e l’accessibilità del DNA agli enzimi della trascrizione nella regione del promotore. Le modificazioni più frequenti sono l’acetilazione, la metilazione, la fosforilazione. In particolare l’acetilazione degli istoni consente l’accessibilità del DNA per la trascrizione ed è rapidamente seguita dalla deacetilazione, dopo che la trascrizione è avvenuta: si tratta quindi di una modificazione reversibile e a breve termine. Invece la metilazione degli istoni determina uno stato condensato della cromatina a lungo termine, che inibisce la trascrizione. O HO C H2 La metilazione degli istoni compatta la cromatina e rende il DNA inaccessibile acetile Terminata la trascrizione, gli istoni sono deacetilati con l’azione di una deacetilasi e si ripristina il legame DNA-istoni nei nucleosomi, tornando alle condizioni di riposo. H3 C metile

Regolazione della trascrizione negli eucarioti: promotore e intensificatori Regioni regolatrici dei geni eucariotici Regioni Sequenze, Funzioni Posizioni Regione centrale del promotore TATA box Legame con fattori di trascrizione, RNA polimerasi II 25-30 nucleotidi a monte Promotore (altre regioni) CAAT box e/o GC box Legame con fattori di trascrizione (generali e specifici) Distanze varie, a monte Intensificatori Varie Legame con proteine attivatrici, modificazione della cromatina Varia A livello del DNA, oltre alla regione centrale del promotore (TATA box), cui si legano l’RNA polimerasi II e alcuni fattori di trascrizione e alle altre regioni del promotore (p. es. CAAT box), cui si legano altri fattori di trascrizione e rendono più accessibile il TATA box, situate al 3’ del gene, ci sono altre regioni, con diverse sequenze e diverse collocazioni rispetto al gene, cui si legano proteine attivatrici che, anche attraverso il ripiegamento della molecola di DNA, facilitano l’accesso al DNA del complesso di trascrizione. Nella presente diapositiva il processo è illustrato a grandi linee; ma ci sono diverse tappe: I fattori di trascrizione generali si legano al promotore e alla sua regione centrale, costituendo una piattaforma di riconoscimento e di aggancio per l’RNA polimerasi I prima del’inizio della trascrizione; questo assetto consente un livello base della trascrizione; I fattori di trascrizione specifici sono proteine attivatrici che si legano all’intensificatore (“enhancer”) sul DNA e dall’altro lato si legano al complesso di trascrizione, aumentendo l’intensità della trascrizione; I repressori si possono legare al complesso di trascrizione inibendone la funzione. Tutta questa vasta famiglia di proteine regolatrici che si legano al DNA possiedono delle regioni tipiche di legame al DNA (“dominio di legame al DNA”) che presentano delle strutture secondarie e terziarie ricorrenti (“motivi”): Il motivo elica-giro-elica, che consente di formare in sequenza due alfa eliche parallele fra di loro e una terza alfa elica ortogonale alle prime due; Il motivo dito a zinco, in cui mediante legami ricorrenti con un atomo di zinco si ottiene un caratteristico ripiegamento a dito del polipeptide; Il motivo cerniera di leucine basiche che consente la dimerizzazione del polipeptide e il suo caratteristico legame a forbice con il DNA. Attivatori Complesso di fattori di trascrizione RNA polimerasi II CAAT box TATA box Intensificatore

Inattivazione a lungo termine della trascrizione negli eucarioti: eterocromatina costitutiva e facoltativa Le regioni cromosomiche con la cromatina compatta sono visibili nei nuclei in interfase come zolle più colorate e costituiscono l’eterocromatina Il compattamento avviene con l’avvolgimento dei nucleosomi a formare il solenoide… …e con il ripiegamento della cromatina sulla matrice. Le regioni con DNA satellite non hanno geni, non trascrivono mai e sono sempre compatte (eterocromatina “costitutiva”) Il cromosoma X inattivo rimane condensato in interfase (eterocromatina “facoltativa”), ove è visibile come “corpo di Barr”. Oltre alla regolazione a breve termine della trascrizione, negli eucarioti si manifesta l’inattivazione a lungo termine di geni o intere regioni cromosomiche, che non effettuano per un lungo periodo o mai più la trascrizione. L’inattivazione di uno dei due cromosomi X delle femmine di mammiferi placentati avviene precocemente nelle cellule somatiche durante l’embriogenesi mediante l’espressioe del gene Xist, che si trova sul cromosoma X da inattivare e riguarda a caso uno dei due cromosomi omologhi; quando l’inattivazione è compiuta è irreversibile e i cromosomi X che derivano dalla replicazione del cromosoma inattivato, saranno a loro volta inattivati; quindi tutta la progenie cellulare che deriva da una cellula che ha inattivato il cromosoma X di origine paterna (il cromosoma celeste che, nella diapositiva, diventa nero, nelle cellule della colonna a sinistra) possiederanno tutte il cromosoma X di origine paterna inattivato: si tratta di cloni cellulari “epigenetici”, o cloni di espressione, in cui tutte le cellule condividono, per discendenza comune, lo stesso cromosoma X inattivato e i tessuti somatici femminili si possono definire, per questo, mosaici di espressione. Il cromosoma X inattivo si mantiene in condizione condensata anche in interfase, sia per lo stretto avvolgimento della cromatina a formare il solenoide (vedere il credito 3), sia per il ripiegamento della cromatina sulla matrice nucleare. Per questo il cromosoma X inattivo è ben visibile in interfase come regione più condensata e più intensamente colorabile: tale regione è chiamata “corpo di Barr”. Più in generale le zolle di cromatina più “dense” in interfase vengono chiamate, nel loro insieme, eterocromatina, mentre le regioni non condensate in interfase vengono chiamate eucromatina. L’eucromatina corrisponde alle regioni cromosomiche potenzialmente attive nella trascrizione. L’eterocromatina a sua volta può essere facoltativa o costitutiva; quest’ultima è costituita da regioni prive o estremamente povere di geni costituite di DNA satellite (sequenze brevi ripetute in tandem milioni di volte) questa denominaziine indica che si tratta di regioni incondizionatamente inattive. La prima, invece, è costituita da regioni ricche di geni che possono essere inattivate: il cromosoma X inattivato è un esempio di eterocromatina facoltativa. Uno dei processi di modificazione del cromosoma X inatttivato consiste nella metilazione, su di esso, di molte molecole di citosina, sul carbonio in posizione 5. La metilazione della citosina nel DNA in sequenze 5’CG3’ è connessa con l’inattivazione del cromosoma X C H C H N O H Durante le fasi precoci dell’embriogenesi uno dei 2 cromosomi X di femmine di mammifero è inattivato a caso in ciascuna cellula somatica e l’inattivazione è ereditata dalla discendenza cellulare; i tessuti somatici femminili sono mosaici clonali “epigenetici”, cioè d’espressione genica.

Inattivazione a lungo termine della trascrizione negli eucarioti: l’imprinting genomico Durante la gametogenesi sono inattivati alcuni geni specifici, che sono diversi nelle cellule germinali maschili e femminili (“imprinting genomico”). Disomia uniparentale geni inattivati nei gameti maschili geni inattivati nei gametifemminili Nelle fasi precoci dello sviluppo embrionale l’inattivazione viene rimossa nella linea germinale Nei mammiferi, alcuni geni sono specificamente inattivati durante la gametogenesi maschile, altri nella gametogenesi femminile; questi geni sono attivi durante lo sviluppo embrionale e, in quella fase,si trovano in una condizione epigenetica aploide; anche in questo caso la metilazione della citosina è coinvolta nell’inattivazione. Questo processo è detto imprinting genomico o parentale. Qualora l’unico gene attivo non si manifesti più, in seguito a mutazione genica, delezione o monosomia, si possono verificare tipiche sindromi da difetti di sviluppo embrionale. Nella diapositiva è mostrato l’apparente paradosso della disomia uniparentale, per cui la fecondazione tra un gamete disomico e uno monosomico per lo stesso cromosoma, anche se determina un bilanciamento genetico secondario nello zigote (tutti i geni e tutti i cromosomi sono presenti in due copie), non evita lo sbilnciamento epigenetico (per il gene contrassegnato dalla stella azzurra non esoste nemmeno una copia attiva). La metilazione della citosina, infine, è anche connessa con l’inattivazione a lungo termine dei geni i cui prodotti hanno un’azione tessuto-specifica nei tessuti in cui non devono operare. La metilazione della citosina in sequenze 5’CG3’ è garantita da una trans-metilasi che “riconosce” la citosina del filamento stampo del DNA e, subito dopo la replicazione, inserisce un radicale metilico sul carbonio 5 della citosina del filamento appena sintetizzato, appaiata alla guanina del filamento stampo. La metilazione della citosina nel DNA in sequenze 5’CG3’ è connessa con l’imprinting genomico Zigote bilanciato geneticamente (tutti i geni in 2 copie) ed epigeneticamente (almeno una copia attiva di tutti i geni). Zigote bilanciato geneticamente (tutti i geni in 2 copie) ma sbilanciato epigeneticamente (almeno ungene non ha una copia attiva). La metilazione della citosina nel DNA in sequenze 5’CG3’ è connessa infine con l’inattivazione di geni ad azine tessuto-specifica

Il controllo dopo la trascrizione negli eucarioti Controllo quantitativo: l’interferenza da RNA Complesso RISC Complesso DICER siRNA 1) Un breve (70 nucleotidi) RNA a doppio filamento viene tagliato da DICER mRNA trascrizione 2) Un dei 2 filamenti complementari residui (21 nucleotidi), detto siRNA, si lega a RISC 3) siRNA-RISC si appaia a una regione complementare di uno specifico mRNA e lo frammenta 4) I frammenti dell’mRNA sono degradati miRNA Esistono diverse forme di controllo dopo la trascrizione, come il blocco della traduzione di un mRNA nei ribosomi per effetto dei polipeptidi risultati dalla traduzione di quello stesso mRNA (retroazione negativa). Nella presente diapositiva sono presentate due modalità di interferenza a RNA. siRNA (“piccoli RNA da interferenza”): molecole di RNA di circa 70 nucleotidi dopo la trascrizione formano doppie eliche complementari e antiparallele. L’RNA a doppia elica è riconosciuto dal complesso proteico DICER, che taglie le porzioni esterne di questo RNA; uno dei filamenti interni è l’siRNA, che si lega al complesso proteico RISC che, dopo l’individuazione dell’mRNA che possiede un tratto complementare e antiparallelo a siRNA, media il legame siRNA-mRNA e taglia in piccoli frammenti l’mRNA bersaglio. In questo modo la trascrizione delle molecole di RNA che contengono le sequenze di siRNA accorcia il tempo di sopravvivenza degli mRNA bersaglio e, per questa via, ne inibisce la traduzione in catena polipeptidica. miRNA (micro RNA): un unico trascritto di RNA (70-130 nucleotidi) si ripiega a forcina, grazie a sequenze palindromiche alle due estremità. L’intervento del complesso DICER frammenta la molecola alla base della forcina, i 2 filamenti complementari rimanenti (19-24 nucleotidi) si allontanano e uno di essi, il miRNA, complementare all’estremità 3’ non tradotta di uno specifico mRNA, si lega a quell’estremità è impedisce la traduzione di quell’mRNA. Sfruttando le proprietà dell’interferenza a RNA è possibile costruire piccoli RNA artificiali in grado di inibire la traduzione di specifici mRNA (p. es. quelli dei protooncogeni mutati in grado di indurre un tumore. Si pensa che il sistema di interferenza a RNA sia efficace, in condizioni naturali, come difesa contro gli RNA virali e contro la retro-trasposizione. mRNA 1) Un breve (70-130 nucleotidi) RNA a forcina viene tagliato da DICER 3) Un dei 2 filamenti complementari residui (19-24 nucleotidi), detto miRNA, si appaia a una regione complementare all’estremità 3’ non tradotta di uno specifico mRNA e ne blocca la traduzione

Il controllo della traduzione negli eucarioti b-tubulina …. …. aa6- -aa5- …..- aan Arg- Met- Glu- Ile AUG 5’ AAAAAAAA 3’ In assenza/bassa concentrazione di b-tubulina, la traduzione dell’mRNA della b-tubulina procede fino al completamento e il rilascio del polipeptide. b-tubulina …. …. Nella presente diapositiva è illustrato un esempio di controllo dell’espressione genica a livello della traduzione negli eucarioti: in base ai risultati sperimentali è stato proposto un modello semplice del controllo della traduzione delle tubuline (alfa e beta), componenti essenziali del citoscheletro e del fuso mitotico. Se la tubulina è scarsa o assente, la traduzione del suo mRNA si svolge fino al completamento e lo stesso mRNA può essere di nuovo coinvolto in un successivo processo di traduzione. Se la tubulina è presente in una concentrazione critica, alcuni aminoacidi “centrali” della sua catena polipeptidica si “legano” ai 4 aminoacidi iniziali della catena polipeptidica di tubulina in via di traduzione; questo legame blocca il processo di traduzione e induce l’azione di una Rnasi che taglia l’mRNA impegnato sul ribosoma e ne causa la degradazione. Arg- Met- Glu- Ile 5’ AUG AAAAAAAA 3’ RNasi In presenza di concentrazioni alte di b-tubulina, la traduzione dell’mRNA della b-tubulina è bloccata dal legame che si crea tra alcuni aminoacidi centrali della b-tubulina già presente nel citoplasma con i primi 4 aminoacidi della b-tubulina nascente; tale complesso induce l’azione di una Rnasi che taglia e degrada l’mRNA legato al ribosoma.

Un gene più catene polipeptidiche? “editing” dell’mRNA mRNA Cambiamenti nella sequenza degli mRNA possono avvenire per inserzione/delezione di base (p. es mRNA mitocondrali) UUUU mRNA Cambiamenti nella sequenza degli mRNA possono avvenire per isostituzione di base (p. es mRNA dell’apolipoproteina B nell’intestino umano) C U AA “splicing” alternativo Esoni “costitutivi” pre-mRNA Esoni “facoltativi” Introni Oltre al controllo quantitativo della traduzione, si realizza anche un controllo “qualitativo”. La modificazione delle sequenze dell’mRNA (“editing” dell’mRNA) consiste nell’inserimento o nella sostituzione di nucleotidi, come succede nella traduzione di geni mitocondriali. L’editing può essere tessuto-specifica, come nell’esempio dell’apolipoproteina B riportato nella diapositiva. Lo splicing alternativo è un fenomeno molto più imponente, per cui da un singolo gene possono derivare centinaia o migliaia di catene polipeptidiche diverse, a seconda dei siti di splicing che vengono attivati. Quindi la traduzione di un singolo gene può portare a un repertorio proteico estremamente versatile, capace di rispondere agli stimoli presenti in tessuti diversi o addirittura di cellule diverse dello stesso tessuto. mRNA alternativi Al gene SLO nell’uomo sono attribuiti 500 possibili mRNA nelle cellule della coclea Al gene Dscam in Drosophila sono attribuiti più di 30.000 possibili mRNA nei neuroni

Splicing alternativo: determinazione del sesso in Drosophila X Y Sxl X X SXL Tra AUG UAG UGA AUG UAG UGA pre-mRNA Polipetide tradotto TRA TRA- Dsx Nella presente diapositiva è illustrato un esempio di eventi di splicing alternativo “a cascata” che determina il sesso in Drosophila, costituendo una connessione tra la regolazione dell’espressione genica e la genetica dello sviluppo, descritta all’inizio del credito successivo. Il rapporto numerico fra cromosomi X e autosomi determina il sesso in Drosophila; quando tale rapporto è 1:2 (1 cromosoma X e 2 assetti di autosomi), come avviene negli individui XY, allora il differenziamento porta ad adulti maschi; quando tale rapporto è 2:2 (2 cromosomi X e 2 assetti di autosomi), come avviene negli individui XX, allora il differenziamento porta ad adulti femmine. Negli individui con un solo cromosoma X, il gene Sxl (sex lethal) non è attivo e non produce il polipeptide SXL; invece negli individui con 2cromosomi X, il gene Sxl è attivo e produce il polipeptide SXL. Negli individui con 2 cromosomi X il polipeptide SXL, insieme ad altri, forma un complesso che interagisce con il trascritto pre mRNA del gene Tra (transformer) e ne indiizza lo splicing (nella diapositiva: rimozione di un introne ampio che include i segmenti nero e verde); ne risulta un mRNA che, tradotto, porta alla sintesi di un polipeptide TRA. Negli individui con un solo cromosoma X il polipeptide SXL è assente; il trascritto pre mRNA del gene Tra, senza l’interazione con SXL, effettua lo splicing rimuovendo segmenti di RNA diversi da quelli precedenti (nella diapositiva: rimozione di un introne più piccolo che include solo il segmento nero); ne risulta un mRNA che, tradotto, porta alla sintesi di un polipeptide TRA difettivo. Si noti che la lunghezza del polipeptide tradotto non dipende dalla lunghezza degli introni rimossi ma dalla distanza, nell’mRNA maturo, tra il codone di inizio traduzione (AUG) e il primo codone di stop che si incontra (UAA, UAG o UGA). Negli individui con 2 cromosomi X il polipeptide TRA, insieme ad altri, forma un complesso che interagisce con il trascritto pre mRNA del gene Dsx (double sex) e ne indiizza lo splicing (nella diapositiva: rimozione di 2 introni costituiti dai 2 segmenti neri); ne risulta un mRNA che, tradotto, porta alla sintesi di un polipeptide DSX “femminile” che porta al differenziamento di adulti di sesso femminile. Invece negli individui con un solo cromosoma X il polipeptide TRA difettivo non interagisce con il trascritto pre mRNA del gene Dsx che effettua lo splicing in una modalità alternativa a quella precedente (nella diapositiva: rimozione di un solo introne costituiti dal primo segmento nero); ne risulta un mRNA che, tradotto, porta alla sintesi di un polipeptide DSX “maschile” che porta al differenziamento di adulti di sesso maschile. AUG UGA UAG AUG UGA UAG pre-mRNA Polipetide tradotto DSX f DSX m Differenziamento maschile Differenziamento femminile

Ingegneria genetica Batterio Le tecniche dell’ingegneria genetica permettono di isolare un gene che codifica per una determinata proteina e di inserirlo, mediante dei vettori adatti, nel genoma di un altro organismo. Queste tecniche sono state applicate al campo della medicina per la produzione farmaci, per la diagnosi di malattie genetiche, per la progettazione di vaccini. In agricoltura si stanno progettando piante e animali transgenici, per aumentarne la produttività e migliorarne la qualità. Ma tutto ciò pone problemi nuovi di carattere etico, economico, biologico che devono essere attentamente valutati per la tutela della vita e dell’ambiente. Batterio Cellula contenente il gene da isolare Plasmide isolato DNA purificato Cromosoma batterico Plasmide Gene da isolare DNA ricombinante (plasmide) Inserimento del plasmide nella cellula batterica Le diapositive 6 - 13 riguardano le tecnologie del DNA ricombinante che sono alla base delle applicazioni della genetica molecolare alla medicina, all’industria, all’amministrazione della giustizia e all’agricoltura, sia dal punto di vista diagnostico e di riconoscimento e identificazione delle sequenze (identificazione personale mediante il DNA, paternità contestata, riconoscimento dell’origine dei mangimi destinati al bestiame, diagnosi di malattie ereditarie, di suscettibilità a particolari fattori ambientali), sia dell’aumento delle conoscenza (identificazione delle sequenze di interi genomi di specie importanti dal punto di vista teorico e/o applicativo, come Drosophila, Escheirichia coli, il topo e lo stesso uomo, con il ben noto progetto sul Genoma Umano da poco concluso), sia della modificazione dei genomi di particolari cellule o organismi (microrganismi di interesse farmaceutico o industriale, animali di laboratorio per ricerche biomediche, cellule staminali - cioè non differenziate e in grado di proliferare - per la terapia genica – cioè per inserire cellule con geni funzionanti in un tessuto le cui cellule presentano lo stesso gene non funzionante, con conseguenze di tipo patologico - , piante coltivabili e animali da allevamento transgenici, cui cioè sono stati inseriti particolari geni). L’uso di queste nuove tecnologie presenta numerosi vantaggi (si pensi ai vantaggi della terapia genica o all’abbattimento dei costi nella produzione e nella maggiore efficacia di polipeptidi di interesse farmacologico da parte di batteri modificati geneticamente) ma pone anche numerosi problemi: etici (l’inserimento a scopo terapeutico di cellule staminali geneticamente modificate nei tessuti somatici umani costituisce un aumento della capacità di intervento terapeutico e non pone problemi etici, mentre la modificazione genetica di cellule della linea germinale nell’uomo e quindi della progenie pone gravi problemi etici), scientifici (la modificazione genetica mediante incroci, selezione e, nell’ultimo secolo, mediante mutagenesi, ha modificato il patrimonio genetico delle specie animali, vegetali, fungine, batteriche di interesse economico; ma le nuove tecnologie consentono, al contrario delle precedenti, di inserire geni di un organismo in un organismo molto lontano da un punto di vista evolutivo, come un batterio e una pianta e spesso il punto del genoma dell’ospite in cui avviene l’inserimento non è ben definito; poiché i sistemi di regolazione dell’espressione genica nei procarioti – di cui si è dato un esempio nelle diapositive 1-5 – e negli eucarioti sono molto diversi, la resa dell’espressione genica del gene inserito può essere molto problematica; da qui il rendimento molto basso della produzione di piante transgeniche efficienti), sanitari (eventuali, anche se improbabili, reazioni allergiche ai prodotti del gene inserito in piante di uso alimentare; uso massiccio di diserbanti conseguenti all’inserimento di geni che conferiscono la resistenza al diserbante stesso alla pianta coltivata transgenica) bio-ecologici (trasmissione, voluta o incontrollata, del gene inserito in altre popolazioni della stessa specie di piante tramite impollinazione o addirittura in altre specie, per trasposizione con alterazione degli equilibri ecologici; sostituzione di diverse linee di piante coltivate con i nuovi ceppi transgenici, con possibile riduzione della biodiversità) politico-economici (la discutibile e discussa brevettazione degli organismi ingegnerizzati innalza i costi dell’utilizzo di questi organismi e rischia di impoverire ulteriormente i paesi più poveri che ne avrebbero bisogno). Nella diapositiva è illustrata la procedura generale, che verrà descritta più in dettaglio nelle diapositive successive, che consente di inserire il gene di interesse in un batterio: si purifica il DNA della cellula donatrice, si isola il gene che si vuole inserire e lo si inserisce in un plasmide capace di replicare autonomamente, mediante le tecniche del DNA ricombinante; infine si inserisce il plasmide con il gene inserito in un batterio; il batterio contenente il plasmide si duplica, duplicando così anche il plasmide; sul clone di batteri che ne deriva è possibile ottenere copie del gene isolato o della proteina che ne è il prodotto. Copie delle proteine come ad esempio insulina, ormone della crescita Copie del gene isolato Batterio ricombinante duplicazione

Enzimi di restrizione Gli enzimi di restrizione sono endonucleasi capaci di tagliare il DNA producendo rotture a doppia elica in corrispondenza di sequenze specifiche di nucleotidi (siti di restrizione); di essi si servono i batteri per distruggere i cromosomi virali Un taglio è detto adesivo quando: È sfalsato, o sono aggiunti nucleotidi al 3’; I nucleotidi a singolo filamento, sfalsati o aggiunti, sono fra loro complementari endonucleasi Sito di restrizione Tipo di taglio G 5’3’ AATTC Sfalsato, adesivo EcoRI CTTAA G CC GG Tronco, non adesivo HaeIII 5’3’ GG CC Le estremità di un taglio adesivo si possono unire mediante i legami idrogeno tra le basi complementari presenti a singolo filamento sui 2 segmenti di DNA; successivamente, mediante l’azione di ligasi e, se serve, di DNA polimerasi, si saldano i filamenti polinucleotidici (vedere diapositiva 8) Gli enzimi di restrizione sono endonucleasi batteriche, cioè enzimi capaci di tagliare il DNA a doppia elica su entrambi i filamenti anche lontano dalle estremità della macromolecola; ogni enzima di restrizione riconosce una propria, specifica, breve sequenza (4-6 nucleotidi) di DNA e taglia la doppia elica in quel punto; tali sequenze sono “palindromiche”, cioè la metà della sequenza posta a un lato rispetto al centro dell’intera sequenza è complementare alla sequenza invertita rispetto alla metà della sequenza posta all’altro lato. I tagli possono essere tronchi, non adesivi, cioè i due tagli sui 2 filamenti polinucleotidici avvengono esattamente allo stesso punto, oppure sfalsati, adesivi, cioè i due tagli sui 2 filamenti polinucleotidici avvengono in punti, sfalsati di alcuni nucleotidi. I tagli sfalsati sono adesivi poiché le brevi sequenze a singolo filamento che sporgono dalle due estremità della rottura sono fra loro necessariamente complementari (come si vede nella riga di EcoRI); per questo le 2 brevi sequenze a singolo filamento si possono appaiare di nuovo, tenendo insieme i 2 segmenti di DNA divisi dal taglio; se in queste condizioni si fornisce l’enzima ligasi (vedere serie 4, diapositiva 12), le rotture vengono saldate e si ricostituisce l’integrità della doppia elica. Come è ovvio, se i tagli sono tronchi, dalle estremità di rottura non sporgono brevi sequenze a singolo filamento fra loro complementari, quindi tali estremità di rottura non sono adesive; tuttavia è possibile renderle adesive aggiungendo all’estremità 3’ di un’estremità di rottura una breve sequenza ripetuta dello stesso nucleotide e all’estremità 3’ dell’altra estremità di rottura una breve sequenza ripetuta del nucleotide complementare. Gli enzimi di restrizione, che dai batteri sono utilizzati per distruggere i cromosomi virali, per la loro capacità di tagliare il DNA in punti estremamente specifici e di lasciare estremità di rottura adesive, naturali o artificiali, sono uno strumento potente e versatile per l’ingegneria genetica poiché consentono di tagliare frammenti di DNA, isolarli e inserirli in un altro tratto di DNA. Formazione di code CC AA GG 5’3’ GG TT CC Si possono aggiungere al 3’ di uno dei 2 filamenti di un capo di un taglio tronco, non “adesivo”, una breve sequenza, ripetizione di un solo nucleotide e al 3’ dell’altro capo la sequenza complementare, rendendo adesivo il taglio I siti di restrizione sono brevi sequenze palindromiche: la sequenza posta a un lato rispetto al centro del sito è complementare alla sequenza inversa rispetto a quella posta al lato opposto

Mappe di restrizione Una mappa di restrizione consiste nell’identificazione della successione dei siti di restrizione per diverse endonucleasi in un segmento di DNA, misurando la distanza tra i siti come numero di nucleotidi 1) Si esamina un frammento di DNA, marcandolo con 32P al 5’ 2) Si digerisce il frammento con diversi enzimi di restrizione Marcatura con con 32P Siti di restrizione dell’enzima 3) Si stima la lunghezza dei frammenti dallo spazio percorso su un gel mediante elettroforesi Siti di restrizione dell’enzima È possibile mappare i siti di restrizione, cioè i punti riconosciuti e tagliati dagli enzimi di restrizione, di qualunque molecola di DNA (cromosomi, plasmidi, frammenti di diversa lunghezza), identificando la loro sequenza lineare e misurandone le distanze come numero di nucleotidi. La tecnica consiste nella marcatura con l’isotopo radioattivo 32P (vedere sezione 4, dipositiva 6) l’estremità 5’ del filamento polinucleotidico che si vuole esaminare; in questo modo è possibile riconoscere i frammenti di DNA che contengono il radioisotopo mediante la tecnica dell’autoradiografia: si spande un’emulsione fotografica sulla superficie su cui è esposta la molecola da esaminare; in corrispondenza dell’emissione radioattiva l’emulsione si impressiona, rendendo così riconoscibile la posizione della molecola marcata con radioisotopi. I siti di restrizione del filamento di DNA complementare a quello esaminato si trovano negli stessi punti, dato che i siti di restrizione sono gli stessi nei due filamenti polinucleotidici di DNA complementari avvolti a doppia elica; perciò è sufficiente esaminare anche un solo filamento. In questo modo si può misurare la lunghezza di tutti i frammenti che hanno la propria estremità 5’ coincidente con quella del filamento; l’estremità 3’ (non marcata) dei diversi frammenti corrisponderà ai diversi siti di restrizione; misurando la diversa lunghezza dei frammenti del DNA, si misura la distanza (in nucleotidi) del sito di restrizione dall’estremità 5’ marcata; calcolando la differenza fra le lunghezze dei frammenti a 2 a 2, si ottiene la distanza fra i siti di restrizione. L’elettroforesi consiste nello spostamento di una macromolecola in un gel sottoposto a un campo elettrico; l’entità dello spostamento dipende dalla carica, dalla grandezza e dalla struttura tridimensionale della macromolecola; per il DNA, data la distribuzione uniforme della carica e date le condizioni in cui avviene la prova, dipende dalla lunghezza della molecola. Alla fine dell’elettroforesi si identifica la posizione sul gel dei frammenti di DNA che contengono l’estremità 5’ marcata radioattivamente. L’elettroforesi consiste nel collocare le macromolecole in un pozzetto all’estremità di un gel (gelatina) che viene poi sottoposto un campo elettrico; le molecole si spostano con una velocità proporzionale alla propria carica elettrica e inversamente proporzionale lla propria lunghezza; poiché nel DNA la carica è distribuita uniformemente, la velocità dipende solo dalla lunghezza del frammento

Il DNA ricombinante VETTORI DNA da clonare vettore VETTORI Sono cromosomi capaci di replicare e selezionabili, in cui si possono inserire segmenti di DNA di interesse Digestione con endonucleasi DNA polimerasi I + ligasi I vettori possono essere : -plasmidi, -cromosomi di fagil, -ibridi fago-plasmide (cosmidi), tutti capaci di replicarsi in E. coli, -YAC, cioè cromosomi artificiali di lievito, capaci di replicarsi in lievito In ogni tipo di vettore si può inserire un frammento di DNA di una particolare lunghezza massima Il termine “ricombinante” assume in questo contesto un significato diverso da quello finora usato; non si tratta più della formazione di nuove combinazioni di alleli, diverse da quelle parentali, cui è dedicata la sezione 2 del corso; si tratta dell’inserimento di un tratto di DNA in un cromosoma; quest’ultimo viene chiamato “vettore” del gene inserito. Un plasmide, o cromosoma fagico (o anche un ibrido fra i 2..) può essere un buon vettore se: è in grado di replicare autonomamente; è selezionabile (p.es. per la resistenza a un antibiotico), in modo che i batteri che lo portano siano gli unici in grado di sopravvivere e proliferare; (eventuale) possiede un sistema di espressione inducibile (simile all’operone descritto nelle diapositive 1-5) adiacente al sito di inserimento del nuovo gene, in modo che, in presenza dell’induttore il nuovo gene inserito venga trascritto (“vettore d’espressione”). Ogni vettore può essere replicato in un proprio gruppo specifico di organismi e può portare segmenti di DNA di una data lunghezza massima. Per inserire un segmento di DNA in un vettore si taglia il DNA dell’organismo donatore del gene da esaminare e quello del vettore con lo stesso enzima di restrizione; si fanno interagire fra loro i frammenti di DNA così ottenuti, dopo avere reso adesive le estremità di rottura del DNA se queste non lo fossero già; le molecole tagliate del vettore si possono legare, mediante le estremità adesive di rottura, a frammenti del DNA dell’organismo donatore del gene, in diverse combinazioni; mediante l’uso di DNA polimerasi I (eventualmente) e ligasi, si saldano le rotture del DNA e in questo modo si possono formare diverse molecole ibride vettore-frammento di DNA del donatore; tra queste si trova la molecola ibrida vettore-sequenza di DNA da esaminare; con le procedure descritte nella diapositiva successiva è possibile a questo punto isolare e identificare quest’ultima molecola. Estremità adesive spontanee o costruite, fra loro uguali Estremità adesive complementari alle precedenti

La clonazione del DNA Individuazione dei geni clonati: Southern blotting Clonazione non selettiva P = 1-(1-f)N Clonazione selettiva Genoma da saggiare frammentato con enzimi di restrizione L’ibridazione cn la sonda radioattiva si effettua direttamente sui frammenti del genoma, identificando così il frammento da saggiare Cromosomi di l frammentati 1) Si effettua l’elettroforesi su gel dei frammenti a doppia elica ligasi Genoteca di DNA ricombinante 2) Si denatura il DNA e lo si fa aderire a singolo filamento, nelle stesse posizioni, a un filtro La clonazione del DNA consiste nella produzione di un numero molto alto di copie dello stesso segmento di DNA; anche in questo caso c’è uno slittamento di significato del termine clone; non si tratta più di una popolazione di individui geneticamente identici fra loro (cellule, organismi uni- o pluricellulari) derivati da un unico progenitore per riproduzione asessuata, bensì nell’insieme di segmenti di DNA fra loro identici (le copie del vettore che contiene il gene di interesse) isolati e moltiplicati con la tecnologia del DNA ricombinante. La tecnica consiste nella frammentazione sia del genoma da saggiare che del vettore (nell’esempio della diapositiva il fago temperato lambda), come descritto nella diapositiva precedente. A questo punto si possono seguire 2 strategie alternative: il clonaggio non selettivo: si fanno interagire tutti i frammenti del genoma da saggiare ( in verde i segmenti non interessanti, in azzurro il gene di interesse) con numerose copie del vettore frammentato; mediante ligasi si formano numerosissimi tipi diversi di DNA ricombinante (vettori in cui sono inseriti frammenti diversi); questa collezione costituisce una genoteca del genoma da studiare; si clonano i vettori ricombinanti facendoli crescere in Escheirichia coli; quando si dispone di numerose placche di lisi, ciascuna con il proprio vettore ricombinante, si raccoglie il DNA di ciascuna placca su un filtro, che consente il riconoscimento della posizione occupata nella capsula di coltura; quindi si ibridizza il DNA corrispondente a ciascuna placca con l’mRNA specifico del gene di interesse; solo il DNA che contiene il gene da studiare potrà legare l’RNA radioattivo, per la complementarità dei nucleotidi; in corrispondenza di quel DNA si riscontra quindi la presenza di radioattività mediante autoradiografia; così si può risalire al clone che contiene il gene di interesse e farlo proliferare ulteriormente; il clonaggio selettivo: si effettua un elettroforesi del genoma frammentato (chiamato Southern blotting); dopo l’elettroforesi si denatura il DNA – cioè si separano col calore i due filamenti polinucleotidici - e lo si raccoglie il DNA denaturato di ciascuna banda del gel su un filtro, che consente il riconoscimento della posizione occupata nel gel dell’elettroforesi; quindi si ibridizzano i frammenti del genoma con l’mRNA specifico del gene di interesse; solo il DNA che contiene il gene da studiare potrà legare l’RNA radioattivo, per la complementarità dei nucleotidi; in corrispondenza della banda che contiene quel DNA si riscontra quindi la presenza di radioattività mediante autoradiografia; a questo punto si può recuperare nella posizione giusta sul gel il DNA corrispondente al gene di interesse, lo si fa interagire mediante ligasi con i frammenti del vettore e si ottiene il vettore che include il gene di interesse da potere clonare. Clonazione 3) Si ibridizza con sonda radioattiva complementare al frammento cercato e si effettua l’autoradiografia, localizzando così il gene studiato Ibridazione su filtro con sonda radioattiva complementare al DNA da studiare

C-DNA, walking cromosomico e sequenziamento RNA Mediante piccole sonde, in comune a più frammenti è possibile mettere questi ultimi in sequenza AAAAA TTT DNA polimerasi Trascrittasi inversa primer IL cDNA CONSENTE DI STUDIARE GLI mRNA E CONFRONTARLI CON I GENI O I TRASCRITTI PRIMARI SEQUENZIAMENTO DEI NUCLEOTIDI 1) Si marca con 32P l’estremità 5’ del frammento da analizzare, quindi si denatura il DNA G G+A C C+T Il cDNA è il DNA complementare agli mRNA, cioè il DNA del gene che viene tradotto, quello corrispondente agli esoni; è uno strumento indispensabile per individuare i geni quando si parte da un suo prodotto; è possibile costruire genoteche di cDNA. A partire dall’mRNa, tramite una trascrittasi inversa virale, è possibile ottenere un filamento di DNA complementare all’mRNA; poi, attraverso un’ansa che contiene un’estremità 3’ libera, è possibile costruire il 2° filamento di DNA, complementare e antiparallelo al 1°, mediante l’azione di una DNA polimerasi. La tecnica del “walking cromosomico” (letteralmente: passeggiata cromosomica) consente dimettere fra loro in sequenza cloni di DNA ricombinante presi all’interno di un segmento di DNA mediante l’identificazione della sovrapposizione parziale di piccole sequenze condivise da due cloni adiacenti. Questa procedura consente di localizzare entro una regione cromosomica la posizione di un gene di interesse (“clonaggio posizionale”); attraverso questo tipo di procedure si effettua la “mappatura fisica” del gene di interesse ()vedere le diapositive successive. Il “sequenziamento” di segmenti di DNA, cioè la ricostruzione nucleotide per nucleotide dei suoi filamenti polinucleotidici, è la tecnologia che ha consentito di conoscere la sequenza di interi genomi, incluso quello umano; in questa diapositiva è illustrato uno dei primi metodi messi a punto. Si usa la tecnica di marcare con 32P l’estremità 5’ del filamento da studiare, analogamente a quanto fatto per le mappe di restrizione (diapositiva 8); quindi si usano trattamenti chimici in grado di distruggere selettivamente alcune basi (solo G, solo purine – G+A, solo C, solo pirimidine – C+T); questa distruzione indebolisce il filamento polinucleotidico di cui fanno parte le basi distrutte; questo provoca la rottura casuale del filamento in corrispondenza dei siti indeboliti; come conseguenza per ogni trattamento si ottiene una famiglia di frammenti di lunghezza diversa, in ciascuna delle quali casualmente si è verificata la rottura in uno dei siti indeboliti per la distruzione della base (per semplificare, nello schema in basso a sinistra nella diapositiva si è mostrato solo un punto di rottura per ogni base distrutta). Quindi si effettua l’elettroforesi, si raccoglie su filtro il DNA a singolo filamento in modo che vengano conservate le posizioni raggiunte dalle bande di DNA sul gel, si effettua l’autoradiografia per selezionare i filamenti marcati in 5’, si determina la lunghezza in numero di nucleotidi di ogni frammento di DNA marcato, misurando la distanza in nucleotidi fra l’estremità 5’ e il punto di rottura. Così, mettendo in ordine per lunghezza crescente, nucleotide per nucleotide, i diversi frammenti, si ottiene la sequenza esatta di nucleotidi del filamento di DNA analizzato. 2) Si distruggono selettivamente basi o loro combinazioni (G, G+A, C, C+T), che rendono più fragile il filamento saggiato, che quindi si rompe in quei punti G C 3) Si stima la lunghezza dei frammenti dallo spazio percorsoin una corsa elettroforetica A T

Reazione a catena della polimerasi (PCR) Taq polimerasi, resistente al caldo Primer 1 Regione complementare a Primer 2 Regione complementare a La reazione a catena della polimerasi, nota con l’acronimo inglese PCR, è una tecnologia che consente di sostituire la clonazione di segmenti di DNA di tipo biologico, tramite inserimento in un vettore e inserimento del vettore in una cellula, con un’amplificazione di tipo biochimico, con l’uso di enzimi in vitro. Si pongono a reagire insieme: un numero limitato di copie del segmento di DNA da amplificare; un numero molto elevato di 2 RNA primer (vedere serie 4, diapositiva 12), complementari ciascuno a una delle 2 estremità 3’ dei 2 filamenti del DNA; l’enzima Taq polimerasi, una DNA polimerasi del batterio Thermus aquaticus, che è un grado di resistere ad alte temperature senza perdere la propria funzionalità; una riserva di nucleotidi delle 4 basi per la sintesi delle nuove catene polinucleotidiche. L’amplificazione consta di numerosi cicli consecutivi; ciascun ciclo consta di: un innalzamento della temperatura che determina la denaturazione del DNA, i cui singoli filmenti si separano; un abbassamento della temperatura che consente alle molecole di RNA primer di appaiarsi ai tratti di DNA all’estremità 3’ di entrambi i filamenti; immediatamente dopo la Taq polimerasi può entrare in azione e sintetizza i nuovi filamenti di DNA, complementari ai 2 filamenti stampo; quando la Taq polimerasi arriva all’estremità 5’ del filamento stampo, sintetizza un tratto di DNA complementare al primer che si trova sull’altro filamento stampo; il primer, contrariamente a quanto avviene per la sintesi del DNA in vivo, non viene rimosso; quindi i filamenti neosintetizzati alla loro estremità 5’ restano costituiti dall’RNA primer, mentre nel resto della loro estensione, fino alla loro estremità 3’, sono costituiti di normali sequenze nucleotidiche di DNA. Alla fine del processo di amplificazione si possono avere milioni di copie a doppia elica del segmento di DNA originario, nelle quali i filamenti polinucleotidici sono costituiti all’estremità 3’ da RNA primer; il numero di copie che si può raggiungere è limitato solo dal umero di molecole di primer e di nucleotidi disponibili al’inizio. Si alternano cicli di denaturazione (a temperatura alta) e di replicazione ( a temperatura bassa), ciascuno dei quali porta un raddoppiamento del numero delle molecole

Costruire nuovi geni SINTESI DI SEQUENZE NON SU STAMPO: è possibile allungare filamenti di DNA al 5’ aggiungendo nucleotide dopo nucleotide costruendo oligonucleotidi di sequenza voluta INDUZIONE DI MUTAZIONI SPECIFICHE 3) Si modificano specifici nucleotidi sul filamento rimasto; dopo la replicazione, anche il nuovo filamento sarà mutato nello stesso sito 1) Si rompe il DNA con endonucleasi La costruzione di nuove sequenze di DNA, senza partire da sequenza stampo, è possibile a partire da brevi filamenti polinucleotidici di DNA, allungandoliall’estremità 5’ (nel verso opposto rispetto alla replicazione biologica del DNA) con l’aggiunta, uno per uno, di nuovi nucleotidi mediante complesse procedure chimiche; in questo modo è possibile costruire filamenti oligonucleotidici, o oligonucleotidi (cioè composti di pochi nucleotidi, meno di cento); inserendo gli oligonucleotidi con i metodi descritti in altri segmenti di DNA, si possono costruire nuovi geni. L’induzione di mutazioni geniche programmate, cioè la sostituzione di basi con altre basi specifiche nel sito desiderato, consente la produzione di nuovi alleli (mutagenesi mirata, sito specifica). La procedura è la seguente: si taglia il segmento di DNA di interesse, già opportunamente clonato su un vettore, con un enzima di restrizione adatto, che abbia il suo sito di restrizione vicino al sito che si vuole fare mutare; si digerisce blandamente uno dei 2 filamenti di DNA della doppia elica a partire dalle 2 estremità 3’ dei 2 capi di rottura, in modo da lasciare brevi tratti del DNA a singolo filamento all’estremità 5’; si modifica mediante trattamento chimico il nucleotide bersaglio (per esempio si rimuove un radicaleaminico - sezione 4, diapositiva – dalla citosina, in modo che la base modificata si appai con l’adenina invece che con la guanina); mediante DNA polimerasi I (che non ha bisogno di RNA primer), si ricostituiscono i filamenti polinucleotidici digeriti in precedenza; in corrispondenza del nucleotide modificato, verrà incorporato, sul nuovo filamento, un nucleotide diverso da quello che occupava la stessa posizione nel filamento digerito, complementare al nucleotide modificato; mediante ligasi si ricostituisce l’integrità del vettore, che ore ha inserito, in modo stabile, un allele mutante del gene di interesse. 2) Si digeriscono singoli filamenti in direzione 5’ con esonucleasi

Progressi nel sequenziamento Sequenziamento del DNA di singoli cromosomi 2) Colorazione con 2 fluorocromi, rispettivamente specifici per A-T e G-C, la cui emissione risultante è specifica per ciascun cromosoma 1) Raccolta di cromosomi in metafase con shock osmotico Isolamento di singoli cromosomi con citometria a flusso 3) Singoli cromosomi contenuti in microgocce sono riconosciuti da sensori laser… 4) Si effettua l’elettroforesi dei nuovi filamenti… Sequenziamento automatico del DNA 1) Si dispone di singoli filamenti di DNA con primer e DNA polimerasi 3’ primer G AGGTTAC TCCAAT T TCCAA A 2) Si forniscono miscele di nucleotidi contenenti di-desossi-nucleotidi, privi di –OH al C3’, che bloccano l’allungamento del nuovo filamento di DNA TCCA A TCC L’utilizzo della citometria a flusso per isolare singoli cromosomi ha consentito un’accelerazione nei programmi di sequenziamento dei genomi eucariotici, incluso il Progetto Genoma Umano. Con questa procedura si sono potute costruire genoteche di singoli cromosomi e si è potuto sequenziare ogni singolo cromosoma. La procedura di sequenziamento descritta nella presente diapositiva è quella che è stata utilizzata nei programmi di sequenziamento dei genomi per la grande semplicità, rapidità e affidabilità. L’uso di di-desossi-nucleotidi, che bloccano la replicazione del DNA, consente di marcare con fluorocromo l’estremità 3’ del filamento neosintetizzato nel punto in cui è avvenuta l’incorporazione del di-desossi-nucleotide e, di conseguenza, l’interruzione della nuova catena polinucleotidica, la cui lunghezza è misurata dal percorso elettroforetico. Oggi opportuni programmi informatici danno in uscita i diagrammi di sequenza, come quello illustrato nella presente diapositiva. C TC C T ddA ddG T ddT ddC 5’ 4) …ricevono una carica elettrica specifica… TCCAATG 5’ 3) Ciascun di-desossinucleotide è marcato con un fluorocromo specifico 3’ 5) …e sono deviati da un campo elettrico nella “propria” provetta 5) …e mediante spettroscopia automatica, si ottiene il profilo della sequenza

Dalla mappatura al sequenziamento del genoma Sequenziamento “clone dopo clone” Marcatori molecolari Alleli dei siti di restrizione (RFLP) 1) Mappatura di restrizione (“fingerprinting”) di una raccolta di grandi cloni da una genoteca, identificando le sovrapposizioni Sito di restrizione Trattamento con l’enzima di restrizione Allele non “tagliabile” Alleli per singole sostituzioni nucleotidiche (SNP) 2) Selezione del numero minimo di cloni sovrapposti 3) Frammentazione in sub-cloni dei grandi cloni superstiti e loro sequenziamento Alleli per numero di ripetizioni di mini- e microsatelliti (SSLP) Identificati per sequenziamento Sequenziamento “shotgun” 1) Frammentazione di genomi in genoteche di cloni di diversa grandezza I programmi di sequenziamento dei genoma umano e di quelli di altri organismi, procarioti ed eucarioti si sono sviluppati quando i progressi della localizzazione dei geni noti e che mano mano si venivano scoprendo si facevano sempre più rapidi. Le tecniche del sequenziamento del DNA e dell’ingegneria genetica avevano consentito l’utilizzazione di marcatori molecolari, come i polimorfismi dei siti di restrizione, le singole sostituzioni nucleotidiche, molto più frequenti dei primi e i polimorfismi per numero di ripetizioni dei minisatelliti e dei microsatelliti (vedere il credito 3). Mappando reciprocamente i marcatori molecolari e posizionando i geni da localizzare entro la sequenza lineare dei marcatori molecolari si ottiene una notevole precisione. La mappatura inizia con le procedure consolidate: la mappatura genetica per ricombinazione (vedere il credito 2), la mappatura citogenetica mediante la marcatura con sonde fluorescenti complementari alle regioni di interesse direttamente sui cromosomi sul vetrino da microscopio (in situ), detta tecnica FISH, che consente di localizzare la regione di interesse sul cromosoma metafasico; ma alla fine si procede alla mappa fisica, cioè a misurare la distanza fra i marcatori molecolari o fra il gene in esame e un marcatore molecolare in termini di numero di nucleotidi, mediante sequenziamento e walking cromosomico. Invece di localizzare singoli geni o marcatori i progetti di sequenziamento del genoma hanno tentato di ricostruire l’intera sequenza di diversi genomi. Le due procedure descritte dalla presente diapositiva sono state quelle usate per il Progetto Genoma Umano. Le strutture pubbliche (i NIH degli USA), hanno usato la prima, in cui si è proceduto a un’indagine su cloni di dimensioni via via decrescenti, eliminando ad ogni tappa le informazioni ridondanti attraverso la costruzione di una mappa minima e completa di sovrapposizione dei cloni; la struttura privata (Celera) invece ha proceduto a successive estrazioni casuali di cloni, indipendentemente dalla loro dimensione, affidando a calcolatori potenti e a programmi sofisticati la ricostruzione della sequenza. Mappature di marcatori molecolari fra loro/con geni Mappe genetiche (ricombinazione) 2) Sequenziamento di successivi campioni casuali di cloni di diversa grandezza e analisi automatizzata delle sequenze sovrapposte (“prova ed errore”) Mappe cromosomiche: ibridazione in situ con sonde fluorescenti (FISH) Mappe fisiche: sequenziamento del genoma

Genomica strutturale Il sequenziamento del genoma utilizza le metodiche già descritte seguendo diverse fasi 1: compilazione – consiste nella ripetizione per numerose volte dell’intero processo per riempire le lacune e correggere gli errori dovuti alla natura empirica e casuale del processo Le lacune, oltre agli errori di metodo, sono dovute a regioni difficilmente sequenziabili: DNA satellite e geni ripetuti in tandem 2: annotazione – consiste nell’identificazione di presunti geni, riconoscibili come “open reading frames” (ORF), nel caso di codificazione di polipeptidi Le ORF iniziano con codoni di inizio traduzione (sul filamento trascritto 3’TAC5’, su quello complementare 5’ATG3’) e , dopo numerose triplette, terminano con codoni di stop. In un tratto di DNA sequenziato per la ricerca di ORF sono possibilli 3 tentativi di lettura, sfalsati di un nucleotide, per ciascuno dei due filamenti complementari. 3: verifica delle ORF – consiste nella ricerca in prossimità delle ORF di altre sequenze funzionali (promotori; negli eucarioti siti di splicing, di poliadenilazione etc.). Dato il carattere empirico e probabilistico con cui si ricostruiscono le sequenze di interi genomi, specialmente i grandi genomi degli eucarioti, la compilazione, cioè la ripetizione dei processi di sequenziamento, è una tappa molto importante; con tutto questo rimangono lacune non sequenziate, per gli ostacoli frapposti dal genoma stesso (sequenze e geni ripetuti) e per i limiti metodologici. Il nucleo centrale della genomica strutturale è l’identificazione e la localizzazione dei geni putativi, mediante la ricerca delle ORF, mediante i 3 tentativi di lettura di ciascun filamento di DNA, sfalsati fra di loro di un nucleotide; quindi mediante la ricerca delle regioni funzionali connesse con la trascrizione (promotori) e, per gli eucarioti , con la maturazione dell’mRNA (siti di splicing). Il sequenziamento del genoma ha confermato la presenza di pseudo-geni, cioè di sequenze prive di regioni funzionali per la trascrizione, la maturazione e la traduzione dell’RNA ma che presentano le regioni tradotte; in molti casi si tratta di veri e propri cDNA, cioè copie per retrotrasposizione di mRNA. Oggi sono disponibili software sofisticati che minimizzano gli errori, tenendo conto di caratteristiche note del genoma (p. es. abbondanza di “isole CpG”- 5’CG3’ in prossimità di geni) Solo il 5% del genoma umano consiste nei suoi circa 26.000 geni; il 10% consiste in DNA satellite, il 50% in elementi trasponibili interspersi.

Genomica funzionale e proteomica Data l’estrema maggiore ricchezza del repertorio proteico (proteoma) di un organismo rispetto al genoma, è utile indagare il proteoma nel suo complesso. 1) Una volta identificata una ORF come possibile gene, per verificare la funzione del polipeptide codificato si ricorre a banche dati di sequenze geniche note. Si effettua un’elettroforesi bidimensionale del proteoma espresso in determinate condizioni ambientali di una popolazione cellulare. 2) Si effettua un confronto dettagliato con i geni simili trovati. Si possono ottenere 102 -104 diverse macchie. 3) Si analizzano i ”motivi” funzionali dei polipeptidi codificati, con l’ausilio di banche dati di catene polipeptidiche. Una volta isolata una proteina nel proteoma, prelevandola dal gel, la si tenta di identificare con una digestione parziale e il confronto con banche dati di catene polipeptidiche e loro frammenti. Ancora oggi per moltissime ORF dei genomi finora sequenziati non è stata definita una funzione. La genomica funzionale, una volta identificata la sequenza del gene, cerca di assegnare una possibile funzione al polipeptide da esso codificato; ricorrendo alle banche dati sempre più ricchi e ai programmi sempre più rapidi e sofisticati, si effettuano confronti con geni dello stesso organismo o di altri organismi che presentano forti omologie di sequenza, verificando la funzione dei polipeptidi codificati da questi ultimi; si determinano le strutture secondaria e terziaria del polipeptide codificato dal gene in esame, ricorrendo a un approccio bioinformatico; si confrontano gli eventuali “motivi” presenti nel polipeptide con quelli presenti nelle banche-dati dei polipeptidi, prefigurando così l’eventuale ruolo funzionale del polipeptide; questa è una procedura tipica della “genetica inversa, di cui si discuterà nelle diapositive seguenti. La proteomica utilizza lo stesso approccio globale, empirico e casuale della genomica. Bisogna tenere conto che nelle cellule e nei tessuti di cui si vuole studiare il proteoma solo una frazione piccola dei geni viene espressa e questo spiega perché, non ostante il proteoma complessivo esprimibile da un organismo presenti un repertorio molto più ampio dei geni presenti nel genoma, il numero dei polipeptidi espressi sia piuttosto contenuto. I microarray consentono una diagnosi genetica precisa e rapida per alcuni geni, scelti per funzione e per obiettivo diagnostico. Microarray a DNA Gli oligonucleotidi di ciascuna riga riguardano lo stesso gene, con l’allele normale e diverse mutazioni. Su una lastra sono collocati 104 -105 pozzetti, ciascuno con un oligonucleotide a singolo filamento di DNA. Il/i gene/i da saggiare è amplificato per PCR, coniugato con fluorocromi e collocati sul microarray. Solo sequenze complementari si legheranno ai pozzetti, rivelando eventuali mutazioni.

Genetica diretta e genetica inversa 1) Si inducono mutazioni casuali (con radiazioni, sostanze chimiche, elementi trasponibili). 1) Si isola e si sequenzia una proteina la cui funzione deve essere indagata). 2) Si effettua uno screening genetico, attrverso test specifici, per riconoscere i mutanti. 2) Si determinano le possibili sequenze di cDNA, costruendo un corredo di oligonucleotidi. 3) Si assegnano i nuovi mutanti ai propri gruppi di complementazione, identificando il gene mutato. 3) Si saggiano gli oligonucleotidi con i cloni di una ganoteca, identificando il gene putativo. 4) Si analizza il ruolo dell’eventuale nuovo gene nella rete di interazioni fra geni (epistasi, soppressione etc.). 4) Si confronta la sequenza polipeptidica codificata dal gene putativo con sequenze presenti in banche dati, cercandone i motivi funzionali. 5) Si mappa il gene, prima costruendo una mappa genetica, quindi una mappa fisica. 5) Si costriscono mutanti “knock out” (con perdita di funzione, spesso delezioni intrageniche) o con sostituzione genica, mediante mutagenesi sito-specifica e se ne studiano gli effetti fenotipici. Nella presente diapositiva sono illustrate, in modo schematico, le tappe della genetica diretta e della genetica inversa. Tuttavia è bene ricordare che la mutagenesi condotta nell’analisi genetica diretta può essere generale (cioè il repertorio dei geni mutati è dovuto al caso) oppure, con la mutagenesi sito-diretta, si può colpire un unico gene bersaglio; inoltre l’analisi mediante mutazioni può essere sostituita da un’analisi epigenetica, cioè inattivando selettivamente i geni (p. es. con l’interferenza a RNA). La differenza sostanziale fra i due approcci consiste nell’ignorare, nell’analisi genetica diretta, quale sequenza polipeptidica o quale sequenza di DNA è coinvolta nella determinazione del fenotipo mutante, all’inizio della procedura, mentre questa è il punto di partenza dell’analisi genetica inversa. 6) Si clona e si sequenzia il gene. 6) Si possono usare gli siRNA per inattivare i geni bersaglio, al posto dei mutanti knock out (silenziamento epigenetico