CdL Biotecnologie Corso di Biologia Molecolare Lezioni: Esercitazioni Giovedì ore 11-13 Paolo Arosio Esercitazioni Venerdì ore 9-11 Isabella Zanella Esame: test scritto, discussione orale
Libri Molecular cell Biology, Lodish e coll. Molecular Biology of the Cells, Alberts e coll Genes, Lewin BIOLOGIA MOLECOLARE DEL GENE, WATSON James D e coll. zanichelli ed-
Biologia Molecolare La biologia molecolare studia le funzioni biologiche a livello molecolare delle macromolecole informazionali Scopo del corso: studiare le conoscenze delle macromolecole e dei meccanismi molecolari che sono alla base della conservazione, riparazione, duplicazione e trascrizione degli acidi nucleici, della maturazione dei trascritti, degli eventi post trascrizionali nella sintesi delle proteine, e del loro targeting in sistemi procarioti ed eucarioti. Tali conoscenze potranno essere usate in applicazioni biotecnologiche.
Le molecole Carboidrati lipidi Proteine Acidi nucleici
Proteine: Legame peptidico
Ordini di struttura
Alfa elica
beta
Amino acid chemical modifications Lys: acetylation, methylation Arg: methylation Ser and Thr: phosphorylation, acylation, O-linked gkycosylation Tyr; sulfation, phosphorylation, Cys: acylation Asn: N-glycosylation
Categories of Covalent Modifications Arg: Mono- & Di-methylation His: Phosphorylation (H4) Lys: Acetylation Mono-, Di-, & Tri-methylation Ubiquitination Sumoylation Ser/Thr: Phosphorylation
DNA
Le basi Tautomeria delle basi: Ammino –immino Cheto -enolica
Le coppie di basi A:T e G:C hanno lo stesso ingombro trasversale Gli accoppiamenti causano un accoppiamento antiparallelo Stabilizzato da fattori entropici Da impilamento delle basi Da legami H (specificità) Incompatibilità A:C
Base flipping Energeticamente facile Permette l’accesso alle basi per Metilazione Rimozione di basi Verifica complementarietà
Solco maggiore e minore Il solco maggiore offre informazioni: A: accettore legame H D: donatore legame H M: metile H:idrogeno A:T ADAM, T:A MADA G:C AADH, C:G HDAA Solco minore: A:T AHA, G:C ADA
Strutture DNA La struttura B è la più comune La A è più compatta e fatta dall’RNA La Z è levogira e fatta a Zig-Zag
Conformazioni DNA Nella forma Z il DNA è levogiro. Le purine assumono conformazione anti, invece che sin È favorita da alti sali In soluzione il DNA ha 10.5 bp per giro di elica, assume conformazioni lievemente diverse in base alla sequenza, con torsioni delle basi
Denaturazione del DNA Bassi sali Alti sali
Topologia del DNA Lk = Tw + Wr Linking number Lk: numero di volte che un filamento deve essere passato attraverso l’altro per separare le due catene Twist number Tw: numero di volte che un filamento gira intorno all’altro Writhe number Wr: numero di incroci dell’asse longitudinale Lk = Tw + Wr
Un DNA rilassato è indicato da Lk0 Un DNA rilassato è indicato da Lk0. Lk effettivo è uguale al n di bp / 10.5. Per rilassare il DNA superavvolto si può fare un nick Differenza di linking: DLk = Lk-Lk0 Se esso è negativo l’avvolgimento è negativo. Come è di solito, la separazione dei due filamenti è favorita. Come nei nucleosomi
Topoisomerasi II ATP dipendente
Toposomerasi I La girasi introduce sopravvolgimenti negativi per facilitare replicazione o trascrizione
Decatenazione, districazione, snodamento del DNA
Topoisomerasi I L’intermedio ha un legame covalente. Le topoisomerasi usano una tyr che opera un attacco nucleofilo al DNA. L’intermedio ha un legame covalente. Non si ha consumo di energia
Meccanismo dellaTopoisomerasi I
Separazione di DNA La migrazione dei topoisomeri dipende dal numero di superavvolgimenti della molecola
Etidio bromuro Il DNA è un colorante per la colorazione del DNA. La sua fluorescenza aumenta quando si intercala al DNA . Causa uno srotolamento e diminuisce il Twist. Il DNA circolare superavvolto viene srotolato, e quello rilassato viene superavvolto positivamente
RNA Differenze da DNA: Ribosio Uracile Singola elica Funzioni: Intermediario: mRNA Raccordo: tRNA Regolazione: MicroRNA, siRNA Enzima: ribosomi etc.
Doppia elica RNA Strutture hairpin, loop, bulge Alcuni loop sono stabili, esempio cUUCGg
strutture RNA Pseudonodi Appaiamenti non Watson-Crick
strutture RNA RNA a doppia elica può fare solo struttura A, per l’ingombro del 2’OH Solco maggiore meno accessibile, quello minore più accessibile Può formare complesse strutture secondarie
Ribozimi La possibilità di fare strutture secondarie e la reattività del 2’OH permettono all’RNA di avere attività enzimatica, generalmente di tagliare RNA RNAsi P, processa tRNA Ribonucleoproteine: RNA splicing Ribonucleasi Hammerhead: tratti di RNA che tagliano sequenze contigue
In biologia I meccanismi fondamentali sono estremamente conservati I particolari individuali sono estremamente vari
Caratteristiche universali L’ereditarietà e depositata sempre nella stessa molecola, DNA Parte dell’informazione ereditaria è trascritta sempre nella stessa forma, RNA Le proteine sono catalizzatori e sono tradotte sempre nello stesso modo Un gene, una proteina Le piccole molecole sono simili (zuccheri, amino acidi, nucleotidi, ATP, etc) Le cellule sono racchiuse in membrane Bastano meno di 500 geni per la vita (es. Mycoplasma genitalium, 477 geni)
La maggior parte dei batteri ed archeobatteri hanno 1000-4000 geni
Nuovi geni sono generati dai vecchi Meccanismi di innovazione Mutazione nel gene Duplicazione genetica Scambio di segmenti Trasferimento orizzontale
Famiglie di geni Ortologhi: geni di due specie che derivano da un ancestrale comune e probabilmente hanno la stessa funzione Paraloghi: provengono da una duplicazione nello stesso genoma, probabilmente con funzioni diverse Omologo: termine più generico per entrambi
procarioti E. coli (4.639.221 bp, 4300 geni) è il modello dei batteri
eucarioti Cellule più grandi (10x lineare, 1000x in volume) organizzate con citoscheletro, membrane intracellulari Non hanno parete e possono fagocitare altre cellule- predatori Hanno genomi ibridi: nucleare, mitocondrio e plastidi Hanno genomi molto più grandi di quelli dei procarioti. Molti geni regolatori
DNA regolatorio negli eucarioti Occorrono meccanismi per rispondere ai segnali e sono particolarmente sviluppati nei eucarioti pluricellulari
Protisti I protisti, eucarioti unicellulari, sono estremamente diversificati
Modelli Lievito, S. cerevisiae Arabidopsis thaliana Caenorhabditis elegans Drosofila melanogaster Mouse
duplicazioni Quasi tutti i geni nei vertebrati hanno un paralog X. tropicalis X. laevis (2x DNA) Quasi tutti i geni nei vertebrati hanno un paralog
termini Genoma: la sequenza completa del materiale genetico di un organismo. Include le seqeunze dei cromosomi e del DNA degli organelli Trascriptoma: il gruppo completo degli RNA di una cellula, tessuto od organismo. Include gli mRNA, ma anche l’RNA non codificante Proteoma: il gruppo completo delle proteine espresse dal genoma. E’ più grande del numero di geni. Talvolta usato per descrivere le proteine espresse da una cellula in un determinato momento.
genomi Perché i genomi sono grandi Come sono organizzati
Quantità minima di DNA Il grafico indica che un aumento della grandezza del genoma è necessaria per la complessità dei procarioti ed eucarioti inferiori
I geni sono interrotti Negli eucarioti la maggior parte dei geni sono interrotti da introni. Spesso l’organizzazione introni-esoni è conservata
La dimensione dei geni varia grandemente
Dimensione esoni e introni La lunghezza media degli esoni non varia, quella degli introni aumenta con la filogenesi
Geni batterici Nei batteri quasi tutto il DNA codifica proteine o RNA Il genoma varia entro un ordine di grandezza ed è proporzionale al numero di geni
Geni negli eucarioti Il genoma degli eucarioti unicellulari è simile a quello dei procarioti Gli eucarioti superiori hanno più geni, ma il loro numero non correla con la dimensione del genoma
Funzionalità dei geni dei geni noti circa 20% per codifica per enzimi, 20% per regolazione dei geni, 10% per ciclo cellulare La metà per proteine di funzione ignota
Famiglie di geni Alcuni geni sono unici, altri appartengono a famiglie Il n° di geni aumenta con la complessità, ma negli eucarioti superiori il n° di famiglie rimane costante
Famiglie e genomi La proporzione di geni unici diminuisce con la grandezza del genoma, aumenta la dimensione delle famiglie
Come identificare i geni L’organizzazione di un gene è costante Ma esistono molti pseudogeni L’ordine dei geni nel cromosoma è spesso conservata: sintenia (uomo e topo)
Geni nei mammiferi Solo 1% del genoma umano consiste di regioni codificanti Gli esoni occupano 5% di ogni gene, quindi i geni occupano 25% del genoma Il genoma umano ha 30-40.000 geni 60% dei geni umani hanno splicing alternativi Il proteoma ha 50-60,000 membri
Geni nel genoma di topo Circa 30.000 geni per proteine 4000 pseudogeni 800 geni per RNA
Il gene umano medio In media un gene umano ha 9 esoni e 7 introni ed è lungo 27 kb. Gli esoni terminali sono più lunghi. Solo 5% è codificante
Distribuzione dei geni nel genoma Circa il 20% del genoma umano consiste di deserti senza geni Sequenze ripetitive Trasposoni Pseudogeni Processati Simple sequence repeats Duplicazioni di segmenti Tandem repeats
Funzioni essenziali
Quanti geni sono essenziali? Esperimenti di inattivazione di geni sono stati fatti in batteri, lieviti, C. elegans. Solo 10-20% erano essenziali
Abbondanza del RNA Abbondanza di mRNA: n° medio di molecole per cellula mRNA abbondanti: 1000-10.000 copie per cellula mRNA scarsi: >10 copie per cellula Spesso gli mRNA abbondanti sono in piccolo numero, sono specifici delle cellula (luxury) La maggior parte degli mRNA sono scarsi, ed espressi in tutte/molte cellule: housekeeping o costitutive
Organizzazione dei geni -I Nei procarioti ed eucarioti inferiori le regioni codificanti sono densamente allineate nel DNA genomico Nei vertebrati molte sequenze non codificano e non hanno funzioni regolatorie, e la maggior parte di questo DNA è composta da sequenze ripetute. Nell’uomo solo 1.5% del DNA codifica RNA funzionale Le variazione della quantità di DNA non funzionale sono responsabili della mancanza di relazione tra complessità filogenetica e quantità di DNA aploide Il DNA genomico degli eucarioti contiene tre classi principali di sequenze: geni codificanti, DNA ripetitivo e DNA spacer Circa la metà dei geni codificanti per proteine nel DNA genomico dei vertebrati sono geni solitari, gli altri sono geni duplicati
Organizzazione dei geni -II I geni duplicati codificano proteine simili, e sono spesso in cluster. Le proteine codificate da famiglie geniche hanno sequenze e proprietà simili ma distinte Nei vertebrati ed invertebrati gli rRNA sono codificati da molte copie di geni in tandem arrays. Le copie multiple dei geni per gli istoni e tRNA spesso sono in clusters, ma non in tandem arrays. Sequenze semplici di DNA (sequenze corte e ripetute in tandem arrays lunghi) sono preferenzialmente localizzati nei centromeri, telomeri ed in specifiche regioni del cromosoma La lunghezza di alcune Sequenze semplici di DNA varia negli individui e sono la base di DNA fingerprint