Bioinformatica Corso di Laurea Specialistica in Informatica RNA non codificanti ed RNA regolatori 29/04/2011.

Slides:



Advertisements
Presentazioni simili
Geni costitutivi e non costitutivi
Advertisements

Ogni essere vivente è dotato di
MICROSCOPIA.
Sintesi proteica Prof. Domenico Ripolo.
* ** MUTAZIONI -Spontanee -errori durante il riparo
Bioinformatica Corso di Laurea specialistica in Informatica RNA: trascrizione e maturazione 21/03/2011.
Bioinformatica Pictar – miRanda - TargetScan – miRiam
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Dal DNA alle Proteine: Traduzione del Messaggio Genetico
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
SINTESI PROTEICA.
STRUTTURA DUPLICAZIONE SINTESI DELLE PROTEINE
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Il flusso dell’informazione: l’espressione genica
TRASCRIZIONE del DNA.
LICEO SCIENTIFICO STATALE “LEONARDO da VINCI” di FIRENZE
La Sintesi Proteica.
Bioinformatica Corso di Laurea Specialistica in Informatica Analisi della struttura dell’RNA 27/04/2011.
Metodi basati sulle similitudini per dedurre la funzione di un gene
Micro RNA (miRNA) Piccole molecole di RNA (20-22 nt)
RNA interference Premio NOBEL 2006 Fire e Mello.
DAL DNA ALLE PROTEINE la trascrizione genica
L’INFORMAZIONE GENETICA Dai nucleotidi agli amminoacidi
La traduzione genica.
P. CODICE GENETICO E SINTESI PROTEICA
FACOLTA’ DI MEDICINA E CHIRURGIA
D N A LA MOLECOLA DELLA VITA.
Simona Rossi Università di Ferrara.
Ivana Calarco DIFFERENZIAMENTO 29/03/2017.
Prof. Paolo Abis Speranzina Ferraro - 14 dicembre 2006.
UNITA’ DIDATTICA: L’RNA
La varietà dei genomi valore C: quantità totale di DNA contenuta in un genoma aploide Il genoma comprende geni e sequenze non codificanti. Le dimensioni.
CORSO DI BIOLOGIA - Programma
CORSO DI BIOLOGIA - Programma
Alcuni esempi di domande di esame
CORSO DI BIOLOGIA - Programma
PROTEINE: “TRASCRIZIONE” e “TRADUZIONE”
Organismi Geneticamente Modificati
Sintesi di una proteina Cos’è il patrimonio genetico
P. CODICE GENETICO E SINTESI PROTEICA
La doppia elica del DNA 25 aprile 1953:
DNA – REPLICAZIONE (1) Semiconservativa: Catene genitrici
TERMINAZIONE IN PROCARIOTI ED EUCARIOTI
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Struttura dei geni batterici
Allineamento di sequenze
Dal neolitico al Xxi secolo.
DNA: The life molecule La ricerca del materiale genetico (da Eissman a Hershey e Chase) La struttura del DNA (da Chargaff a Watson e Crick) Le funzioni.
La sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine utilizzando le informazioni contenute nel DNA. Si tratta.
I nucleotidi, composti ricchi di energia svolgono diverse attività a supporto del metabolismo cellulare I polimeri dei nucleotidi, acidi nucleici, forniscono.
La trascrizione del DNA
IL DNA E L’RNA.
STRUTTURA DUPLICAZIONE SINTESI DELLE PROTEINE
Sintesi dell’ RNA.
La Fabbrica delle Proteine
1 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI 6 Gruppi di Ricerca: G. Pesole C. Gissi G. Pavesi D. Horner F. Mignone.
Genetica ricombinante nei batteri
Trascrizione Processo mediante il quale l’informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall’enzima.
Sintesi proteica Prof. Domenico Ripolo.
Gli acidi nucleici di Angela Astarita. Gli acidi nucleici, sono molecole complesse, presenti nelle cellule di tutti gli esseri viventi. Vi sono due tipi.
Solomon, Berg, Martin Biologia Capitolo 13. Solomon, Berg, Martin – Biologia – Capitolo – Garrod ipotizza che le persone affette da alcaptonuria.
Transcript della presentazione:

Bioinformatica Corso di Laurea Specialistica in Informatica RNA non codificanti ed RNA regolatori 29/04/2011

RNA non codificanti ed RNA regolatori Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA

Piccoli RNA non codificanti Gli RNA non codificanti (ncRNA) giocano un ruolo fondamentale nei sistemi biologici complessi, pur non codificando alcuna proteina. Tra i ncRNA maggiormente caratterizzati troviamo i tRNA (RNA transfer) e gli rRNA (RNA ribosomiali). Recenti studi hanno però rivelato diverse altre classi di ncRNA, aventi funzioni catalitiche e strutturali. Questi RNA sono componenti essenziali di complessi riboproteici (RNP), all’interno dei quali svolgono il ruolo di guida e riconoscimento di sequenze nucleotidiche target attraverso il meccanismo di complementarità delle basi.

Alcuni tipi di ncRNA tRNA (RNA transfer): adattatori per la conversione del codice genetico a triplette nel codice amminoacidico delle proteine. rRNA (RNA ribosomiali): il cuore dell’apparato traduzionale all’interno del quale svolgono sia funzione strutturale che catalitica (formazione del legame peptidico). snRNA (Piccoli RNA nucleari): sono componenti critici dello spliceosoma e svolgono un ruolo importantissimo nella maturazione degli mRNA.

Alcuni tipi di ncRNA snoRNA (Piccoli RNA nucleolari): sono implicati nel processamento e nella maturazione degli RNA ribosomali e di altri tipi di RNA, aumentandone l’attività. miRNA e siRNA: sono piccoli RNA in grado di regolare l’espressione genica a livello post-trascrizionale, silenziando specifiche molecole di mRNA. piRNA: sono coinvolti nel silenziamento trascrizionale dei retrotrasposoni nelle cellule germinali.

RNA non codificanti ed RNA regolatori Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA

Regolazione genica post-trascrizionale L’espressione genica può essere regolata a livello post-trascrizionale. Non è detto che tutto l’mRNA che viene trascritto a partire da un certo gene venga utilizzato per sintetizzare la relativa proteina. Trascrizione Traduzione

RNA regolatore La regolazione post-trascrizionale dell’espressione genica avviene per mezzo di molecole di RNA regolatore. L’RNA regolatore è una molecola di RNA in grado di legarsi ad una molecola di mRNA impedendone la traduzione. L’RNA regolatore riconosce il suo bersaglio in base al principio di appaiamento complementare delle basi. Gli RNA regolatori sono solitamente piccole molecole di RNA con una certa struttura secondaria, ma con una regione a singolo filamento complementare ad una regione a singolo filamento dell’mRNA bersaglio. Nella regolazione basata su small RNA è importante anche la struttura secondaria della molecola di RNA target.

RNA regolatore e inibizione della traduzione L’appaiamento di una molecola di RNA regolatore ad una regione a singolo filamento di mRNA può provocare: L’inibizione della traduzione senza distruzione della molecola di mRNA La degradazione della molecola di mRNA In entrambi i casi si ha il “silenziamento” del gene, il cui effetto è la mancata produzione della proteina corrispondente. Perché un RNA regolatore possa legarsi ad una molecola di mRNA bersaglio: La regione di legame sul bersaglio deve essere accessibile, ovvero meno stabile (deve contenere una regione, anche piccola, a singolo filamento). Il legame con l’RNA regolatore deve essere energeticamente favorevole. Accessibile Non accessibile

RNA antisenso 5’-AGGACTACCGACTAGCATA-3’ 3’-TCCTGATGGCTGATCGTAT-5’ Un gene antisenso codifica per un RNA la cui sequenza è complementare a quella di un RNA bersaglio: Target RNA 5’-AGGACTACCGACTAGCATA-3’ 3’-TCCTGATGGCTGATCGTAT-5’ Antisense RNA A volte il gene antisenso si trova sul filamento opposto a quello del gene bersaglio, pertanto i due RNA saranno perfettamente complementari. Altre volte gli RNA antisenso vengono trascritti da altre regioni del genoma, per cui si potrebbe avere una parziale complementarità delle loro basi.

RNA non codificanti ed RNA regolatori Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA

I microRNA I microRNA (miRNA) sono piccole molecole di RNA in grado di regolare negativamente l’espressione di geni target a livello post-trascrizionale. Sono dei piccoli RNA antisenso che mostrano complementarità parziale (quasi sempre) o totale (più raramente) delle loro basi rispetto a quelle dei loro mRNA bersaglio. I miRNA sono in grado di impedire la traduzione dei loro target preservandone la stabilità o provocandone la distruzione. Un miRNA può avere più target ed uno stesso mRNA può essere target di diversi miRNA.

I microRNA (2) I miRNA sono trascritti da particolari sequenze genomiche (geni miRNA) situate di solito in regioni intergeniche o negli introni di altri geni. Molti miRNA sono altamente conservati, in specie anche molto lontane tra loro (Es. Caenorhabditis elegans e Homo sapiens). Sono presenti anche nei virus, probabilmente come meccanismo di autoregolazione e di interferenza con le cellule ospiti, ma non nei batteri.

GGCCUGUUCCCCGAGACUAUUGAUCUCGGGGAACAGGCC I geni miRNA I geni miRNA hanno sequenze tali da generare trascritti di RNA con struttura a forcina (hairpin): loop GGCCUGUUCCCCGAGACUAUUGAUCUCGGGGAACAGGCC CUA GGCCUGUUCCCCGAGA A CCGGACAAGGGGCUCU A UGA Si parla di strutture di tipo STEM-LOOP. I due bracci dello STEM possono non essere totalmente complementari:

Biogenesi dei miRNA I trascritti primari dei geni miRNA sono chiamati pri-miRNA. I pri-miRNA vengono tagliati da un enzima chiamato Drosha in molecole più piccole, a doppio filamento, chiamate pre-miRNA. I pre-miRNA vengono esportati nel citoplasma e tagliati in RNA doppio filamento più piccoli da un altro enzima chiamato Dicer. Uno dei due filamenti contiene il miRNA maturo, lungo solitamente tra i 19 e i 25 nucleotidi, che viene incorporato in un complesso proteico chiamato RISC.

miRNA I miRNA nei RISC sono in grado di legarsi a siti specifici di mRNA provocandone il silenziamento: L’appaiamento della sequenza del miRNA con il suo sito bersaglio non è perfetto, ma può contenere bulge e loop. Dalle coppie miRNA/target individuate sperimentalmente emergono alcune regolarità nelle modalità di appaiamento.

Osservazioni sulle modalità di appaiamento La regione iniziale (5’) del miRNA è chiamata seed e sembra essere la regione più importante nel silenziamento. E’ lunga solitamente tra i 7 e i 10 nucleotidi, ma esistono casi di seed più corti o più lunghi. Tale regione è solitamente appaiata in modo perfettamente complementare al suo target: Il primo nucleotide del miRNA non è determinante e può non essere appaiato.

Osservazioni sulle modalità di appaiamento La regione a valle del seed contiene solitamente un bulge o un loop: La regione 3’ del miRNA mostra solitamente una complementarità imperfetta al suo target. Le coppie G:U nella regione del seed sembrano essere sfavorevoli al silenziamento, sebbene siano ammesse, mentre sono abbastanza comuni nella regione 3’. Infine, le regioni di legame dei miRNA si trovano nella regione 3’ UTR degli mRNA bersaglio.

Funzioni dei miRNA I miRNA svolgono un ruolo centrale nel controllo di numerosi processi fisiologici: Sviluppo Differenziamento cellulare Apoptosi Aberrazioni nella loro espressione (mancanza, sotto o sovra espressione) sono correlate a diversi tipi di patologie: Cancro Malattie neurodegenerative Malattie cardiache Si tratta dunque di molecole molto importanti, il cui studio è fondamentale nella comprensione dei processi biologici, dei fenotipi patologici e, di conseguenza, nel design di terapie innovative.

Un problema bionformatico: la ricerca dei geni miRNA Ad oggi, nell’uomo, sono stati individuati più di 1400 miRNA. Sono noti miRNA in molti altri eucarioti e nei virus. La ricerca di nuovi geni miRNA è uno dei compiti principali della bioinformatica nello studio della regolazione genica post-trascrizionale. Data una sequenza genomica ci si chiede se essa contiene uno o più geni miRNA. Come nella gene prediction, è importante individuare regolarità nelle sequenze dei geni miRNA e nei dintorni, al fine di stabilire regole per la predizione. Ad oggi la regola principale è la forma di stem-loop assunta dal trascritto primario (pri-miRNA).

GGCCUGUUCCCCGAGACUAUUGAUCUCGGGGAACAGGCC Ricerca di geni miRNA I tool per la predizione di geni miRNA si basano dunque sulla ricerca di sequenze in grado di assumere la forma di stem loop qualora venissero trascritte in RNA. Ogni sequenza di questo tipo contiene quindi due sottosequenze (quasi) complementari, l’una in senso opposto all’altra (stem) separate da una regione “loop”: loop GGCCUGUUCCCCGAGACUAUUGAUCUCGGGGAACAGGCC CUA GGCCUGUUCCCCGAGA A CCGGACAAGGGGCUCU A UGA

Ricerca di geni miRNA (2) Uno dei problemi principali nella ricerca di geni miRNA è la presenza di un numero elevato di potenziali hairpins nei genomi eucariotici. Il problema quindi è l’identificazione degli hairpin corretti. Occorre quindi trovare dei buoni filtri per la riduzione dello spazio di ricerca.

Ricerca di geni miRNA: Approcci basati sulla riduzione dello spazio di ricerca Conservazione miRScan Trova potenziali hairpin in un genoma ed utilizza BLAST per trovare omologhi in un’altra specie. miRFinder Confronta sequenze intergeniche di due diversi genomi (es. Arabidopsis e Riso) e utilizza una serie di regole empiriche per selezionare gli hairpin più probabili. La conservazione tra le specie può ridurre significativamente il numero di hairpin, ma taglia fuori tutti i geni miRNA specie-specifici.

Ricerca di geni miRNA: Approcci basati sulla riduzione dello spazio di ricerca (2) Match intragenomici miMatcher Questo tool si basa sul fatto che un miRNA possiede almeno un target nel genoma. Dato un possibile target, vengono ricercati match perfetti con i possibili hairpin individuati nel genoma. Questo approccio è però praticabile solamente nelle piante, nelle quali la complementarità tra miRNA e target è totale, a differenza degli animali nei quali la complementarità è parziale.

Ricerca di geni miRNA: Approcci dedicati - Classificazione degli hairpin Molti metodi per la ricerca di geni miRNA si basano su caratteristiche termodinamiche e osservazioni empiriche. Gli hairpin vengono individuati attraverso tool per la predizione della struttura secondaria dell’RNA (Es. Mfold) e classificati in base all’energia libera. Una volta individuati gli hairpin termodinamicamente più favorevoli, vi sono due possibili approcci per la classificazione: Metodi basati su regole empiriche Metodi di machine learning

Ricerca di geni miRNA: Approcci dedicati - Metodi basati su regole empiriche Questi metodi si basano su tutte le caratteristiche osservate nei pre-miRNA noti. Esempi di regole: Non più di un nucleotide ogni 20 può essere spaiato. Almeno 16 delle basi nel miRNA maturo devono essere appaiate. Il contenuto di nucleotidi G e C (indice di maggiore stabilità) deve essere tra il 30% e il 70%.

Ricerca di geni miRNA: Approcci dedicati - Metodi di Machine Learning Nei metodi di machine learning, le regole vengono estratte e verificate automaticamente a partire da esempi (pre-miRNA validati sperimentalmente). Approcci tipici: HMM (Hidden Markov Models) SVM (Support Vector Machines) Questi metodi ricevono in input un hairpin, lo analizzano e restituiscono in output un valore 1 o 0, a seconda che l’hairpin abbia le caratteristiche di un miRNA o meno. I modelli vengono addestrati utilizzando set di hairpin già classificati.

miRBase miRBase è la banca dati ufficiale dei miRNA: http://microrna.sanger.ac.uk/sequences/ Contiene le sequenze dei miRNA maturi e degli stem-loop precursori, oltre a riferimenti bibliografici ed informazione sui target.

miRBase Cliccando su Browse si può sfogliare l’intero database organizzato per specie:

miRBase Per ogni miRNA sono riportati: Lo stem-loop… …ed il miRNA maturo

Un problema bioinformatico: la ricerca di target per i miRNA Sebbene si conoscano più di 1400 miRNA nell’uomo (e molti altri in altre specie), solo per il 10% di essi è stato individuato almeno un target. Problema: Dato un miRNA, determinare i suoi possibili mRNA target Esistono numerosi tool su web che offrono servizi di predizione di target per miRNA: TargetScan PicTar miRanda … Molti di essi offrono dei database di predizioni già effettuate da consultare.

Un tool di predizione di target: miRanda miRanda è il tool per la predizione di target per miRNA sviluppato al Memorial Sloan-Kettering Cancer Center (New York). La prima versione (1993) è stata utilizzata per determinare target per miRNA in Drosophila melanogaster. I concetti base dell’algoritmo di miRanda sono: Appaiamento delle sequenze miRNA/Target Valutazione termodinamica dei duplex predetti Analisi della conservazione dei siti di legame Così come le sequenze dei miRNA, anche i loro siti di legame sui target sono spesso conservati: questo tipo di informazione è alla base del filtro di miRanda.

L’algoritmo di miRanda (a) (b) Si considerano le sequenze dei miRNA e dei 3’ UTR dei trascritti di Drosophila. (c1) miRNA e UTR vengono allineati per complementarità. Appaiamenti ammessi: - A:U - G:C - G:U Requisito fondamentale di un buon appaiamento: - Alta complementarità nella regione del seed. (c2) Viene valutata la struttura secondaria (predetta) dei duplex ottenuti: minore è l’energia libera, più stabile è il legame. (d) Viene effettuata l’analisi di conservazione, confrontando i siti di legame dei trascritti con gli UTR degli ortologhi in Drosophila pseudoobscura e Anopheles Gambiae (mediante allineamento). I target con siti conservati vengono ordinati per energia e memorizzati nel database.

MicroRNA.org Il web-server di miRanda si trova all’indirizzo: http://www.microrna.org Qui è possibile accedere alle predizioni effettuate per uomo, topo e ratto.

miRanda E’ possibile effettuare la ricerca per miRNA (Es. miR-15a): E’ possibile effettuare la ricerca per target (Es. Bcl-2):

miRanda – Ricerca per miRNA Cerchiamo i target predetti per il miRNA miR-15a in Homo sapiens: Cliccando su “view targets” si ottiene l’elenco dei target, con i dettagli degli appaiamenti:

miRanda – Ricerca per target Cerchiamo i miRNA per i quali il gene Bcl-2 è un target predetto:

RNA non codificanti ed RNA regolatori Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA

I siRNA I siRNA sono piccole molecole di RNA simili ai miRNA. Non sono codificati da sequenze genomiche ma derivano da altre molecole di RNA più grandi, spesso di origine esogena (es. virus). Come i miRNA vengono tagliati dal Dicer ed incorporati nel RISC. Si appaiano con complementarità totale a siti specifici sui loro target (in CDS o UTR) provocandone la degradazione.

siRNA ed RNA Interference I siRNA sono le principali molecole utilizzate nell’RNA Interference (RNAi) artificiale. I siRNA vengono disegnati ad hoc sulla base del sito di legame scelto sul trascritto da silenziare ed hanno generalmente complementarità totale al loro target. Le molecole di siRNA vengono solitamente introdotte nelle cellule mediante vettori virali, virus ingegnerizzati che trasportano l’informazione per la codifica dei siRNA nel loro genoma. Un uso tipico dell’RNAi è il knock-out artificiale dei geni, ovvero il silenziamento dell’espressione di uno più geni per studiarne gli effetti e le conseguenze e di conseguenza le funzioni svolte.

Craig Mello ed Andrew Fire RNA interference Premio Nobel 2006 per la Medicina Craig Mello ed Andrew Fire