Bioinformatica Predizione della struttura secondaria dell’RNA – MFOLD

Slides:



Advertisements
Presentazioni simili
Struttura delle proteine
Advertisements

Nota per i presentatori
Premessa: si assume di aver risolto (correttamente
I numeri naturali ….. Definizione e caratteristiche
BIOMOLECOLE.
Relazione fra energia e frequenza
Proprietà periodiche Quale è il significato di periodicità?
Bioinformatica Classificazione
Bioinformatica Pictar – miRanda - TargetScan – miRiam
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Esercizio 1 Un condensatore piano di area A=40 cm2 e distanza tra i piatti d=0.1 mm, e` stato caricato collegandolo temporaneamente ad un generatore di.
Cenni di Spettroscopia NMR bidimensionale di correlazione Testi consigliati: Stradi, Chiappe (esempi dal Silverstein)
Definizione e caratteristiche
C ORSI DI RECUPERO 2012 Classi seconde Biennio Tecnico Tecnologico Docente: Luciano Canu.
La Struttura Terziaria

CAMPO ELETTRICO E POTENZIALE
Le forze conservative g P2 P1 U= energia potenziale
Rotazione di un corpo rigido attorno ad un asse fisso
Il lavoro dipende dal percorso??
Bioinformatica Corso di Laurea Specialistica in Informatica Analisi della struttura dell’RNA 27/04/2011.
Unità Didattica 2 I Linguaggi di Programmazione
Codifica binaria Rappresentazione di numeri
Rappresentazione di numeri relativi (interi con segno)
Conversione binario - ottale/esadecimale
Funzioni, struttura e caratteristiche
C). Chimica del DNA i). Forze che influenzano la stabilità della doppia elica del DNA interazioni idrofobiche - stabilizzano dentro idrofobiche e fuori.
Programmazione di Calcolatori
Corso di Laboratorio di Linguaggi (2006/07) Prof. Nicoletta Cocco
Ricerca di similarità di sequenza (FASTA e BLAST)
Tabelle Pivot Istogrammi e frequenze Diagramma box-plot
Orbitale atomico Gli orbitali si compenetrano!
An annealing mutation operator in the genetic algorithms for RNA folding Bruce A.Shapiro and Jin Chu Wu.
I nucleotidi, composti ricchi di energia svolgono diverse attività a supporto del metabolismo cellulare I polimeri dei nucleotidi, acidi nucleici, forniscono.
Rappresentazione dell’informazione nel calcolatore.
Il legame chimico Tra due atomi A e B o gruppi di atomi R e S esiste un legame chimico quando tra essi c’e’ un interazione così forte da far si che si.
Scuola Interuniversitaria Campana di Specializzazione all’Insegnamento S.I.C.S.I. III Ciclo 2° Anno A.A Ambito tecnologico- Classe A042 Informatica.
Determinazione della fase
Il modello relazionale. Modello logico dei dati basato su concetti relazione e tabella Relazione: da teoria degli insiemi Tabella: rappresentazione grafica.
Esercizi (attrito trascurabile)
Hashing. 2 argomenti Hashing Tabelle hash Funzioni hash e metodi per generarle Inserimento e risoluzione delle collisioni Eliminazione Funzioni hash per.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Onde e particelle: la luce e l’elettrone
Allineamento di sequenze
Flusso di Costo Minimo Trasformazioni Equivalenti e Trasformazioni Inverse Viene data la seguente rete di flusso, in cui i valori riportati vicino agli.
Rappresentazione dell'informazione
La variabile casuale (v.c.) è un modello matematico in grado di interpretare gli esperimenti casuali. Infatti gli eventi elementari  che compongono lo.
Conversione binario-ottale/esadecimale
Informatica e Informatica di Base
I nucleotidi, composti ricchi di energia svolgono diverse attività a supporto del metabolismo cellulare I polimeri dei nucleotidi, acidi nucleici, forniscono.
Le funzioni.
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
Metodi di minimizzazione Ricerca del minimo di dove è l’insieme delle variabili (coordinate)
CONFORMAZIONE organizzazione spaziale degli atomi in una proteina STRUTTURA NATIVA conformazione funzionale di una proteina La FUNZIONE di una proteina.
Paolo Pistarà Principi di Chimica Moderna © Istituto Italiano Edizioni Atlas 2011 Copertina 1.
Self-Organizing Map (SOM Kohonen, 1981) è una tecnica di visualizzazione dei dati multidimensionali SOM è una mappa mono- (bi-)dimensionale che rappresenta.
1. Le coordinate di un punto su un piano Le coordinate di un punto su un piano 2. La lunghezza e il punto medio di un segmento La lunghezza e il punto.
Tecniche Chirottiche per Composti Organici 6_
Esponenziali e Logaritmi
Luoghi di punti In geometria il termine
Definizione di Flusso Il flusso è la misura di quanto materiale o campo passa attraverso una superficie nel tempo. Se si parla di campo elettrico basterà.
Termodinamica di soluzioni di polimeri C’è una notevole differenza tra le soluzioni dei polimeri e quelle delle molecole piccole dovuta alla differenza.
IL LEGAME CHIMICO.
La struttura delle proteine La peculiare sequenza amminoacidica di una catena polipeptidica rappresenta la struttura primaria Lisozima.
Sebbene i polipeptidi in soluzione possano assumere facilmente, in certe condizioni, alcune forme ordinate stabili, essi possono anche interconvertirsi.
PARAGONE CON I RISULTATI SPERIMENTALI Dobbiamo correlare i parametri  ed s con variabili sperimentali. Per fare questo assumiamo che la costante di equilibrio.
Transcript della presentazione:

Bioinformatica Predizione della struttura secondaria dell’RNA – MFOLD Dr. Giuseppe Pigola – pigola@dmi.unict.it

Predizione della struttura secondaria Struttura primaria: è la sequenza di nucleotidi che compongono la molecola, rappresentata da una stringa singola nell’alfabeto {A,C,G,U}; Struttura secondaria: Il ripiegamento bidimensionale adottato in seguito alla formazione di legami idrogeno tra coppie di basi complementari. Tale ripiegamento produce vari tipi di struttura; La determinazione della struttura secondaria è un punto di partenza basilare nella determinazione della funzione delle molecole di RNA. Bioinformatica

Predizione della struttura secondaria La struttura secondaria di un RNA è considerata come una combinazione di diversi elementi strutturali, ciascuno dei quali contribuisce in modo indipendente alla energia libera della struttura complessiva. Formalmente la struttura secondaria di una molecola di RNA può essere definita come l’insieme di appaiamenti di basi, si,j, tra i nucleotidi i e j, sempre con i < j. Si possono anche osservare ulteriori appaiamenti tra regioni a singolo filamento di una struttura secondaria che possono violare quest’ultima regola, ma questi vengono definiti pseudoknots e non vengono generalmente considerati elementi di struttura secondaria. Bioinformatica

Predizione della struttura secondaria Regioni a singolo filamento; stem: coppie contigue di nucleotidi complementari; hairpin loop: è un loop alla fine di uno stem; bulge loop: interruzione di uno stem in un solo lato; internal loop: interruzione di uno stem su entrambi i lati; multi-branched loop: interruzione fra tre o più stem divergenti; Bioinformatica

Predizione della struttura secondaria Gli appaiamenti di basi sono sempre annidati nella struttura secondaria. Questo implica che se si immagina di “aprire” un grafo planare (A) si ottiene un diagramma (B) in cui gli archi non sono mai intrecciati tra di loro. Questo fa si che la struttura secondaria possa essere scritta con una notazione in parentesi (C) senza che vi sia ambiguità; A B C Bioinformatica

Predizione della struttura secondaria DOTLET può fornire informazioni su porzioni di sequenza complementari. La sequenza nucleotidica riportata lungo un asse viene confrontata con la stessa sequenza, riportata lungo l’altro asse, invertita e complementata. Nella matrice Dot-Plot regioni corrispondenti agli stem appaiono come segmenti perpendicolari alla diagonale principale. Il parametro Windows-Size in questo caso fissa in pratica la lunghezza dello stem minimo. Vantaggi: consente di mettere in evidenza contemporaneamente tutti i possibili appaiamenti all’interno di una molecola di RNA. Svantaggi: non consente di determinare una particolare struttura secondaria. Bioinformatica

Predizione della struttura secondaria Predizione: La tendenza naturale di una molecola di RNA è quello di raggiungere la sua conformazione più stabile. Possiamo plausibilmente assumere di voler: Massimizzare gli accoppiamenti (Algoritmo di Nussinov). Piuttosto semplicistico; Minimizzare l’energia (Algoritmo di Zuker); La stabilita termodinamica di una molecola di RNA ripiegata può essere misurata in termini di variazioni di energia libera tra la molecola a singolo filamento e la molecola ripiegata in una struttura secondaria. Tale variazione dipende dalla sequenza, dalla temperatura e dalla forza ionica; La variazione di energia libera globale è pari alla somma dei contributi indipendenti dei motivi elementari di struttura; Tabelle di Freier dei contributi energetici: Contribuiscono in modo stabilizzante le energie tra basi appaiate e in modo destabilizzante i loops; Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form Ciascuno dei motivi elementari di struttura secondaria contribuisce alla stabilità della struttura secondaria e quindi alla determinazione della sua energia libera. Gli stem sono elementi stabilizzati (contributo negativo dell’energia libera) mentre tutte le regioni a singolo filamento sono destabilizzanti (contributo positivo o nullo dell’energia libera). Data una sequenza di RNA, Mfold restituisce le strutture a minima energia più probabili, dato che la struttura biologicamente corretta è di solito sub-ottimale, piuttosto che quella a minima energia (Algoritmo di Zuker); Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form Possiamo copiare una sequenza in formato FASTA (e assegnarle un nome); Consideriamo la sequenza >Haemophilus_influenzae_Rd.trna49-AlaGGC (307354-307279) Ala (GGC) 76 bp Sc: 85.98 GGGGATATAGCTCAGTTGGGAGAGCGCTTGAATGGCATTCAAGAGGTCGTCGGTTCGATCCCGATTATCTCCACCA Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form Sono state predette due strutture: Sono ordinate in base alla stabilità. Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form Cliccando ad esempio sul formato JPEG viene visualizzata la struttura predetta Dettagli termodinamici Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form GGGGAUAUAGCUCAGUUGGGAGAGCGCUUGAAUGGCAUUCAAGAGGUCGUCGGUUCGAUCCCGAUUAUCUCCACCA (((((((..((((........)))).(((((((...))))))).(((((......))))).....))))))).... (-22.15) Formato Vienna Grafico circolare: Archi G-C in rosso. Archi A-U, A-T in blu. Archi G-U, G-T in verde. Altri in giallo. Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form Energy Dot Plot: Mostra gli stem che fanno parte di un fold ottimale. Uno stem è mostrato come una diagonale nera perpendicolare alla diagonale principale Interazioni distanti sono mostrate come diagonali molto vicine all’angolo in alto a destra o in basso a sinistra. Diagonali colorate indicano strutture secondarie subottimali. (Red=best, Yellow=worst) Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form DOT PLOT FOLDING: Confronta il fold di tutte le le soluzioni prodette. Gli elementi colorati corrispondono agli stem che occorrono solo in una predizione. Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form PARAMETRI: Se si dispone di alcuni dati sperimentali e si sa che delle coppie di basi specifiche si accoppiano è possibile forzare MFOLD ad utilizzare queste informazioni. Ad esempio se sappiamo che i nucleotidi 10,11,12 interagiscono rispettivamente con i nucleotidi 22,21,20 possiamo indicarlo a MFOLD come in figura (F=Force, P=Prohibit). Bioinformatica

MFOLD http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form ESERCIZIO 1: Utilizzando le tabelle di Freier calcolare l’energia libera e la possibile struttura secondaria della sequenza: 5'-AGCCAUUUUUUGGCU-3' Lanciare MFOLD sulla sequenza e verificare quale è la struttura predetta e energia libera calcolata. Bioinformatica

Predizione della struttura secondaria Altri tool per la predizione della struttura secondaria delle proteine (alfa eliche e foglietti beta): PSIPRED: http://bioinf.cs.ucl.ac.uk/psipred/ http://bioinf.cs.ucl.ac.uk/psipred/ JPRED: http://www.compbio.dundee.ac.uk/~www-jpred/index.html Bioinformatica