Università degli Studi “La Sapienza” ROMA

Slides:



Advertisements
Presentazioni simili
I Catalizzatori delle reazioni biologiche
Advertisements

GENI HOX Solo in questi ultimissimi anni le indagini filogenetiche molecolari hanno avuto come oggetto i geni Hox. Questi ultimi, presenti in tutti i Metazoi,
Dal DNA alle Proteine: Traduzione del Messaggio Genetico
Catalisi enzimatica e controllo metabolico
BASI DI DATI BIOLOGICHE - 3
Come nasce la Bioinformatica? Progetti di sequenziazione del genoma Sforzi sperimentali per determinare la struttura e le funzioni di molecole biologiche.
Corso di ingegneria genetica
Il Complesso di Golgi.
Il flusso dell’informazione: l’espressione genica
TRASCRIZIONE del DNA.
Citologia della sintesi delle Proteine
Verifica della espressione dei geni predetti Al fine di verificare che i geni predetti siano effettivamente trascritti si può fare una ricerca in banca.
Introduzione agli enzimi (un po’ di storia…)
Bioinformatica Corso di Laurea Specialistica in Informatica Analisi della struttura dell’RNA 27/04/2011.
Metodi basati sulle similitudini per dedurre la funzione di un gene
SPECIFICITA’ E MECCANISMI DI REVISIONE.
L’INFORMAZIONE GENETICA Dai nucleotidi agli amminoacidi
I protidi Schemi delle lezioni protidi vanna vannucchi.
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
L’ENERGIA L’ENERGIA.
P. CODICE GENETICO E SINTESI PROTEICA
Funzioni, struttura e caratteristiche
È stimato che oggi sulla terra sono presenti
D N A LA MOLECOLA DELLA VITA.
Prof. Paolo Abis Speranzina Ferraro - 14 dicembre 2006.
Cap. 17 Regolazione dell’espressione genica negli Eucarioti. Pp
Il progetto genoma umano
INGEGNERIA PROTEICA.
STUDIO DELLA STRUTTURA E DELLA SIMMETRIA DI UN ENZIMA TRAMITE
L’energia nei sistemi viventi
CORSO DI BIOLOGIA - Programma
CORSO DI BIOLOGIA - Programma
Tutorial per l’utilizzo di k ScanProsite
CORSO DI BIOLOGIA - Programma
PROTEINE: “TRASCRIZIONE” e “TRADUZIONE”
La regolazione dell’espressione genica
La vita in codice Prof.ssa Carmela Allocca.
Ricombinazione genetica
P. CODICE GENETICO E SINTESI PROTEICA
Dip. Scienze Biomolecolari e Biotecnologie
TERMINAZIONE IN PROCARIOTI ED EUCARIOTI
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Determinazione della fase
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
Cloroplasti Tilacoidi.
IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
CORSO DI BIOLOGIA - Programma
APPLICAZIONI DI GENETICA UMANA E MOLECOLARE
Allineamento di sequenze
Batterio Escherichia coli 4300 geni
La sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine utilizzando le informazioni contenute nel DNA. Si tratta.
La trascrizione del DNA
AMMINOACIDI E PROTEINE
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Laurea Specialistica “Metodologie Chimiche Avanzate” A.A Gabriele Ricchiardi Ricercatore/Chimica Fisica Tel.:
Il progetto genoma umano e gli altri progetti genoma: importanza degli organismi-modello.
Candidata: Samia Mofti
Clonaggio per espressione e clonaggio funzionale
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
Capacità di riprodursi struttura nucleo DNA, RNA Membrana semipermeabile Parete cell organelli metabolismo Scambi energia e materia vegetale animale unicellulare.
Sintesi proteica Prof. Domenico Ripolo.
Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.
1 Divisione cellulare Divisione batterica Al centro del batterio un gruppo di proteine chiamate Fts formano un anello intorno al piano di divisione.
GENOMI DELLE PIANTE. I genomi delle piante contengono numerose classi di geni assenti o scarsamente rappresentati nei genomi animali I prodotti di questi.
PARAGONE CON I RISULTATI SPERIMENTALI Dobbiamo correlare i parametri  ed s con variabili sperimentali. Per fare questo assumiamo che la costante di equilibrio.
Transcript della presentazione:

Università degli Studi “La Sapienza” ROMA BIOinformatica MASTER in Applicazioni BioMediche e Farmaceutiche. Università degli Studi “La Sapienza” ROMA Anno 2002/2003 Analisi in silico per la ricerca di domini conservati di NRPSs batteriche in genomi eucariotici Direttore Master: Prof.ssa Anna Tramontano Relatore: Prof. Stefano Pascarella Pietro Buffa

Generalità sulle Non Ribosomal Peptide Syntetases, NRPSs Le NRPSs provvedono ad una sintesi peptidica differente da quella svolta dai ribosomi, essi si presentano generalmente come grossi enzimi multifunzionali con un’organizzazione molecolare di tipo modulare. Il modulo più semplice è composto da tre domini indispensabili per il corretto funzionamento dell’enzima: Dominio di Adenilazione Dominio di Tiolazione Dominio di Condensazione Catalizza l’allungamento del peptide nascente. Lega l’aminoacido al gruppo prostetico di fosfopanteteina (PP), formando un aminoacil-tioestere. Catalizza l’attivazione dell’aminoacido (aminoacil-adenilato).

Diversi studi condotti sul dominio di Adenilazione di questa famiglia di enzimi hanno dimostrato che: La natura del substrato che sarà inserito nel peptide sintetizzato dalle NRPSs è controllata principalmente da questo dominio. La presenza di un aminoacil-adenilato è la necessaria premessa alla formazione dell’aminoacil-tioestere nel dominio di Tiolazione e quindi alla sintesi del peptide. Studi condotti su oltre 150 domini di Adenilazione provenienti da organismi diversi, hanno rivelato la presenza di importanti residui conservati coinvolti nel legame e nell’idrolisi dell’ATP. Sulla base di queste osservazioni è oggi possibile prevedere la specificità di un dominio di adenilazione a partire dalla struttura primaria con una accuratezza di circa l’86% (Stachelhaus et al, 1999). Nel 1997 Mohamed Marahiel della Philipps university of Marburg ha ottenuto la struttura cristallografica del dominio di Adenilazione della Gramicidina sintetasi di Bacillus brevis. La struttura cristallografica, l’unica fino ad oggi risolta, è stata ottenuta con i substrati complessati, rispettivamente la L-Phe e AMP ad una risoluzione di 1,9Å. In giallo il dominio maggiore, in rosso il dominio minore. AMP e Phe sono mostrati come modelli a spazio pieno.

SCOPO DEL LAVORO Punto di partenza di questa ricerca è stata la recente identificazione da parte di due ricercatori Giapponesi (T. Kasahara e T. Kato, Nature 2003) di una importante molecola: la Pirrolo Quinolina Quinone (PQQ), cruciale per la degradazione dell’aminoacido Lisina da parte di particolari deidrogenasi PQQ-dipendenti nel topo (acido 2-aminoadipico 6-semialdeide deidrogenasi AAS) . Queste deidrogenasi, presentano una organizzazione dei domini che è tipica degli enzimi NRPS di origine batterica: Dominio di Adenilazione legante AMP Dominio di Tiolazione legante PP Ed un Dominio legante il PQQ Scopo della ricerca è quello di verificare se proteine contenenti i domini AMP e PP compaiono anche in altri organismi (oltre che in Topo e Drosophila dove sono stati recentemente riscontrati) e se si, associati a quale altro dominio.

C-AMP-PP-C-PP-C-AMP-P RISULTATI DELLA RICERCA Ricerca di nuove sequenze proteiche correlate alle NRPSs batteriche in diversi genomi eucariotici CODICE Seq. ORGANISMO DOMINI LUNGProt. In SILICO   Nr:GI_8885525 A. thaliana AMP-PP-WD40(PQQ) 1175 NO Nr:GI_22327387 1040 Nr:GI_20466612 Nr:GI_17556356 C. elegans C-AMP-PP-C-PP-C-AMP-P 2870 Trembl :q95q02 AMP-PP-PP-C-AMP-PP Nr:GI_24817561 707 Nr:GI_24817562 714 Nr:GI_20151443 D. melanogaster AMP-PP- ? 703 Nr:GI_24648676 879 Nr:GI_32867661 Nr:GI_22945960 AMP-PP-PQQ 1012 Nr :GI_3286766 Nr:GI_5777799 824 Nr:GI_21291643 A. gambiae AMP-PP-? 881 Nr:GI_31235353 Una preliminare ricerca sulle banche dati proteiche, ha permesso di individuare 15 proteine correlate alle NRPSs batteriche (contenenti cioè i domini fondamentali), non ancora annotate nella loro funzione in banca dati. Sono state utilizzate come sonda le proteine: AAS (Acido 2-aminoadipico 6-semialdeide deidrogenasi) di topo [Accession number, 30348962] U26 di Drosophila [Accession number, AAF52679] EBONY di Drosophila [Accession number, CAA11962]

Per alcuni genomi non si sono avuti risultati positivi. Le sequenze precedentemente elencate sono state utilizzate come sonda per ricerche di similarità sulle Banche Dati Genomiche utilizzando il modulo “tblastn” del programma BLAST implementato sia su NCBI che su ENSEMBL. R. Norvegicus (Rat) M. Musculus H. Sapiens D. Melanogaster C. Elegans C. Briggsae A.Thaliana D. Rerio (Zebrafish) A.Gambiae S. Scrofa G. Gallus B. Taurus C. Intestinalis F. Rubripes O. sativa Per alcuni genomi non si sono avuti risultati positivi. Per altri si è trovata una notevole similarità e la presenza di residui chiave veniva mantenuta. Per queste sequenze si è proceduto all’esportazione delle rispettive sequenze genomiche in formato FASTA.

Costruzione di geni in silico per le sequenze ritrovate in seguito alle ricerche genomiche Le sequenze genomiche precedentemente esportate e salvate vengono utilizzate in questa seconda fase del lavoro, per cercare di ottenere, attraverso l’uso di programmi quali GenScan e genomeScan, una corretta costruzione del gene specifico per ogni sequenza ed arrivare alla fine, alla predizione della relativa sequenza proteica completa. ORGANISMO CODICE SEQUENZA SONDA LOCALIZZAZIONE GENOMICA LUNGHEZZA PROTEINA   30348962 Crom.14 Contig: RNOR01037209 1152 AA Crom. 4 Contig:AC06820.5.1.147534 556 AA Danio Rerio (zebrafish) Contig: CTG11952.6 1003 AA Fugu Rubripes Scaffold: 632 1088 AA Ciona Intestinalis AABS01000029_1 1074 AA Oryza sativa 8885525 Nr:GI_19925098 1285 AA Nr:GI_19961040 1551 AA Nr:GI_19963553 1461 AA Rattus norvegicus Homo Sapiens  

Realizzazione di un allineamento multiplo completo Abbiamo utilizzato 35 sequenze DFFxxLGG(HD)S(LI) Residui fondamentali del dominio di tiolazione. La serina lega il gruppo prostetico di fosfopanteteina. Da tutte le 35 seq. È stata manualmente eliminata la regione contenente il dominio C-terminale E’ stato utilizzato il programma HMMERalign – Parte dell’allineamento multiplo di 35 sequenze proteiche appartenenti alla famiglia della NRPSs,. L’allineamento è stato formattato utilizzando il programma ESPRIT 2.1. Sono state eliminate dall’allineamento multiplo le regioni iniziali e terminali poichè non avendo corrispondenze ben definite, potevano creare un fastidioso rumore di fondo che andrebbe a disturbare la successiva fase di generazione dell’albero evolutivo

Realizzazione dell’albero filogenetico Linea filetica dei Batteri Sono stati utilizzati i programmi: PROTDIST KITSCH e DRAWTREE Linea filetica dei Funghi Linea filetica dei Vegetali Linea filetica degli organismi eucariotici superiori animali Albero filogenetico.

DISCUSSIONE Il completamento in corso di vari progetti gnomici ha permesso di individuare numerose proteine correlate alle NRPSs batteriche in organismi eucariotici superiori non ancora annotate in banca dati. La conoscenza del sistema sintetico delle NRPSs e la comprensione più approfondita dell’evoluzione che queste proteine enzimatiche , conosciute fino a poco tempo fa soltanto a livello batterico, potrebbero avere avuto, potrebbe risultare utile per cercare di far luce su determinate vie metaboliche non ancora molto chiare in diversi organismi superiori.

RINGRAZIAMENTI