La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Università degli Studi “La Sapienza” ROMA

Presentazioni simili


Presentazione sul tema: "Università degli Studi “La Sapienza” ROMA"— Transcript della presentazione:

1 Università degli Studi “La Sapienza” ROMA
BIOinformatica MASTER in Applicazioni BioMediche e Farmaceutiche. Università degli Studi “La Sapienza” ROMA Anno 2002/2003 Analisi in silico per la ricerca di domini conservati di NRPSs batteriche in genomi eucariotici Direttore Master: Prof.ssa Anna Tramontano Relatore: Prof. Stefano Pascarella Pietro Buffa

2 Generalità sulle Non Ribosomal Peptide Syntetases, NRPSs
Le NRPSs provvedono ad una sintesi peptidica differente da quella svolta dai ribosomi, essi si presentano generalmente come grossi enzimi multifunzionali con un’organizzazione molecolare di tipo modulare. Il modulo più semplice è composto da tre domini indispensabili per il corretto funzionamento dell’enzima: Dominio di Adenilazione Dominio di Tiolazione Dominio di Condensazione Catalizza l’allungamento del peptide nascente. Lega l’aminoacido al gruppo prostetico di fosfopanteteina (PP), formando un aminoacil-tioestere. Catalizza l’attivazione dell’aminoacido (aminoacil-adenilato).

3 Diversi studi condotti sul dominio di Adenilazione di questa famiglia di enzimi hanno dimostrato che: La natura del substrato che sarà inserito nel peptide sintetizzato dalle NRPSs è controllata principalmente da questo dominio. La presenza di un aminoacil-adenilato è la necessaria premessa alla formazione dell’aminoacil-tioestere nel dominio di Tiolazione e quindi alla sintesi del peptide. Studi condotti su oltre 150 domini di Adenilazione provenienti da organismi diversi, hanno rivelato la presenza di importanti residui conservati coinvolti nel legame e nell’idrolisi dell’ATP. Sulla base di queste osservazioni è oggi possibile prevedere la specificità di un dominio di adenilazione a partire dalla struttura primaria con una accuratezza di circa l’86% (Stachelhaus et al, 1999). Nel 1997 Mohamed Marahiel della Philipps university of Marburg ha ottenuto la struttura cristallografica del dominio di Adenilazione della Gramicidina sintetasi di Bacillus brevis. La struttura cristallografica, l’unica fino ad oggi risolta, è stata ottenuta con i substrati complessati, rispettivamente la L-Phe e AMP ad una risoluzione di 1,9Å. In giallo il dominio maggiore, in rosso il dominio minore. AMP e Phe sono mostrati come modelli a spazio pieno.

4 SCOPO DEL LAVORO Punto di partenza di questa ricerca è stata la recente identificazione da parte di due ricercatori Giapponesi (T. Kasahara e T. Kato, Nature 2003) di una importante molecola: la Pirrolo Quinolina Quinone (PQQ), cruciale per la degradazione dell’aminoacido Lisina da parte di particolari deidrogenasi PQQ-dipendenti nel topo (acido 2-aminoadipico 6-semialdeide deidrogenasi AAS) . Queste deidrogenasi, presentano una organizzazione dei domini che è tipica degli enzimi NRPS di origine batterica: Dominio di Adenilazione legante AMP Dominio di Tiolazione legante PP Ed un Dominio legante il PQQ Scopo della ricerca è quello di verificare se proteine contenenti i domini AMP e PP compaiono anche in altri organismi (oltre che in Topo e Drosophila dove sono stati recentemente riscontrati) e se si, associati a quale altro dominio.

5 C-AMP-PP-C-PP-C-AMP-P
RISULTATI DELLA RICERCA Ricerca di nuove sequenze proteiche correlate alle NRPSs batteriche in diversi genomi eucariotici CODICE Seq. ORGANISMO DOMINI LUNGProt. In SILICO Nr:GI_ A. thaliana AMP-PP-WD40(PQQ) 1175 NO Nr:GI_ 1040 Nr:GI_ Nr:GI_ C. elegans C-AMP-PP-C-PP-C-AMP-P 2870 Trembl :q95q02 AMP-PP-PP-C-AMP-PP Nr:GI_ 707 Nr:GI_ 714 Nr:GI_ D. melanogaster AMP-PP- ? 703 Nr:GI_ 879 Nr:GI_ Nr:GI_ AMP-PP-PQQ 1012 Nr :GI_ Nr:GI_ 824 Nr:GI_ A. gambiae AMP-PP-? 881 Nr:GI_ Una preliminare ricerca sulle banche dati proteiche, ha permesso di individuare 15 proteine correlate alle NRPSs batteriche (contenenti cioè i domini fondamentali), non ancora annotate nella loro funzione in banca dati. Sono state utilizzate come sonda le proteine: AAS (Acido 2-aminoadipico 6-semialdeide deidrogenasi) di topo [Accession number, ] U26 di Drosophila [Accession number, AAF52679] EBONY di Drosophila [Accession number, CAA11962]

6 Per alcuni genomi non si sono avuti risultati positivi.
Le sequenze precedentemente elencate sono state utilizzate come sonda per ricerche di similarità sulle Banche Dati Genomiche utilizzando il modulo “tblastn” del programma BLAST implementato sia su NCBI che su ENSEMBL. R. Norvegicus (Rat) M. Musculus H. Sapiens D. Melanogaster C. Elegans C. Briggsae A.Thaliana D. Rerio (Zebrafish) A.Gambiae S. Scrofa G. Gallus B. Taurus C. Intestinalis F. Rubripes O. sativa Per alcuni genomi non si sono avuti risultati positivi. Per altri si è trovata una notevole similarità e la presenza di residui chiave veniva mantenuta. Per queste sequenze si è proceduto all’esportazione delle rispettive sequenze genomiche in formato FASTA.

7 Costruzione di geni in silico per le sequenze ritrovate in seguito alle ricerche genomiche
Le sequenze genomiche precedentemente esportate e salvate vengono utilizzate in questa seconda fase del lavoro, per cercare di ottenere, attraverso l’uso di programmi quali GenScan e genomeScan, una corretta costruzione del gene specifico per ogni sequenza ed arrivare alla fine, alla predizione della relativa sequenza proteica completa. ORGANISMO CODICE SEQUENZA SONDA LOCALIZZAZIONE GENOMICA LUNGHEZZA PROTEINA Crom.14 Contig: RNOR 1152 AA Crom. 4 Contig:AC 556 AA Danio Rerio (zebrafish) Contig: CTG 1003 AA Fugu Rubripes Scaffold: 632 1088 AA Ciona Intestinalis AABS _1 1074 AA Oryza sativa Nr:GI_ 1285 AA Nr:GI_ 1551 AA Nr:GI_ 1461 AA Rattus norvegicus Homo Sapiens

8 Realizzazione di un allineamento multiplo completo
Abbiamo utilizzato 35 sequenze DFFxxLGG(HD)S(LI) Residui fondamentali del dominio di tiolazione. La serina lega il gruppo prostetico di fosfopanteteina. Da tutte le 35 seq. È stata manualmente eliminata la regione contenente il dominio C-terminale E’ stato utilizzato il programma HMMERalign – Parte dell’allineamento multiplo di 35 sequenze proteiche appartenenti alla famiglia della NRPSs,. L’allineamento è stato formattato utilizzando il programma ESPRIT 2.1. Sono state eliminate dall’allineamento multiplo le regioni iniziali e terminali poichè non avendo corrispondenze ben definite, potevano creare un fastidioso rumore di fondo che andrebbe a disturbare la successiva fase di generazione dell’albero evolutivo

9 Realizzazione dell’albero filogenetico
Linea filetica dei Batteri Sono stati utilizzati i programmi: PROTDIST KITSCH e DRAWTREE Linea filetica dei Funghi Linea filetica dei Vegetali Linea filetica degli organismi eucariotici superiori animali Albero filogenetico.

10 DISCUSSIONE Il completamento in corso di vari progetti gnomici ha permesso di individuare numerose proteine correlate alle NRPSs batteriche in organismi eucariotici superiori non ancora annotate in banca dati. La conoscenza del sistema sintetico delle NRPSs e la comprensione più approfondita dell’evoluzione che queste proteine enzimatiche , conosciute fino a poco tempo fa soltanto a livello batterico, potrebbero avere avuto, potrebbe risultare utile per cercare di far luce su determinate vie metaboliche non ancora molto chiare in diversi organismi superiori.

11 RINGRAZIAMENTI


Scaricare ppt "Università degli Studi “La Sapienza” ROMA"

Presentazioni simili


Annunci Google