1 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI 6 Gruppi di Ricerca: G. Pesole C. Gissi G. Pavesi D. Horner F. Mignone M. Iacono F. Iannelli P. Plevani M. Muzi Falconi G. Bertoni G. Mauri P. Bonizzoni R. Dondi R. Rizzi G. LavorgnaE. Stupka S. Banfi UNIMI - DSBB/DiCO UNIMIB - DiSCo DIBIT-HSRTIGEM - NA
2 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI Attività di Ricerca: A1) Metodologie e piattaforme tecnologiche per la costruzione, il mantenimento e l’analisi di banche dati di interesse genomico e proteomico A2) Metodologie e piattaforme per la predizione e l’analisi di geni in genomi di vari organismi A3) Metodologie per lo sviluppo e il mantenimento di banche dati specializzate su genomi di organismi e virus patogeni per uomo, animali e piante.. A4) Sviluppo e mantenimento di una banca dati sul ciclo cellulare
3 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI A1) BANCHE DATI GENOMICHE A1.1) Banca Dati UTRdb/UTRsite (CNRBA) A1.2) Banca Dati RNA non codificanti e RNA antisenso (CBMTS) Creazione di una banca dati specializzata di RNA non codificanti e RNA antisenso (ad esclusione dei microRNA) presenti nel genoma umano, murino e di altri vertebrati. i) Identificazione di strutture secondarie significativamente conservate nei geni omologhi di diverse specie; ii) Caratterizzazione dei geni come coding o non coding mediante l’applicazione di algoritmi specifici, l’individuazione di ORF, motivi o domini proteici; iii) Analisi filogenetiche delle famiglie di geni per non-coding RNA; iv) Predizione dei potenziali target di regolazione dei geni identificati; v) Classificazione dei geni target tramite Gene Ontology o “protein domain classification”; vi) Studio della distribuzione degli RNA antisenso nel genoma rispetto a particolari famiglie geniche. Verrà � sviluppato un apposito sistema di retrieval per integrare i dati collezionati in questa banca dati con le altre banche dati genomiche disponibili.
4 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI A2) NUOVE METODOLOGIE DI ANALISI: A2.1) Identificazione e caratterizzazione funzionale di Conserved Sequence Tags (CNRBA, CASPUR) A2.2) Identificazione di motivi strutturali conservati in RNA non-codificanti (CBMTS) A2.3) Analisi di promotori (core promoters, enhancers,..) A2.4) Predizione e caratterizzazione di eventi di splicing alternativo
5 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI A3) BANCHE DATI PATOGENI A3.1) Banca Dati Trans-Genome Conserved Sequences (sequenze conservate tra ospite (uomo, animali, piante) e patigeni (virus e batteri) (CNRBA) Creazione di una nuova banca dati di tratti di sequenza conservati tra i genomi di ospiti (uomo, animali e piante) e patogeni (virus e batteri). Una collezione specializzata di “trans-genome identities” permetterebbe di valutare in silico le basi dei meccanismi di interazione ospite- patogeno attraverso il fenomeno detto RNA interference (RNAi), che passa attraverso l’appaiamento di filamenti di RNA complementari e generalmente porta al silenziamento genico per degradazione degli mRNA. L’espressione, da parte di batteri patogeni, di RNA complementari a messaggeri dell ’ospite potrebbe sfociare in un programma di modificazione della normale espressione genica dell’ospite (ad. es. il silenziamento di geni chiave) volto ad avvantaggiare il patogeno durante il processo di infezione. Nell’ambito di tale attività si intende effettuare un’indagine esaustiva di tutte le coppie di genomi ospite -patogeno disponibili nelle banche dati.
6 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI A4) BANCA DATI CICLO CELLULARE A4.1) Banca Dati proteine coinvolte nel controllo del ciclo cellulare e nella stabilità del genoma in S. cerevisiae (CNRBA) Il database che verr � à sviluppato conterr � à informazioni, disponibili in letteratura, derivanti da numerose tecnologie ed approcci sperimentali sui geni/proteine coinvolti nel ciclo cellulare e sulla loro regolazione, sulle modificazioni post- traduzionali, sulle interazioni proteina-proteina e DNA-proteina, sullo splicing, sui knock-out e dati di RNAi, sui dati di stabilit � à dei prodotti genici, su mutazioni associate a patologie, literature datamining, etc. I dati saranno integrati con l’analisi dei dati di profili di espressione, tra i quali la periodicit � à dei trascritti e dei livelli dei prodotti genici durante il ciclo cellulare, la risposta a stimoli (agenti genotossici, temperatura, stress ossidativo etc.) o la risposta a specifici inibitori (della replicazione del DNA, della proliferazione celluare, della mitosi, di classi specifiche di enzimi come le protein chinasi etc.). Saranno anche considerati i dati di ChIP on Chip che possono dare informazioni sui networks che controllano la co-espressione o la co-regolazione di classi di geni durante il ciclo cellulare, la risposta a danni al DNA etc. Si intende realizzare una banca dati, che considerando gli organismi sino ad ora sequenziati e dando rilevanza agli aspetti comparativi, organizzi le informazioni disponibili relative in particolare al controllo della progressione del ciclo cellulare, ai geni e alle reti di regolazione genica coinvolti nei check points del ciclo cellulare e a come questo � modulato dalle interazioni tra diversi aspetti del metabolismo del DNA. Data l’ampia disponibilità � di dati relativi all’analisi funzionale del genoma del lievito Saccharomyces cerevisiae, il backbone della banca dati sarà � costituito a partire da questo organismo per estenderlo in seguito anche agli altri organismi modello. Si intende includere anche alcuni modelli procarioti, quali E. coli e Deinococcus, e rappresentanti del terzo dominio degli Archea.