APPLICAZIONI BIOINFORMATICHE SU GRIGLIA COMPUTAZIONALE PER LINDIVIDUAZIONE DI EVENTI RICOMBINATIVI IN GENOMI DI CITRUS TRISTEZA VIRUS 1,2 Alessandro Lombardo,

Slides:



Advertisements
Presentazioni simili
Dipartimento di Informatica ITIS Leonardo da Vinci Carpi 2011
Advertisements

Introduzione al linguaggio R
M. Bottiglieri 1, C. Godano 1 e L. D'Auria 2 1 Dipartimento di Scienze Ambientali, Seconda Università di Napoli, Caserta. 2 Istituto Nazionale di Geofisica.
CRESCO – Kick-off meeting LA II – 23 maggio 2006 CRESCO–workshop SPIII– ENEA 06Luglio 2007 ITALIAN NATIONAL AGENCY FOR NEW TECNOLOGY,
1 Introduzione ai calcolatori Parte II Software di base.
Introduzione al linguaggio R
Il Consolidamento di Servizi Virtual Server 2005 PierGiorgio Malusardi Evangelist - IT Professional Microsoft.
Java Enterprise Edition (JEE)
1 Informatica Generale Susanna Pelagatti Ricevimento: Mercoledì ore presso Dipartimento di Informatica, Via Buonarroti,
Informatica (conoscenza) - Introduzione al corso (I. Zangara)
Bioinformatica Presentazione del Corso
Bioinformatica Prof. Mauro Fasano
Introduzione al calcolo parallelo SISTEMI INFORMATIVI AZIENDALI Pierpaolo Guerra Anno accademico 2009/2010.
23/01/01Alberto Masoni – GR1 - Roma1 I MODELLI DI CENTRI REGIONALI POSIZIONE DI ALICE ITALIA CENTRO ITALIANO: CPU 450 KSI95, DISCO 400 TB (INSIEME TIER-1.
Corsi di Laurea triennale: Economia e professione – CLEP
Corsi di Laurea triennale: Economia e professione –CLEP
ACE Acute to Chronic Estimation (attraverso lapplicazione di 3 modelli tempo-concentrazione-effetto)
CAMPIONAMENTO Estratto dal Cap. 5 di:
Consorzio COMETA - Progetto PI2S2 UNIONE EUROPEA Servizi middleware aggiuntivi URL dellindagine:
Interoperabilità tra i PON Giuseppe Andronico (INFN e Consorzio COMETA)
Comitato Tecnico sullInteroperabilità MUR, L. Merola.
Proposta di integrazione e consolidamento delle risorse presenti nellinfrastruttura Grid dellItalia Meridionale (L. Merola, )
Tecnologia dei Servizi Grid e cloud computing - Lezione Lezione ottobre 2009 Il materiale didattico usato in questo corso è stato mutuato.
Laurea Specialistica Chimica e Tecnologia Farmaceutiche Anno Accademico Università degli Studi di Firenze Facoltà di Farmacia.
1 Riunione del 29 Marzo 2007 IL PROGETTO SCoPE Prof. Giuseppe Marrucci LAvviso 1575/2004 ed i quattro progetti vincitori Lo stato dellarte del progetto.
CISI – Centro Interstrutture di Servizi Informatici e Telematici Progettazione e realizzazione di un sistema FaD dAteneo CISI – Centro Interstrutture di.
Test del Monitoraggio del Tracker usando un Tier2 M.S. Mennea, G. Zito, N. De Filippis Università & INFN di Bari Riunione Consorzio – Torino 18 Novembre.
CRESCO: Linea Attività II Coordinamento: –dr. Vittorio Rosato Focus: –Sviluppo di tecnologie e modelli computazionali per la descrizione di sistemi complessi.
Riunione CRESCO Infrastruttura HPC Cresco Analisi Preliminare.
Supercalcolo al CILEA: risorse e opportunità CAPI /11/2005 Dr. Claudio Arlandini, PhD HPC System Administrator.
Introduzione al linguaggio R
C Consiglio Nazionale delle Ricerche DNS e Posta Elettronica: evoluzione dei servizi Marina Buzzi Marina Buzzi Istituto per le Applicazioni Telematiche.
Impatto della ricerca sulla didattica Giorgio De Michelis.
Bioinformatica Per la laurea triennale in: Biologia Umana
Execution benchmarks Obiettivi Test dettagliati e ben caratterizzati Esecuzione di benchmark standard Test di applicazioni dell'esperimento ALICE 20 Novembre.
Consiglio Nazionale delle Ricerche - Istituto di Fisica Applicata “Nello Carrara”, Firenze Protezione dai campi elettromagnetici a bassa frequenza, radiofrequenza.
Corso di Informatica per Giurisprudenza Lezione 7
La Scienza nelle Scuole EEE Extreme Energy Events Seconda Conferenza dei Progetti del Centro Fermi aprile 2012 Roma.
Ministero dellIstruzione, dellUniversità e della Ricerca Servizio per lAutomazione Informatica e lInnovazione Tecnologica – Ufficio di Statistica -VII.
Torna alla prima pagina Inforscuola, 2/12/99 1 MINISTERO DELLA PUBBLICA ISTRUZIONE DIREZIONE GENERALE DELL' ISTRUZIONE SECONDARIA DI 1° GRADO Progetto:
Server Web in una rete Windows Sommario Meccanismi di accesso remoto Meccanismi di accesso remoto Introduzione ai Server Web Introduzione ai Server.
Towards Robust Indexing for Ranked Queries aa 09/10 Candeloro D. Orlando M. Pedone A. Gruppo 5.
Modelli predittivi delle agenzie di rating internazionali: il modello MEU evoluto (maximum expected utility) Mattia Ciprian*, Daria Marassi°, Valentino.
Ricerca di similarità di sequenza (FASTA e BLAST)
Ingegneria del software Modulo 2 -Il software come prodotto Unità didattica 2 -I costi del software Ernesto Damiani Università degli Studi di Milano Lezione.
La “Griglia” informatica Fabrizio Gagliardi CERN EGEE Project Director
FESR Consorzio COMETA - Progetto PI2S2 Sala Grid e applicazioni scientifiche Dr.ssa Annamaria Muoio & Dr. Andrea Nigro 16/05/2006.
Consorzio COMETA - Progetto PI2S2 UNIONE EUROPEA Restyling della rete Cluster Cometa Gianluca Passaro –
Algoritmi e Strutture dati a.a. 2013/2014 Informazioni sul corso
Esercitazioni I/O. Dischi: Esercizio 1 Si consideri un programma che legge blocchi di 2 KB da disco, esegue un’elaborazione su questi, e quindi li riscrive.
FESR Consorzio COMETA Pier Paolo CORSO Giuseppe CASTGLIA Marco CIPOLLA Industry Day Catania, 30 Giugno 2011 Commercial applications.
FESR Consorzio COMETA Giuseppe Andronico Industry Day Catania, 30 Giugno 2011 IaaS, PaaS e SaaS: cosa significano per le aziende.
Algoritmi e Strutture Dati Laurea in Informatica Calendario: 2 Marzo – 12 Giugno Aula: LuM250 Orario: Mer, Gio, Ven Numero crediti = 8 (~ 64.
Workshop sulle problematiche di calcolo e reti nell’INFN Paestum,9-12 giugno 2003 Report sull’ultimo HEPiX e proposte per le prossime edizioni Roberto.
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Allineamento di sequenze
PcClusters, ALBERT100 e Grid Roberto Alfieri Parma,
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Implementazioni di un analizzatore di protocollo Esistono quattro fondamentali tradeoff per la realizzazione di un analizzatore di protocollo:  Analisi.
Management e Certificazione della Qualità Prof. Alessandro Ruggieri A.A
Progettazione, disegno e analisi di 24 marcatori molecolari per la selezione assistita nelle specie cerealicole COLTIVAZIONI AGRICOLE E PRODUZIONE DI PRODOTTI.
La Famiglia di Prodotti Network Analyzer. L’analizzatore J6801A DNA è un probe di cattura dati ultra leggero che comprende un sistema di acquisizione.
Consorzio COMETA - Progetto PI2S2 UNIONE EUROPEA Applicazioni del Progetto PI2S2 (Parte 2 a : Bioinformaticatica, Biomedicina,
FESR Trinacria Grid Virtual Laboratory Porous Fluid Dynamics Analyzer Supporter : Salvatore Scifo Affiliation : TRIGRID Second TriGrid Checkpoint.
FESR Consorzio COMETA - Progetto PI2S2 Integrazione di Fluent su Grid Emanuele Leggio Marcello Iacono Manno - Gianluca Passaro.
Consorzio COMETA - Progetto PI2S2 UNIONE EUROPEA Applicazioni del Progetto PI2S2 (Parte 2 a : Bioinformaticatica, Biomedicina,
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
TOOLS PER L’ANALISI BIOINFORMATICA DI SEQUENZE VIRALI IN AMBIENTE GRID
ViralPack: Un pacchetto integrato di bioinformatica su Genius
TOPALi: TOOL DI ANALISI PER L’IDENTIFICAZIONE DEGLI EVENTI DI RICOMBINAZIONE IN SEQUENZE VIRALI Alessandro Lombardo Consorzio COMETA - DISTEF.
Transcript della presentazione:

APPLICAZIONI BIOINFORMATICHE SU GRIGLIA COMPUTAZIONALE PER LINDIVIDUAZIONE DI EVENTI RICOMBINATIVI IN GENOMI DI CITRUS TRISTEZA VIRUS 1,2 Alessandro Lombardo, 2 Salvatore Davino, 3 Marcello Iacono Manno e 3 Annamaria Muoio 1 Consorzio Cometa, Via S. Sofia 64, 95123, Catania. 2 Dipartimento di Scienze e Tecnologie Fitosanitarie, Università degli Studi di Catania, Via S. Sofia 100, 95123, Catania. 3 I.N.F.N. sezione di Catania, Via S. Sofia 64, 95123, Catania. INTRODUZIONE Su di una infrastruttura GRID sono stati implementati, in un singolo flusso di lavoro, tre applicazioni per lindividuazione degli eventi ricombinativi in Citrus tristeza virus (CTV) partendo dallallineamento multiplo di sequenze e la costruzione di alberi filogenetici, la generazione di network filogenetici ed infine la ricerca degli eventi di ricombinazione attraverso metodi filogenetici.. Questo lavoro usa risultati prodotti dal Progetto PI2S2 gestito dal Consorzio COMETA, un progetto co-finanziato dal Ministero dellUniversità e della Ricerca (MIUR) nellambito del Piano Operativo Nazionale Ricerca Scientifica, Sviluppo Tecnologico, Alta Formazione (PON ). Maggiori informazioni sono disponibili alle pagine e MATERIALI E METODI Sono state utilizzate le sequenze genomiche di CTV con numeri di accessione NC (T36 Florida); DQ (Mexico); AB (NUagA Japan); AF (SY568 California); DQ (T318A Spain); AY (Qaha Egypt); Y18420 (T385 Spain); AF (T30 Florida); U56902 (VT Israel) Le sequenze sono state allineate mediante ClustlW-MPI (Li, 2003) utilizzando i parametri di default. Lallineamento in output è stato utilizzato in input per SplitsTree 4.6 (Huson e Bryant, 2006), utilizzando il network split decomposition, e per TOPALi 2. Il metodo usato per lindividuazione degli eventi di ricombinazione in TOPALi 2(Milne et al., 2004) è stato il Probabilistic Divergence Misure (PDM) con step size variabili tra 10 e 50 e windows size tra 500 e 2000, il valore di bootstrapping è stato impostato su 100. Le 9 sequenze sono state clusterizzate ed i rappresentanti di ogni gruppo (4) sono stati sottoposti ad analisi. Gli alberi filogenetici sono stati realizzati in TOPALI 2 con il metodo Jukes- Cantor + uniform rate model/neighbor joining, F81 come modello e gamma per il rate variation. LETTERATURA CITATA 1)Huson D.H. e Bryant D., Molecular Biology and Evolution, 23(2): , 2) Li K.B., Bioinformatics Application Note. 19 (12): 1585– ) Milne I., Wright F., Rowe G., Marshal D.F., Husmeier D. e McGuire G., 2004.Bioinformatics 20 (11): RISULTATI E DISCUSSIONE Attraverso limplementazione di ClustalW- MPI su rete GRID i tempi di analisi si riducono da oltre 100 minuti dellanalisi eseguita su PC con processore P4 1,7 Gh a 16 minuti utilizzando un cluster di 8 CPU (fig.1). Le elevate performance sono più evidenti in tool come TOPALi dove la riduzione dei tempi è stata di un fattore 6 utilizzando un cluster di 4 processori. Il tempo medio di analisi delle 9 sequenze di CTV su PC è intorno a 50 ore. Per quanto riguarda laspetto prettamente biologico, lapproccio filogenetico basato sulla fissione (Split) è maggiormente informativo rispetto alle rappresentazioni convenzionali (fig. 2) in quanto si producono grafi (fig. 3) che tengono conto degli eventi di ricombinazione riassumendo tutti gli alberi plausibili sulla base dei dati. Lidentificazione degli eventi di ricombinazione attraverso software con metodi come la misura della divergenza probabilistica ha prodotto risultati di rapida lettura, supportati da una contemporanea analisi statistica attraverso il bootstrapping. In figura 4 sono rappresentati come picchi gli eventi ricombinativi delle quattro sequenze rappresentanti e i reali rapporti filogenetici tra le sequenze partizionate. Tre eventi (linea tratteggiata) hanno statisticamente il 99% di confidenza che siano reali. DISTRIBUZIONE GRID fig. 2 fig. 4. fig. 1 fig. 3