FESR Trinacria Grid Virtual Laboratory Porting su grid di *ROSETTA*, un metodo per la predizione di strutture proteiche Giuseppe La Rocca INFN - Catania Second TriGrid Checkpoint Meeting Catania,
Catania, Second TriGrid Checkpoint Meeting, Sommario Introduzione su ROSETTA. Esecuzione di ROSETTA su GRID. Stato dell’arte sull’integrazione di ROSETTA sul testbed GILDA. Piani futuri.
Catania, Second TriGrid Checkpoint Meeting, Informazioni generali Ogni cellula e tessuto del nostro corpo contiene proteine. – 20% del nostro peso corporeo è formato da proteine. Le proteine sono formate da Amminoacidi. – Esistono un totale di 20 amminoacidi I 20 amminoacidi possono essere paragonate alle diverse lettere dell’alfabeto che combinate tra loro creano un intero “linguaggio proteico”. Il corpo ricava gli amminoacidi dal cibo attraverso il lavoro di enzimi digestivi.
Catania, Second TriGrid Checkpoint Meeting, Introduzione su ROSETTA ROSETTA rappresenta un metodo iniziale per la predizione di strutture proteiche. Una sequenza di amminoacidi viene suddivisa, da ROSETTA, in frammenti di 3 o 9 amminoacidi. Rosetta confronta questi frammenti con i frammenti presenti all'interno del Proteine Data Bank. – Protein Data Bank = database contenente le coordinate spaziali di tutti gli atomi che compongono una proteina.
Catania, Second TriGrid Checkpoint Meeting, Prima Fase Dal confronto ROSETTA, con l’ausilio di altri programmi accessori, estrae un subset di frammenti della sequenza di interesse. – Attualmente la predizione della struttura secondaria della sequenza di interesse e la conseguente generazione del subset di frammenti viene fatta in locale. Per ciascuna sequenza, attraverso una procedura Monte Carlo, ROSETTA combina questi frammenti al fine di formare un certo numero di strutture tridimensionali della proteina di interesse.
Catania, Second TriGrid Checkpoint Meeting, Seconda Fase I file generati in questa fase vengono utilizzati da pFold per generare il modello iniziale della struttura tridimensionale della proteina. Tale modello iniziale viene poi "idealizzato", nella seconda fase di esecuzione di pFold, per generare il modello finale.
Catania, Second TriGrid Checkpoint Meeting, Problemi di licenza sul software : Risolti!! – L’eseguibile viene trasferito e cancellato dopo ogni run. Necessità di gestire richieste multiple. – Una procedura per la gestione e la sottomissione delle diverse richieste attraverso Parametric job. Questioni tecniche
Catania, Second TriGrid Checkpoint Meeting, Procedura per la generazione di librerie più ampie. Software dependencies (SAM, PSIPRED, PHD) Problemi
Catania, Second TriGrid Checkpoint Meeting, rosetta.jdl [ JobType = "Parametric"; Executable = "rosetta.sh"; Arguments = "2ptl_PARAM_.tar.gz '' _PARAM_"; StdOutput = "std_PARAM_.out"; StdError = "std_PARAM_.err"; InputSandbox ={ "rosetta.sh","2ptl_PARAM_.tar.gz"}; OutputSandbox = {"std_PARAM_.out","std_PARAM_.err", "aa2ptl000_PARAM_.pdb","2ptl_idl_PARAM_.pdb", "timing"}; Parameters = 3; ParameterStep = 1; ParameterStart = 1; Requirements = (RegExp("grid-ce.bio.dist.unige.it",other.GlueCEUniqueID) || RegExp("gildace.oact.inaf.it",other.GlueCEUniqueID)); ]
Catania, Second TriGrid Checkpoint Meeting, $ glite-job-status ************************************************************* BOOKKEEPING INFORMATION: Status info for the Job : Current Status: Done (Success) Exit code: 0 Status Reason: Job terminated successfully Destination: dagman Submitted: Thu Jun 29 12:12: CEST ************************************************************* - Nodes information: Status info for the Job : Node Name: Node_2 Current Status: Done (Success) Exit code: 0 Status Reason: Job terminated successfully Destination: gildace.oact.inaf.it:2119/jobmanager-lcgpbs-infinite Submitted: Thu Jun 29 12:12: CEST ************************************************************* Status info for the Job : Node Name: Node_1 Current Status: Done (Success) Exit code: 0 Status Reason: Job terminated successfully Destination: gildace.oact.inaf.it:2119/jobmanager-lcgpbs-infinite Submitted: Thu Jun 29 12:12: CEST *************************************************************
Catania, Second TriGrid Checkpoint Meeting, risultati (1/2) $ ll monaco01_Node_1/ total 80 -rw-r--r-- 1 monaco01 users Jun 29 12:44 2ptl_idl1.pdb -rw-r--r-- 1 monaco01 users Jun 29 12:44 aa2ptl0001.pdb -rw-r--r-- 1 monaco01 users 8606 Jun 29 12:44 std1.err -rw-r--r-- 1 monaco01 users Jun 29 12:44 std1.out -rw-r--r-- 1 monaco01 users 108 Jun 29 12:44 timing $ ll monaco01_Node_2/ total 80 -rw-r--r-- 1 monaco01 users Jun 29 12:44 2ptl_idl2.pdb -rw-r--r-- 1 monaco01 users Jun 29 12:44 aa2ptl0002.pdb -rw-r--r-- 1 monaco01 users 8606 Jun 29 12:44 std2.err -rw-r--r-- 1 monaco01 users Jun 29 12:44 std2.out -rw-r--r-- 1 monaco01 users 108 Jun 29 12:44 timing
Catania, Second TriGrid Checkpoint Meeting, $ lfc-ls -l /grid/gilda/ROSETTA -rwxrwxr-x Jun 29 12:15 2ptl_idl1.pdb -rw-rw-r Jun 29 12:15 2ptl_idl2.pdb -rwxrwxr-x Jun 29 12:15 aa2ptl0001.pdb -rw-rw-r Jun 29 12:15 aa2ptl0002.pdb -rw-rw-r Apr 24 15:12 rosetta_database.tar.gz -rw-rw-r Apr 24 18:32 rosetta_source.tar.gz Risultato “primo” job Risultato “secondo” job risultati (2/2)
Catania, Second TriGrid Checkpoint Meeting, Status del porting di ROSETTA sul portale
Catania, Second TriGrid Checkpoint Meeting, ROSETTA su GENIUS (1/2)
Catania, Second TriGrid Checkpoint Meeting, ROSETTA su GENIUS (2/2)
Catania, Second TriGrid Checkpoint Meeting, Lavori futuri Bisogno di adattare altri software aggiuntivi per girare in grid. Integrazione in GENIUS di altri servizi per sottomettere e monitorare, in one shot, molte più richieste. Per ulteriori informazioni su ROSETTA contattare : Fabio Polticelli Dipartimento di Biologia
Catania, Second TriGrid Checkpoint Meeting, Thanks for your attention!!!