Servizi web per la bioinformatica strutturale Silvio Tosatto BioComputing Dipartimento di Biologia URL: http://protein.bio.unipd.it/
Bioinformatica strutturale Proteine Sequenza Struttura Funzione (?!) sito attivo ligando MERPEPELIRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYNCRQFSSPEDCLSSPEFLDHIRKVMLVIDAAVTNVEDLSSLEEYLASLGRKHRAVGVKLSSFSTVGESLLYMLEKCLGPAFTPATRAAWSQLYGAVVQAMSRGWDGE Modelli in silico… Sequenze note ( > 6,000,000) Strutture note ( < 50,000)
L‘esperimento CASP: Critical Assessment of Techniques for Protein Structure Prediction Blind test che si svolge ogni due anni (dal 1994) e coinvolge tutta la community. Ca. 200 gruppi partecipanti Cerca di misurare lo stato dell‘arte ed i miglioramenti in tutti i maggiori settori della predizione di strutture proteiche Stabilisce un ranking dei migliori gruppi Dal 1998 valuta i predittori automatici (web server) Il gruppo BioComputing partecipa dal 2002 Primo gruppo italiano Risultati nel top 10% su varie categorie
FOld eXtractor (FOX) (Stefano Toppo, Paolo Fontana) Back validation using PSSM vs. target and starting query Sequence space >= 20% ID Jump start + 4 iteration vs NR60 Trailing end sequences < 20% ID PSI-Blast 4 iterations vs NR60 (>=20% ID first tested) Iterative search Sequence space Hits < 10-3 PSI-Blast 1 iteration vs. Fold library Back validation using PSSM vs. target PDB hits found ? Back- validated NO YES Target sequence Found Template FOld eXtractor (FOX) (Stefano Toppo, Paolo Fontana) B I J M K A U V Z A H C D E B G S N Un metodo per il riconoscimento di fold con bassa similarità di sequenza. Sfrutta il carattere trasitivo delle ricerche in banca dati con PSI-BLAST (ca. 5 minuti su 1 CPU). La ricerca viene ripetuta fino ad esaurimento dello spazio di sequenze disponibili. Una volta identificata una struttura, questa deve essere confermata con una ricerca inversa. I tempi di calcolo richiedono l’esecuzione di decine o centinaia di ricerche con PSI-BLAST (ore di tempo macchina).
Servizi web URL: http://protein.bio.unipd.it/ Attualmente 12 servizi web Ulteriori servizi in fase di sviluppo Tempo di calcolo variabile tra secondi (p.es. FRST) e ore (p.es. FOX) Statistiche 2007 (incremento sul 2006): ca. 13,000 visite (+120%) ca. 92,000 pagine (+50%) ca. 3,500 esecuzioni servizi web locali (+50%) ca. 9,000 esecuzioni in remoto (SPRITZ, calcolo a Dublino) (+50%)
Servizi web: grid computing (Fabiano Cimarosti) I servizi web stanno passando da una gestione diretta sul web server a un modello di calcolo distribuito. web server gestisce solo I/O calcolo su un cluster di 8 biprocessori Xeon file system condiviso Sun Grid