Servizi web per la bioinformatica strutturale

Slides:



Advertisements
Presentazioni simili
RICERCA IN UN VETTORE.
Advertisements

RICERCA IN UN VETTORE. Metodi basati sul confronto di chiavi Si confrontano gli elementi del vettore V con lelemento (chiave K) che si vuole ricercare.
LA LAUREA MAGISTRALE IN BIOINFORMATICA Università degli studi
Predizione della Struttura Terziaria.
ITERAZIONE e RICORSIONE (eseguire uno stesso calcolo ripetutamente) ITERAZIONE: ripetere piu volte una sequenza di operazioni istruzioni: for, while, do.
Software per la Bioinformatica
Esistono 3 metodi principali di predizione:
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
Tutorial per l’utilizzo di k ScanProsite
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Progetto AMBIT: Ottimizzazione e Valutazione Sperimentale del Motore di Ricerca Semantico Basato sul Contesto Università degli studi di Modena e Reggio.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Predizione della Struttura Terziaria. Perchè predire la struttura terziaria? In cifre: – sequenze proteiche –~ 30,000 strutture, ~ 7,000.
Programmi per l’ALLINEAMENTO DELLE SEQUENZE La creazione di programmi per l’allineamento delle sequenze richiede la definizione di: *** Un criterio oggettivo.
FESR Catania, Trigrid Open Day, Trinacria Grid Virtual Laboratory PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno.
D. Talia - UNICAL 1. 1 Sistemi Operativi Domenico Talia Facoltà di Ingegneria Università della Calabria.
RICERCA DI SIMILARITA’ in DB Problema: identificare all’interno di una banca dati di sequenze quelle sequenze che sono più simili ad una sequenza di nostro.
Ne Eye - Dating App Tracking Massimo Bozza Ingegnere elettronico, security consultant, redbull addicted… mi occupo principalmente di sicurezza applicativa.
Corso per Webmaster base
Stima della qualità dei classificatori per l’ analisi dei dati biomolecolari Giorgio Valentini
SCoPE - Stato dei Lavori
Comunicazione e Community Kion service Alessandro Furlati
RNS_BOVIN ANG1_MOUSE TPA_HUMAN UROK_HUMAN
DNS Domain Name Server.
ARTIFICIAL INTELLIGENCE FOR TRADING SIGNALS
Sale Force Automation.
Summary di (quasi) tutti gli utenti non presentati…
Il Sistema Operativo Gestione dei Processi
Monitoring e loadbalancing dei servizi Grid
Primo corso per operatore ALPE NILDE hot topics
Cartesio – Back End Farine Antoine Giulietti Raffaello Libro Pietro
Comput-ER l'infrastruttura di calcolo distribuito in Emilia Romagna
Sale Force Automation.
Tabelle di frontiera ODS L0 e L1
Commissione Calcolo e Reti
Applicazioni Bioinformatiche in Ambiente Grid
Script Marco D. Santambrogio –
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docente: Prof. Stefania Bortoluzzi.
PRIN Roma1 – status Luciano Barone, Alessandro De Salvo
Health Tecnology Assessment
Sezione di Napoli GRID-PACS Commissione Calcolo Richieste 2008 Napoli.
10. Programmazione Ricorsiva Ing. Simona Colucci
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
PROGETTO ATTI.CO.
Analisi dei dati dell’Esperimento ALICE
Sicurezza dati: Backup
JetWalk: Agenda e review committee
MC-INFN.
TAVOLA ROTONDA introduzione
INDICO Parte 1 01/07/2018 Francesco Serafini.
Interfacce SRM: l'utilizzo di STORM - Overview e prospettive (ALICE)
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docente: Prof. Stefania Bortoluzzi.
Informatica per l’Ingegneria
Il nuovo sito web del CLA compie 3 mesi
Internet.
Ardis e il sistema qualità
Programmazione parallela in Matlab e Test per ENEA-GRID
Predisposizione e presentazione della domanda di nullaosta
Ricorsione 16/01/2019 package.
Corsi di Laurea in Biotecnologie
Dipartimento scienze Economiche , Aziendali e statistiche
Predisposizione e presentazione della domanda di nullaosta
Università degli studi di Modena e Reggio Emilia
UNIVERSITÀ DI MODENA E REGGIO EMILIA
Introduzione ai DBMS I Sistemi di Gestione di Basi di Dati sono strumenti software evoluti per la gestione di grandi masse di dati residenti su memoria.
A-to-Z Consente di Localizzare e Accedere a tutte le risorse della biblioteca: riviste online riviste cartacee riviste nelle banche dati in full text riviste.
Gentica e Biologia Molecolare
Protein Structure Prediction
RICERCA DI SIMILARITA’ in DB
Transcript della presentazione:

Servizi web per la bioinformatica strutturale Silvio Tosatto BioComputing Dipartimento di Biologia URL: http://protein.bio.unipd.it/

Bioinformatica strutturale Proteine Sequenza Struttura Funzione (?!) sito attivo ligando MERPEPELIRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYNCRQFSSPEDCLSSPEFLDHIRKVMLVIDAAVTNVEDLSSLEEYLASLGRKHRAVGVKLSSFSTVGESLLYMLEKCLGPAFTPATRAAWSQLYGAVVQAMSRGWDGE Modelli in silico… Sequenze note ( > 6,000,000) Strutture note ( < 50,000)

L‘esperimento CASP: Critical Assessment of Techniques for Protein Structure Prediction Blind test che si svolge ogni due anni (dal 1994) e coinvolge tutta la community. Ca. 200 gruppi partecipanti Cerca di misurare lo stato dell‘arte ed i miglioramenti in tutti i maggiori settori della predizione di strutture proteiche Stabilisce un ranking dei migliori gruppi Dal 1998 valuta i predittori automatici (web server) Il gruppo BioComputing partecipa dal 2002 Primo gruppo italiano Risultati nel top 10% su varie categorie

FOld eXtractor (FOX) (Stefano Toppo, Paolo Fontana) Back validation using PSSM vs. target and starting query Sequence space >= 20% ID Jump start + 4 iteration vs NR60 Trailing end sequences < 20% ID PSI-Blast 4 iterations vs NR60 (>=20% ID first tested) Iterative search Sequence space Hits < 10-3 PSI-Blast 1 iteration vs. Fold library Back validation using PSSM vs. target PDB hits found ? Back- validated NO YES Target sequence Found Template FOld eXtractor (FOX) (Stefano Toppo, Paolo Fontana) B I J M K A U V Z A H C D E B G S N Un metodo per il riconoscimento di fold con bassa similarità di sequenza. Sfrutta il carattere trasitivo delle ricerche in banca dati con PSI-BLAST (ca. 5 minuti su 1 CPU). La ricerca viene ripetuta fino ad esaurimento dello spazio di sequenze disponibili. Una volta identificata una struttura, questa deve essere confermata con una ricerca inversa. I tempi di calcolo richiedono l’esecuzione di decine o centinaia di ricerche con PSI-BLAST (ore di tempo macchina).

Servizi web URL: http://protein.bio.unipd.it/ Attualmente 12 servizi web Ulteriori servizi in fase di sviluppo Tempo di calcolo variabile tra secondi (p.es. FRST) e ore (p.es. FOX) Statistiche 2007 (incremento sul 2006): ca. 13,000 visite (+120%) ca. 92,000 pagine (+50%) ca. 3,500 esecuzioni servizi web locali (+50%) ca. 9,000 esecuzioni in remoto (SPRITZ, calcolo a Dublino) (+50%)

Servizi web: grid computing (Fabiano Cimarosti) I servizi web stanno passando da una gestione diretta sul web server a un modello di calcolo distribuito. web server gestisce solo I/O calcolo su un cluster di 8 biprocessori Xeon file system condiviso Sun Grid