BIOINFO3 - Lezione 371. 2 3 4 PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo.

Slides:



Advertisements
Presentazioni simili
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità F1 Primi programmi.
Advertisements

INFORMATICA Altre Istruzioni di I/O
ESERCITAZIONE R 12,19 marzo 2012 Mario Mastrangelo
Introduzione alla programmazione A. Ferrari. Il linguaggio C Nel 1972 Dennis Ritchie nei Bell Laboratories progettò il linguaggio C Il linguaggio possiede.
PHP.
ITIS LATTANZIO Unità Didattica Materia Informatica Funzioni in C++
Tabelle LALR Costruzione delle tabelle LALR Metodo LALR Introduciamo lultimo metodo di costruzione di tabelle per il parsing LR Nome: lookahead-LR abbreviato.
MATLAB.
MATLAB. Scopo della lezione Programmare in Matlab Funzioni Cicli Operatori relazionali Esercizi vari.
Dipartimento di Matematica
Shell Scripting. Shell e comandi La shell e' un programma che interpreta i comandi dell'utente. I comandi possono essere dati da terminale, oppure contenuti.
1 Stampa dei dati - 1 I dati visualizzati, provenienti sia da tabelle che da query, possono essere stampati selezionando lopzione Stampa dalla voce di.
Programmazione Procedurale in Linguaggio C++
Il Software: Obiettivi Programmare direttamente la macchina hardware è molto difficile: lutente dovrebbe conoscere lorganizzazione fisica del computer.
Argomenti dalla linea dei comandi Gli argomenti possono essere passati a qualsiasi funzione di un programma, compresa la main(), direttamente dalla linea.
Prof.ssa Chiara Petrioli -- Fondamenti di programmazione, a.a. 2009/2010 Corso di Fondamenti di programmazione a.a. 2009/2010 Prof.ssa Chiara Petrioli.
1 Corso di Informatica (Programmazione) Lezione 11 (19 novembre 2008) Programmazione in Java: controllo del flusso (iterazione)
MATLAB. …oggi… Programmare in Matlab Programmare in Matlab m-file m-file script script Funzioni Funzioni Cicli Cicli Operatori relazionali Operatori relazionali.
MATLAB. …oggi… Programmare in Matlab Programmare in Matlab Funzioni Funzioni Cicli Cicli Operatori relazionali Operatori relazionali Esercizi vari Esercizi.
Uso dei cicli y t =c+ty t-1 +e Un uso dei cicli può essere quello di creare una serie storica per cui y t =c+ty t-1 +e dove poniamo c e t scalari ed e~N(0,1).
CORSO DI INFORMATICA LAUREA TRIENNALE-COMUNICAZIONE & DAMS
Lezione 2 Programmare in ASP
Corso di PHP.
DBMS ( Database Management System)
Gestione documenti La funzione principale di MOSAICO è il trattamento documenti. Grazie ad una corretta configurazione dellanagrafica documenti e causali,
Programmazione in Java Claudia Raibulet
ITIS LATTANZIO Unità Didattica Materia Informatica Funzioni in C++
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
BIOINFO3 - Lezione 24 ARRAY
Prof.ssa Chiara Petrioli -- Fondamenti di programmazione, a.a. 2009/2010 Corso di Fondamenti di programmazione a.a. 2009/2010 Prof.ssa Chiara Petrioli.
BIOINFO3 - Lezione 311 PAGINA HTML Confrontiamo il codice sorgente della pagina restituitaci dal programma con il programma originale Come si può notare,
BIOINFO3 - Lezione 261 ESERCIZIO Esercizio. Leggere delle sequenze di DNA (una per riga, a partire da inizio riga) e stampare solo le sequenze lunghe più
BIOINFO3 - Lezione 381 ESERCIZIO Dato un programma con la sola istruzione: $a=Hasta la vista! Quanto vale length($a) ?15 substr($a,0) ? substr($a,$b) ?
BIOINFO3 - Lezione 221 Listruzione IF-ELSE prevede un secondo blocco di istruzioni da eseguire in alternativa al primo nel caso la condizione sia falsa.
IL MASSIMO DI UN ARRAY ESERCIZIO
PARSERIZZAZIONE DI FILE
BIOINFO3 - Lezione 341 INTERAZIONE CON UN SERVER MYSQL Quando abbiamo parlato dei database relazionali SQL vi avevo già accennato che linterazione (invio.
BIOINFO3 - Lezione 361 RICERCA DI SIMILARITA TRA SEQUENZE Un altro problema comunissimo in bioinformatica è quello della ricerca di similarità tra sequenze.
BIOINFO3 - Lezione 321 ACCESSO REMOTO AL SERVER SIBILLA Attraverso Internet è possibile accedere al server sibilla.cribi.unipd.it. Potrete così effettuare.
BIOINFO3 - Lezione 201 Come in ogni corso di introduzione ad un linguaggio di programmazione, proviamo a scrivere lormai celebre primo programma di prova.
BIOINFO3 - Lezione 51 INSERIMENTO DEI DATI Visto come si creano le tabelle (sinora tristemente vuote), cominciamo ad occuparci di come riempirle con dei.
BIOINFO3 - Lezione 111 CGI-BIN CGI-BIN sono chiamati i programmi la cui esecuzione può essere richiesta attraverso il WEB. Il server web (httpd) della.
BIOINFO3 - Lezione 211 INPUT La lettura di un input dallo standard input (tastiera) si effettua utilizzando lespressione. Quando il programma incontra.
BIOINFO3 - Lezione 17 VARIABILI
BIOINFO3 - Lezione 331 SUBROUTINE IN PERL Una subroutine (funzione, metodo, procedura o sottoprogramma), e` una prozione di codice all`interno di un programma.
BIOINFO3 - Lezione 19 RICAPITOLANDO…
BIOINFO3 - Lezione 41 ALTRO ESEMPIO ANCORA Progettare il comando di creazione di una tabella di pubblicazioni scientifiche. Come chiave usare un numero.
BIOINFO3 - Lezione 291 PATTERN MATCHING Imparato cosa sono e come si usano le espressioni regolari per individuare dei pattern, vediamo come si usano in.
BIOINFO3 - Lezione 301 CGI-BIN Abbiamo visto che CGI-BIN sono chiamati i programmi la cui esecuzione può essere richiesta attraverso il WEB. In particolare.
BIOINFO3 - Lezione 271 PATH DEL FILE Bisogna fare molta attenzione al path del file da aprire. Per non sbagliare converrebbe passare sempre il path assoluto.
REDIREZIONE INPUT E OUTPUT
BIOINFO3 - Lezione 251 ARRAY ASSOCIATIVI E possibile assegnare tutti gli elementi dellarray con ununica istruzione %anni=(Marco,30,Luigi,33,Anna,28,Chiara,25);
Fopndamenti di programmazione. 2 La classe String Una stringa è una sequenza di caratteri La classe String è utilizzata per memorizzare caratteri La classe.
Corso JAVA Lezione n° 11 Istituto Statale di Istruzione Superiore “F. Enriques”
ISTITUTO STATALE DI ISTRUZIONE SUPERIORE F. ENRIQUES CORSO JAVA – PROVA INTERMEDIA DEL 12 MARZO 2007 NOME: COGNOME: ________________________________________________________________________________.
File e Funzioni Si possono distinguere tre tipi di file che vengono utilizzati in MATLAB: M-file: hanno estensione .m e in essi vengono memorizzati i.
JAVA Per iniziare. Verificare installazione javac –version java –version Cercare i files e sistemare eventualmente il path.
Lezione 3 Struttura lessicale del linguaggio
Rappresentazione degli algoritmi
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Programmazione Web PHP e MySQL 1. 2Programmazione Web - PHP e MySQL Esempio: un blog.
Ancora sulla shell. Shell e comandi La shell e' un programma che interpreta i comandi dell'utente. I comandi possono essere dati da terminale, oppure.
Data Base ACCESS EM 09.
Allineamento di sequenze
Informatica Generale Marzia Buscemi
Fondamenti di informatica T-A Esercitazione 2 : Linguaggio Java, basi e controllo del flusso AA 2012/2013 Tutor : Domenico Di Carlo.
Corso integrato di Matematica, Informatica e Statistica Informatica di base Linea 1 Daniela Besozzi Dipartimento di Informatica e Comunicazione Università.
Suggerimenti [1d5] SE la prima lettera della matrice (in alto a sinistra, matrice[0,0]) è diversa dalla prima lettera della parola (parola[0]) ALLORA siamo.
Access Breve introduzione. Componenti E’ possibile utilizzare Access per gestire tutte le informazioni in un unico file. In un file di database di Access.
Planet HT – Genova - Elisa Delvai
Transcript della presentazione:

BIOINFO3 - Lezione 371

2

3

4 PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo ad analizzare automaticamente i risultati prodotti. Supponiamo quindi in qualche modo di avere a disposizione in una stringa il report prodotto dallesecuzione di BLAST. La stringa potrebbe essere stata catturata con il comando qx di esecuzione del blast $report=qx{blastall ……}; Oppure se loutput del blastall è stato rediretto su un file (ovviamente anche in un programma eseguito precedentemente), il file potrebbe essere letto ed il suo contenuto assegnato alla stringa qx{blastall …… > file-report}; #anche in un altro programma ………… open (I,file-report); while ($riga= ){ $report.=$riga; }

BIOINFO3 - Lezione 375 REPORT DI BLAST Proviamo a vedere come è strutturato dal punto di vista sintattico il report prodotto da BLAST. Bisogna innanzitutto distinguere due casi: 1- Il programma non ha trovato similarità locali significative tra query e database Sequenza query Versione e riferimenti Database Pattern da ricercare

BIOINFO3 - Lezione 376 REPORT DI BLAST 2- Sono state trovate delle sequenze del database con similarità locali alla query Sequenza query Versione e riferimenti Database Pattern da ricercare Sequenze con E-value (probabilità di allineamento dovuto al caso) minore della soglia predefinita Per ciascun allineamento individuato: dettaglio e parametri

BIOINFO3 - Lezione 377 ESERCIZIO Provate voi a scrivere il programma che legga il file di risultati di BLAST passato come argomento, cerca il pattern Sequences producing... e per gli allineamenti trovati stampi i valori di: GI Length Score E-Value Identities %Identities Gaps (se ci sono) %Gaps (se ci sono)

BIOINFO3 - Lezione 378 Ecco un programma che individua (se ce ne sono) le sequenze (e i parametri dellallineamento) del database che danno allineamenti significativi con la query

BIOINFO3 - Lezione 379 Larray contiene 4 elementi ma il primo verrà scartato Dopo lo shift larray contiene i 3 allineamenti

BIOINFO3 - Lezione 3710 La stessa sequenza ha 2 allineamenti con la query! Però, per semplicità, in questo programma consideriamo solo il primo. Stampiamo $s, ovvero tutti i parametri dellallineamento di una delle sequenze trovate

BIOINFO3 - Lezione 3711 Siamo nel primo ciclo

BIOINFO3 - Lezione 3712 FINE ESECUZIONE Facciamo continuare (c) il programma fino alla fine e osserviamo come siano stampati i parametri anche per le altre due sequenze che hanno trovato allineamento In questo programma di esempio non facciamo nulla di particolare con i dati acquisiti, se non stamparli, però potremo ad esempio selezionare le sequenze in base alle-value o in base alla percentuale di similarità.

BIOINFO3 - Lezione 3713 ESTRAZIONE DELLE SEQUENZE Una volta individuato il codice delle sequenze con similarità alla sequenza query, potrebbe interessarci, per successive elaborazioni, avere a disposizione la sequenza completa di tali sequenze. Un modo per ricavarla, visto che siamo in possesso del codice gi delle sequenze, potrebbe essere quello di scrivere un programma parserizzatore del file FASTA originale del database. Esiste però una possibilità più comoda. Il pacchetto di BLAST offre, tra gli altri, anche un programma che si chiama fastacmd, che fa già tale lavoro. fastacmd –d database –s stringa Il database è quello su cui abbiamo fatto il blast, mentre la stringa fornita è o il codice gi della sequenza o anche il suo accession. Il programma fastacmd restituisce in formato FASTA sullo standard output la sequenza del database individuata da tale codice

BIOINFO3 - Lezione 3714 FASTACMD Unica condizione richiesta per poter eseguire il comando fastacmd è quella di aver formattato il database con lopzione –o al momento dellesecuzione del formatdb di quel database di sequenze.

BIOINFO3 - Lezione 3715 FASTACMD Ovviamente il comando fastacmd potrà essere eseguito anche da programma, al pari di tutti gli altri comandi UNIX. Vediamo questo programma che riceve il nome del file di risultati di BLAST ed un numero e stampa (in FASTA) solo le sequenze con e-value inferiore o uguale al numero fornito

BIOINFO3 - Lezione 3716 FASTACMD

BIOINFO3 - Lezione 3717 RIEPILOGO Parsing risultati di BLAST FASTACMD