La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

BIOINFO3 - Lezione 371. 2 3 4 PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo.

Presentazioni simili


Presentazione sul tema: "BIOINFO3 - Lezione 371. 2 3 4 PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo."— Transcript della presentazione:

1 BIOINFO3 - Lezione 371

2 2

3 3

4 4 PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo ad analizzare automaticamente i risultati prodotti. Supponiamo quindi in qualche modo di avere a disposizione in una stringa il report prodotto dallesecuzione di BLAST. La stringa potrebbe essere stata catturata con il comando qx di esecuzione del blast $report=qx{blastall ……}; Oppure se loutput del blastall è stato rediretto su un file (ovviamente anche in un programma eseguito precedentemente), il file potrebbe essere letto ed il suo contenuto assegnato alla stringa qx{blastall …… > file-report}; #anche in un altro programma ………… open (I,file-report); while ($riga= ){ $report.=$riga; }

5 BIOINFO3 - Lezione 375 REPORT DI BLAST Proviamo a vedere come è strutturato dal punto di vista sintattico il report prodotto da BLAST. Bisogna innanzitutto distinguere due casi: 1- Il programma non ha trovato similarità locali significative tra query e database Sequenza query Versione e riferimenti Database Pattern da ricercare

6 BIOINFO3 - Lezione 376 REPORT DI BLAST 2- Sono state trovate delle sequenze del database con similarità locali alla query Sequenza query Versione e riferimenti Database Pattern da ricercare Sequenze con E-value (probabilità di allineamento dovuto al caso) minore della soglia predefinita Per ciascun allineamento individuato: dettaglio e parametri

7 BIOINFO3 - Lezione 377 ESERCIZIO Provate voi a scrivere il programma che legga il file di risultati di BLAST passato come argomento, cerca il pattern Sequences producing... e per gli allineamenti trovati stampi i valori di: GI Length Score E-Value Identities %Identities Gaps (se ci sono) %Gaps (se ci sono)

8 BIOINFO3 - Lezione 378 Ecco un programma che individua (se ce ne sono) le sequenze (e i parametri dellallineamento) del database che danno allineamenti significativi con la query

9 BIOINFO3 - Lezione 379 Larray contiene 4 elementi ma il primo verrà scartato Dopo lo shift larray contiene i 3 allineamenti

10 BIOINFO3 - Lezione 3710 La stessa sequenza ha 2 allineamenti con la query! Però, per semplicità, in questo programma consideriamo solo il primo. Stampiamo $s, ovvero tutti i parametri dellallineamento di una delle sequenze trovate

11 BIOINFO3 - Lezione 3711 Siamo nel primo ciclo

12 BIOINFO3 - Lezione 3712 FINE ESECUZIONE Facciamo continuare (c) il programma fino alla fine e osserviamo come siano stampati i parametri anche per le altre due sequenze che hanno trovato allineamento In questo programma di esempio non facciamo nulla di particolare con i dati acquisiti, se non stamparli, però potremo ad esempio selezionare le sequenze in base alle-value o in base alla percentuale di similarità.

13 BIOINFO3 - Lezione 3713 ESTRAZIONE DELLE SEQUENZE Una volta individuato il codice delle sequenze con similarità alla sequenza query, potrebbe interessarci, per successive elaborazioni, avere a disposizione la sequenza completa di tali sequenze. Un modo per ricavarla, visto che siamo in possesso del codice gi delle sequenze, potrebbe essere quello di scrivere un programma parserizzatore del file FASTA originale del database. Esiste però una possibilità più comoda. Il pacchetto di BLAST offre, tra gli altri, anche un programma che si chiama fastacmd, che fa già tale lavoro. fastacmd –d database –s stringa Il database è quello su cui abbiamo fatto il blast, mentre la stringa fornita è o il codice gi della sequenza o anche il suo accession. Il programma fastacmd restituisce in formato FASTA sullo standard output la sequenza del database individuata da tale codice

14 BIOINFO3 - Lezione 3714 FASTACMD Unica condizione richiesta per poter eseguire il comando fastacmd è quella di aver formattato il database con lopzione –o al momento dellesecuzione del formatdb di quel database di sequenze.

15 BIOINFO3 - Lezione 3715 FASTACMD Ovviamente il comando fastacmd potrà essere eseguito anche da programma, al pari di tutti gli altri comandi UNIX. Vediamo questo programma che riceve il nome del file di risultati di BLAST ed un numero e stampa (in FASTA) solo le sequenze con e-value inferiore o uguale al numero fornito

16 BIOINFO3 - Lezione 3716 FASTACMD

17 BIOINFO3 - Lezione 3717 RIEPILOGO Parsing risultati di BLAST FASTACMD


Scaricare ppt "BIOINFO3 - Lezione 371. 2 3 4 PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo."

Presentazioni simili


Annunci Google