BIOINFO3 - Lezione 361 RICERCA DI SIMILARITA TRA SEQUENZE Un altro problema comunissimo in bioinformatica è quello della ricerca di similarità tra sequenze.

Slides:



Advertisements
Presentazioni simili
Unità D2 Database nel web. Obiettivi Comprendere il concetto di interfaccia utente Comprendere la struttura e i livelli che compongono unapplicazione.
Advertisements

(Appunti da Scott Mitchell, James Atkinsons - Active Server Pages 3.0 – ed. Apogeo) Le pagine ASP.
Installazione di Apache 2, PHP5, MySQL 5
INTERNET : ARPA sviluppa ARPANET (rete di computer per scopi militari)
Connessione con MySQL.
Esercitazione 2 Array, funzioni, form
Dr. Giovanni Stracquadanio
NESSUS.
Il Software: Obiettivi Programmare direttamente la macchina hardware è molto difficile: lutente dovrebbe conoscere lorganizzazione fisica del computer.
Argomenti dalla linea dei comandi Gli argomenti possono essere passati a qualsiasi funzione di un programma, compresa la main(), direttamente dalla linea.
1 Basi di dati e Web Prof. Stefano Paraboschi Prof. Barbara Pernici.
Installazione pacchetti sotto Linux. Linux: Installare le applicazioni Adesso che abbiamo configurato Linux vogliamo imparare a installare qualche programma.
CORSO DI INFORMATICA LAUREA TRIENNALE-COMUNICAZIONE & DAMS
Software di base Il sistema operativo è un insieme di programmi che opera sul livello macchina e offre funzionalità di alto livello Es.organizzazione dei.
ASP Lezione 1 Concetti di base. Introduzione ad ASP ASP (che è la sigla di Active Server Pages) è un ambiente di programmazione per le pagine web. La.
Lezione 2 Programmare in ASP
Corso di PHP.
Il nostro computer navigando su Internet è molto esposto a rischio di virus, spyware o hacker che minacciano lintegrità dei nostri dati. Proteggere il.
Modulo 7 – reti informatiche u.d. 3 (syllabus – )
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
INTRODUZIONE l sistema operativo è il primo software che lutente utilizza quando accende il computer; 1)Viene caricato nella memoria RAM con loperazione.
1 Installazione da rete Introduzione Configurazione del server NFS Cosa serve sul client Configurazione kickstart.
Guida IIS 6 A cura di Nicola Del Re.
PROGRAMMARE IN C Un ambiente di sviluppo `e un software che serve per scrivere ed eseguire programmi. Generalmente integra almeno 3 funzionalita’: Editor:
BIOINFO3 - Lezione 24 ARRAY
AICA Corso IT Administrator: modulo 4 AICA © EUCIP IT Administrator Modulo 4 - Uso Esperto della Rete Risoluzione dei Problemi e Analisi del Traffico.
BIOINFO3 - Lezione 121 Alter Table Alter table permette di cambiare la struttura di tabelle esistenti. Ad esempio e` possibile aggiungere o cancellare.
Creare pagine web Xhtlm. Struttura di una pagina.
Di Luca Santucci 5° Programmatori
Ricerca di similarità di sequenza (FASTA e BLAST)
Slide 1 Un browser migliore Passa a Firefox – il modo più veloce, sicuro e intelligente per navigare sul Web.
Internet Explorer I preferiti Stampa di pagine web Salvataggio di pagine web Copia di elementi di pagine web in altri applicativi.
Backup and Migrate, Captcha ReCaptcha e Spamicide Docente: Simone Zambenedetti. Moduli per la Sicurezza.
BIOINFO3 - Lezione 261 ESERCIZIO Esercizio. Leggere delle sequenze di DNA (una per riga, a partire da inizio riga) e stampare solo le sequenze lunghe più
PARSERIZZAZIONE DI FILE
BIOINFO3 - Lezione 081 create table est( gi int unsigned primary key auto_increment, acc char(8)not null, nome varchar(20), descrizione varchar(255),
BIOINFO3 - Lezione 341 INTERAZIONE CON UN SERVER MYSQL Quando abbiamo parlato dei database relazionali SQL vi avevo già accennato che linterazione (invio.
BIOINFO3 - Lezione PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo.
BIOINFO3 - Lezione 321 ACCESSO REMOTO AL SERVER SIBILLA Attraverso Internet è possibile accedere al server sibilla.cribi.unipd.it. Potrete così effettuare.
BIOINFO3 - Lezione 101 GLI IPERTESTI Una delle innovazioni introdotte da HTML e dal WWW in generale, rispetto ad un testo normale è sicuramente la possibilità
BIOINFO3 - Lezione 201 Come in ogni corso di introduzione ad un linguaggio di programmazione, proviamo a scrivere lormai celebre primo programma di prova.
BIOINFO3 - Lezione 111 CGI-BIN CGI-BIN sono chiamati i programmi la cui esecuzione può essere richiesta attraverso il WEB. Il server web (httpd) della.
BIOINFO3 - Lezione 211 INPUT La lettura di un input dallo standard input (tastiera) si effettua utilizzando lespressione. Quando il programma incontra.
BIOINFO3 - Lezione 331 SUBROUTINE IN PERL Una subroutine (funzione, metodo, procedura o sottoprogramma), e` una prozione di codice all`interno di un programma.
BIOINFO3 - Lezione 19 RICAPITOLANDO…
BIOINFO3 - Lezione 15 ISTRUZIONI
BIOINFO3 - Lezione 41 ALTRO ESEMPIO ANCORA Progettare il comando di creazione di una tabella di pubblicazioni scientifiche. Come chiave usare un numero.
BIOINFO3 - Lezione 301 CGI-BIN Abbiamo visto che CGI-BIN sono chiamati i programmi la cui esecuzione può essere richiesta attraverso il WEB. In particolare.
BIOINFO3 - Lezione 271 PATH DEL FILE Bisogna fare molta attenzione al path del file da aprire. Per non sbagliare converrebbe passare sempre il path assoluto.
REDIREZIONE INPUT E OUTPUT
Amministrazione della rete: web server Apache
Programma di Informatica Classi Prime
Come preparare una chiavetta USB per essere avviabile in DOS ed effettuare il flash del tuo VBIOS Avviso: Il Vbios di esempio è per la scheda VAPOR-X R9.
Progetto Traduzioni elaborato di Basi di Dati sviluppato con WebRatio
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Programmazione Web PHP e MySQL 1. 2Programmazione Web - PHP e MySQL Esempio: un blog.
Francesco M. Taurino 1 NESSUS IL Security Scanner.
Interazione col DB Per interagire con una base dati da una pagina PHP occorre procedere come segue: Eseguire la connessione al DBMS MySQL in ascolto;
Il software Componente del computer costituita dai: –programmi di base per la gestione del sistema –programmi applicativi per l’uso del sistema Queste.
Sistemi operativi di rete Ing. A. Stile – Ing. L. Marchesano – 1/18.
Allineamento di sequenze
Informatica Lezione 6 Psicologia dello sviluppo e dell'educazione (laurea magistrale) Anno accademico:
Informatica e Informatica di Base
Problemi, algoritmi e programmazione
CORSO INTERNET la Posta elettronica
Eprogram informatica V anno.
Programmazione orientata agli Oggetti Introduzione a Java.
Eprogram informatica V anno. Programmare in rete.
+ Connettersi al web Nicolò Sordoni. + Verificare se lo smartphone è connesso Per poter accedere alla rete, è consigliato innanzitutto verificare se il.
IV Corso di formazione INFN per amministratori di siti GRID Tutorial di amministrazione DGAS Giuseppe Patania.
Transcript della presentazione:

BIOINFO3 - Lezione 361 RICERCA DI SIMILARITA TRA SEQUENZE Un altro problema comunissimo in bioinformatica è quello della ricerca di similarità tra sequenze. In particolare, data una sequenza query di nucleotidi o di amminoacidi, vogliamo trovare le sequenze più simili ad essa tra tutte le sequenze di un database. Il programma che normalmente si usa per questo scopo è BLAST. Noi invece vedremo lesecuzione di BLAST da linea di comando UNIX e in particolare la possibilità di automatizzare, grazie alla scrittura di appositi programmi Perl, lesecuzione di tali ricerche e lanalisi dei risultati prodotti dal programma Nel corso di Bioinformatica2 dovreste avere già visto lalgoritmo di BLAST (Basic Local Alignment Search Tool, Altschul et al., 1990) e tutti i suoi parametri e dovreste aver provato ad usarlo attraverso il WEB, sul sito NCBI.

BIOINFO3 - Lezione 362 BLAST Supponiamo che sulla macchina UNIX (LINUX) in cui stiamo lavorando sia già stata installata la versione eseguibile da linea di comando del BLAST. Se foste comunque interessati ad installare lultima versione sul vostro computer, potete sempre scaricarla dal sito Sul sito trovate anche tutte le istruzioni necessarie per linstallazione. Il programma eseguibile che effettua la ricerca di BLAST si chiama blastall e dovrebbe essere installato in una directory presente nel PATH in modo che da qualunque directory il programma sia eseguibile semplicemente scrivendo blastall e non tutto il path completo della directory in cui è stato effettivamente installato. Proviamo a chiedere dove è installato blastall

BIOINFO3 - Lezione 363 REQUISITI DI BLAST Blastall ha bisogno di almeno due parametri: la sequenza query e il database di sequenze, in cui cercare le sequenze più simili alla query. Per effettuare molto velocemente le ricerche, il programma BLAST non le effettua sul DB originale in formato FASTA, ma in una sua versione binaria, preventivamente ottenuta attraverso il programma formatdb (ovviamente fornito anchesso nel pacchetto di installazione di BLAST). formatdb DB di sequenze in formato FASTA blastall Pre-elaborazione sequenza query DB di sequenze in formato binario Risultato di BLAST

BIOINFO3 - Lezione 364 FORMATDB Per vedere cosè e come funziona il programma formatdb, quali parametri richiede, ecc. chiediamone la pagina di manuale UNIX relativa, con il comando man formatdb

BIOINFO3 - Lezione 365 FORMATDB Tipicamente (se il database è un file di sequenze in formato FASTA) i parametri che si usano con formatdb sono: -i filename -p F Il primo è il nome del file di sequenze da formattare ed il secondo è necessario solo se le sequenze del DB sono nucleotidiche

BIOINFO3 - Lezione 366 FORMATDB Proviamo a creare la versione binaria del nostro database (flat-file) di EST Notare il file di log creato (formatdb.log) Notare i file binari creati (.nhr,.nin,.nsq)

BIOINFO3 - Lezione 367 BLASTALL E importante che lutente che eseguirà il blast abbia il diritto di leggere i file binari. Se vogliamo eseguire il blast attraverso un programma cgi, e quindi dallutente con cui gira il server web httpd, dovremo esser sicuri che tale utente possa leggere i file. Se comunque anche la creazione dei file binari con il formatdb avviene attraverso un programma cgi e quindi è effettuata sempre dallutente con cui gira httpd, non dovrebbero esserci problemi, sempre che tale utente abbia il permesso di scrivere nella directory. Proviamo a scoprire qualcosa di più su blastall:

BIOINFO3 - Lezione 368 BLASTALL E ovviamente anche con man blastall

BIOINFO3 - Lezione 369 BLASTALL Anche in questo caso unesecuzione tipica richiede pochi parametri: -p versione-specifica-di-blast -d database -i query La versione specifica di blast da usare (blastn, blastp, blastx,…) dipende dalla nature della sequenza query e delle sequenze del database formattato. Il database sarà il nome originale del database di sequenze in formato FASTA, che dovrà essere stato preventivamente formattato Query è il nome del file contenente la sequenza query Blastall restituisce il risultato della sua elaborazione sullo standard output. Per ottenerlo in un file sarà sufficiente redirezionare lo standard output con il simbolo di > oppure con l`opzione -o

BIOINFO3 - Lezione 3610 BLASTALL Supponiamo di aver creato in /local/wwwstud/cgi-bin/bioinfo3-64 un file fasta, chiamato seq, contenente una sequenza query. Tale sequenza potrebbe ad esempio essere stata ricevuta via web: lutente ha immesso nella form tale sequenza desiderando verificarne le similarità contro il nostro database. Proviamo per curiosità a lanciare il blastall di tale sequenza contro un database non formattato (EST.fas anziché EST-ginseng.fas) Il programma si accorge che il database non è formattato!

BIOINFO3 - Lezione 3611 BLASTALL Proviamo invece a vedere il risultato di un blast correttamente eseguito sul database formattato di sequenze

BIOINFO3 - Lezione 3612 AUTOMATIZZAZIONE DEL BLAST Programma che riceve come argomento una sequenza nucleotidica ed effettua il blast contro il database di EST

BIOINFO3 - Lezione 3613 ESECUZIONE

BIOINFO3 - Lezione 3614 ESECUZIONE

BIOINFO3 - Lezione 3615 ESECUZIONE Una volta terminata lesecuzione del programma proviamo anche a verificare il file temp creato dal programma stesso. Per poter creare tale file lutente che esegue il programma deve poter scrivere nella directory (notare come siano perciò stati settati a 777 i diritti per il file., cioè per la directory corrente. Eventualmente, una volta eseguito il blast, il programma potrebbe anche rimuovere il file temp, di cui non ci sarà più bisogno.

BIOINFO3 - Lezione 3616 RIEPILOGO Ricerca di similarità tra sequenze Il BLAST da linea di comando FormatDB Blastall Esecuzione da programma