Esempio di utilizzo del programma BLAST disponibile all’NCBI

Slides:



Advertisements
Presentazioni simili
Allineamento Pairwise e Multiplo di Bio-Sequenze.
Advertisements

UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA
gruppi di amminoacidi in base alle catene laterali
RICERCA DI SIMILARITA’ IN BANCHE DATI
Bioinformatica Pictar – miRanda - TargetScan – miRiam
Bioinformatica Banche dati biologiche
Allineamento di sequenze
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Corso di Laurea Specialistica in Informatica Bioinformatica A. A
Bioinformatica Prof. Mauro Fasano
BASI DI DATI BIOLOGICHE - 3
I programmi di ricerca in banche dati possono essere oppure essere utilizzabili via web residenti in un calcolatore di cui siamo proprietari o utenti.
Informatica 2. Concetti fondamentali di programmazione Programmare vuol dire scrivere un algoritmo in un linguaggio che faccia funzionare un calcolatore.
Biologia computazionale
Caratterizzazione di un gene clonato
Metodi basati sulle similitudini per dedurre la funzione di un gene
1) Algoritmi di allineamento 2) Algoritmi di ricerca in database
Entrez + MedLine => PubMed
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
BUILDING A USER INTERFACE Using CRYSTAL REPORTS. COME UNAPPLICAZIONE COMUNICA CON LUTENTE? Problema comune a tutte le applicazioni informatiche Forse.
Riassumendo Ci sono diverse modalità con cui un gene può produrre trascritti alternativi Inizi alternativi della trascrizione Terminazioni alternative.
ALLINEAMENTI GLOBALI E LOCALI
È stimato che oggi sulla terra sono presenti
FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990)
Software per la Bioinformatica
WORKING WITH BIOSEQUENCES Alignments and similarity search
Informatica e Bioinformatica – A. A
In questa lezione ci occuperemo
Ricerca di similarità di sequenza (FASTA e BLAST)
Tipi di allineamenti.
I programmi di ricerca in banche dati possono essere
Alcuni esempi di domande di esame
BIOINFO3 - Lezione 361 RICERCA DI SIMILARITA TRA SEQUENZE Un altro problema comunissimo in bioinformatica è quello della ricerca di similarità tra sequenze.
BIOINFO3 - Lezione PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo.
Tutorial per l’utilizzo di k ScanProsite
Report federica scarrione 18/05/09. Definizione I rapporti o report sono lo strumento informatico per la presentazione di un insieme di dati memorizzati.
La vita in codice Prof.ssa Carmela Allocca.
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
Sequenze e Banche Dati Biologiche
A.A CORSO BIOINFORMATICA 2 LM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Dr. Giorgio Valle Dr. Stefania.
Annotare i geni Gene xxxx Gene zzzz 3 esoni 7 esoni proteina y
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Dr.
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
A.A CORSO BIOINFORMATICA 2 LM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Dr. Giorgio Valle Dr. Stefania.
Purtroppo non esiste un modo univoco per indicare un gene
TRADUZIONE del RNA.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
III LEZIONE Allineamento di sequenze
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
WORKING WITH BIOSEQUENCES Alignments and similarity search.
Allineamento di sequenze
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
ALLINEAMENTO DI SEQUENZE
Excel.
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
---ATGTTGAAGTTCAAGTATGGTGTGCGGAAC--- --MLKFKYGVRNPPEA-- Che cosa è la bioinformatica? Approccio multidisciplinare al problema della gestione e della elaborazione.
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
Capacità di riprodursi struttura nucleo DNA, RNA Membrana semipermeabile Parete cell organelli metabolismo Scambi energia e materia vegetale animale unicellulare.
DIAGNOSI MOLECOLARE DI UNA MALATTIA GENETICA E SVILUPPO DI UNA TERAPIA GIUSEPPINA ANDREOTTI M.VITTORIA CUBELLIS.
Esempio di allineamento Due regioni simili delle proteine di Drosophila melanogaster Slit e Notch SLIT_DROME FSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFC..:.:
1 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI 6 Gruppi di Ricerca: G. Pesole C. Gissi G. Pavesi D. Horner F. Mignone.
Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Prof.
DNA Barcoding. Cos’è il DNA barcoding? Ottenimento di una breve sequenza di DNA che permette l’identificazione o il riconoscimento di specie all’interno.
Transcript della presentazione:

Esempio di utilizzo del programma BLAST disponibile all’NCBI www.ncbi.nlm.nih.gov/BLAST Form di Nucleotide BLAST Per un uso più avanzato, si possono impostare parametri particolari (es. cost to open gap, cost to extende gap, penalty for mismatch ecc) Informatica e Bioinformatica – A. A. 2013-2014

La risposta che si ottiene può essere suddivisa in 4 parti: Sequenza query La risposta che si ottiene può essere suddivisa in 4 parti: dati generali allineamento grafico listato delle sequenze con allineamento significativo dettaglio degli allineamenti ottenuti 1. dati generali 2. allineamento grafico Informatica e Bioinformatica – A. A. 2013-2014

3. listato delle sequenze con allineamento significativo Ricordate che BLAST è un programma di allineamenti locali, quindi, per ogni confronto tra la sequenza query e una delle sequenza del database, potrebbero essere trovati più allineamenti differenti. Significato delle colonne Max score: punteggio dell’allineamento locale più significativo: punteggio alto  elevata similarità Total score: la somma dei punteggi di tutti gli allineamenti locali trovati tra la sequenza query e la sequenza del database Query coverage: percentuale della sequenza allineata E value: esprime la probabilità che l’allineamento trovato sia casuale. Più basso è maggiore è la probabilità che NON sia casuale. (dipende, oltre che dalla similarità, anche dalla numerosità delle sequenze in database) Max Identit: percentuale di identità dell’allineamento locale più significativo TTTCTCGACTGCAGAGAAA ||||| ||| |||||||| TTTCTAGACTGCAGAGAAA Identità =82% (16 / 19) Informatica e Bioinformatica – A. A. 2013-2014

4. dettaglio degli allineamenti ottenuti ......continua con i dettagli degli altri allineamenti ..... Informatica e Bioinformatica – A. A. 2013-2014

Risultato della ricerca (con la stessa sequenza nucleotidica) tramite BLASTX: ricerca di similarità in una banca dati di sequenze proteiche a partire da una sequenza query di nucleotidi, dopo aver tradotto automaticamente la query in aminoacidi utilizzando tutti i possibili frame di lettura. Informatica e Bioinformatica – A. A. 2013-2014

ESEMPIO di BLAST 2 SEQUENCES Utilizziamo BL2SEQ con due sequenze nucleotidiche Informatica e Bioinformatica – A. A. 2013-2014

Form dell’NCBI nel quale immettere le due sequenze da confrontare Visualizzazione dei risultati: dati generali Informatica e Bioinformatica – A. A. 2013-2014

Zoom della regione di gap tra le due sequenze allineate Informatica e Bioinformatica – A. A. 2013-2014

BLAT Blast-like alignment tool Programma specializzato in allineamenti di sequenze su interi genomi e sviluppato da J. Kent (Santa Cruz, CA). Informatica e Bioinformatica – A. A. 2013-2014

BLAT Blast-like alignment tool Proviamo a fornire a BLAT la sequenza di un mRNA e a vedere dove e come si allinea sul genoma umano Informatica e Bioinformatica – A. A. 2013-2014

RISULTATO di BLAT Si può visualizzare il risultato dell’allineamento selezionando il link ipertestuale browser. E si possono visualizzare i dettagli dell’allineamento selezionando il link ipertestuale details. Informatica e Bioinformatica – A. A. 2013-2014

I dettagli riguardano sia la sequenza di input (mRNA) Informatica e Bioinformatica – A. A. 2013-2014

Che le regioni della sequenza genomica che si allineano con l’mRNA In maiuscolo la sequenza di input (mRNA) In minuscolo e nero la sequenza genomica che non allinea: INTRONE, oppure regione intergenica. Gli introni di solito iniziano con GT e finiscono con AG Informatica e Bioinformatica – A. A. 2013-2014

BLAT contro BLAST BLAT mantiene in memoria un indice di un intero genoma: il database target di BLAT non è un set di sequenze GenBank, ma un indice derivato dall'assemblaggio dell'intero genoma. BLAT per gli acidi nucleici è scritto per individuare velocemente sequenze di 40 basi o più e con il 95% di similarità o più. Potrebbe non individuare allineamenti più divergenti o corti. BLAT per proteine individua sequenze proteiche con più dell'80% di similarità alla query lunga almeno 20 aa. In pratica, a causa del grado di divergenza tra sequenze nel corso dell'evoluzione: DNA BLAT lavora bene su uomo ed i primati, BLAT per proteine trova buoni match tra le proteine conservate di vertebrati terrestri e anche organismi più distanti filogeneticamente. Da un punto di vista pratico, BLAT ha diversi vantaggi rispetto a BLAST: * velocità (no code, risposte in secondi) ma ha una minore specificità * diverse modalità di ordinamento dell'output * collegamento diretto nel UCSC Genome Browser * dettaglio dei blocchi di allineamento nell'ordine naturale nel genomico BLAT viene solitamente usato per cercare la collocazione di una sequenze nel genoma o per determinare la struttura esonica di un mRNA. Informatica e Bioinformatica – A. A. 2013-2014