Ricerche in banche dati. Ricerche in banche dati UNIPROT PROTEINASCONOSCIUTA Ricerca PROT_24563 - Kinasi PROT_534346 - Fosfatasi PROT_33463 - Prot di.

Slides:



Advertisements
Presentazioni simili
4x-5y I POLINOMI xyz (a+b).
Advertisements

Calcolo Combinatorio.
UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA
Alfabeti, Stringhe e Linguaggi
II° Circolo Orta Nova (FG)
LE MATRICI.
CALCOLO COMBINATORIO Principio fondamentale del calcolo combinatorio
gruppi di amminoacidi in base alle catene laterali
RICERCA DI SIMILARITA’ IN BANCHE DATI
Grafi Algoritmi e Strutture Dati. Camil Demetrescu, Irene Finocchi, Giuseppe F. Italiano Algoritmi e strutture dati 2/ed 2 Copyright © The McGraw.
Allineamento di sequenze
La Matematica dei Girasoli
Calcolo combinatorio.
1 Grandezze omogenee, commensurabili e incommensurabili
Numeri quantici numero quantico principale
I programmi di ricerca in banche dati possono essere oppure essere utilizzabili via web residenti in un calcolatore di cui siamo proprietari o utenti.
Migliore Punteggio Lunghezza della sequenza Grandezza banca dati
Esercizio 1 Due collegamenti in cascata, AB e BC hanno una velocità rispettivamente di 100 Mb/s e 50 Mb/s e tempi di propagazione pari a 1 ms e 1.2 ms.
Statistica per le decisioni aziendali ed analisi dei costi Modulo II - Statistica per le decisioni Aziendali Richiami di Algebra Matriciale.
ANALISI DEI GRUPPI seconda parte
I QUADRILATERI.
1 Querying - Parte II Modelli per la ricerca. 2 Rappresentazione e Vector Space (VS) Ogni doc. j è un vettore di valori tf idf Si può normalizzare a lunghezza.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
Biologia computazionale
Metodi statistici per l'analisi del cambiamento 5/3/ Notazione (simboli) Obbiettivo: occorre che si mantengano le tracce, in merito al punteggio,
Alfabeti, Stringhe e Linguaggi Def: un insieme è una collezione non ordinata di oggetti o elementi Gli insiemi sono scritti tra { }. Gli elementi sono.
Biologia computazionale A.A semestre II U NIVERSITÀ DEGLI STUDI DI MILANO Docente: Giorgio Valentini Istruttore: Matteo Re p4p4 Programmazione.
1) Algoritmi di allineamento 2) Algoritmi di ricerca in database
CALCOLO COMBINATORIO.

Motivi Funzionali Identificare la funzione di una sequenza
ESERCITAZIONE ALLINEAMENTI. CLSSIEQKSNEEG--EHGPEVREDA ACISTIE---NEDGNEDH---VR Calcolare l'identità e la percentuale di identità
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
Algoritmi di String Matching
CALCOLO COMBINATORIO.
Una trattazione elementare esposta in modo essenziale e funzionale.
CALCOLO COMBINATORIO Prof Sandro Pistori.
ALLINEAMENTI GLOBALI E LOCALI
FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990)
1. Da misure di conducibilità elettrica risulta che la solubilità del solfato di bario BaSO4 in acqua pura è 1.05·10-5 mole/litro a 25°C. Si calcoli il.
Allineamento di sequenze proteiche
1)Completa la seguente successione: C4, B7, E10, D13, G16,. A. G19 B
SCOPRI LA TABELLINA click Trova la regola nascosta… click
Programmazione di calcolatori
Alfabeti Linguaggi Automi Grammatiche e Compilatori
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
Ricerca di similarità di sequenza (FASTA e BLAST)
Tipi di allineamenti.
1 CALCOLO COMBINATORIO Principio fondamentale del calcolo combinatorio Se un evento E 1 si può presentare in n 1 modi e un secondo evento E 2 si può manifestare.
I programmi di ricerca in banche dati possono essere
BIOINFO3 - Lezione PARSING RISULTATI DI BLAST Nella lezione di ieri abbiamo visto come automatizzare lesecuzione di BLAST. Oggi proviamo.
Monitoraggio tempo scuola
Pippo.
Nonostante tutti oggi utilizzino il computer, è però necessaria la preventiva e approfondita conoscenza delle tabelle di decompressione, senza le quali.
Massimo comun divisore
CALCOLO COMBINATORIO.
Linguaggio extraterreste ……con numeri e lettere
Progetto esame Tecnologie Web Anno: 2014 A cura di: Salvatore Giovanni De Vivo Matricola: Strumenti utilizzati: Html, ASP.NET, C#.
Una trattazione elementare esposta in modo essenziale e funzionale.
La Moltiplicazione fra monomi
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Antonio Pio Urzino 1 A A.S. 2009/10
III LEZIONE Allineamento di sequenze
Allineamento di sequenze
ALLINEAMENTO DI SEQUENZE
Algebra di Boole ?.
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
Algoritmo per il calcolo del maggiore tra tre numeri qualsiasi Francesco PUCILLO matr
Esempio di allineamento Due regioni simili delle proteine di Drosophila melanogaster Slit e Notch SLIT_DROME FSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFC..:.:
Calcolo combinatorio.
Transcript della presentazione:

Ricerche in banche dati

Ricerche in banche dati UNIPROT PROTEINASCONOSCIUTA Ricerca PROT_ Kinasi PROT_ Fosfatasi PROT_ Prot di membrana PROT_ Kinasi di membrana PROT_ Fattore di trascrizione

Per similarità di sequenza IDOrga nismo Sequenza RPD2_HUMANHumanMTERENNVYKAKLAEQAERYDEMVEAFYYKMKGDYHRYLAEFIAMNDLPP FFS_MOUSEMouseMKKVASMDVELTVE ERNLLSVAYKDFLEKHLIPCATSGESKVFYHPIRLGL RHA_MOUSEMouseASKKJFOWERMPVCOVCOXKVODFKAAFDDAIAELDTLSEIRLGLALNF GCN4_YEASTYeastLNVLEKHLIPCATSGESKVFYYKMKGDYHRYLAEFATGSDRKDAAENSLIYKA RAS_HUMANHumanLNSPDR ACRLAKAAFDDAIAELDTLS EESYKDSTLI MQLLRDNLTLALNFS IDSimilarità RPD2_HUMAN254 FFS_MOUSE128 RHA_MOUSE95 GCN4_YEAST12 RAS_HUMAN10 Smith-Waterman 5 appaiamenti ENNVYKAKLAEQAERYDEMVEAFRENNVYKAK Sequenza query Risultati Banca dati

Metodi Euristici Algoritmo esaustivo Algoritmo euristico Cervello umano

Allineamento a occhio

Lettere e Parole Lettere = A,B,D,E,F,G,H,..., Y 7 aminaocidi: L, T, A, G, A, G, I Sequenza LTAGAGI lunghezza =7 contiene: 8000 Parole di lunghezza 3 = AAA, AAB, AAC,.., ABA, ABB,.., BAA, BAB, Parole di lunghezza 2 = AA, AB, AC,.., BA, BB, BC,.., CA,.. Parole = GTY, ADEF, TR, etc.. 4 parole lunghe 4: LTAG, TAGA, …, … 5 parole lunghe 3: LTA, TAG, AGA, GAG, AGI 6 parole lunghe 2: LT, TA, AG, GA, AG, GI

Allineamenti con parole tg rd pl di dw lw ie wt LTGARDWEDIPLWTDDIEQES TGCRDWTDDPLWTQDIENSCNTD 8 Parole identiche Di lunghezza 2 rdw plw die lwt LTGARDWEDIPLWTDDIEQES TGCRDWTDDPLWTQDIENSCNTD 4 Parole identiche Di lunghezza 3

Matrice di parole AGWWRAAWAARGWAGA G W W R A G W A A *** **** **** ** ******* *** **** ****** *******

AGWWRAAWAARGWAGA G W W R A G W A A 13 Coppie di parole identiche di lunghezza 2 *** **** **** ** ******* *** **** ****** ******* * * Parola 2

Matrice di parole AGWWRAAWAARGWAGA G W W R A G W A A 13 Coppie di parole identiche di lunghezza 2 * * Parola 2

FastA Sequenza A > Sequenza B > Sequenza A > Sequenza B > Matrice di punti Matrice di parole di lunghezza 2

Matrice di parole 2 AGWWRAAWAARGWAGA E W W R A G W A A

Unione diagonali AGWWRAAWAARGWAGA E W W R A G W A A

Unione parole contigue Sequenza A > Sequenza B > Sequenza A > Sequenza B >

Calcolo similarità Sequenza A > Sequenza B > Sequenza A > Sequenza B >

Inserimento gaps Sequenza A > Sequenza B > Sequenza A > Sequenza B >

Calcolo Opt Sequenza A > Sequenza B >

Parole con errori 10 Parole lunghe 3 con 1 errore ammesso LTAGARIDEDWEDISLHDWRTDW TSGCRKDEWWTWDSIHSTQWSD LTAGARIDEDWEDISLHDWRTDW TSGCRKDEWWTWDSIHSTQWSD LTAGARIDEDWEDISLHDWRTDW TSGCRKDEWWTWDSIHSTQWSD Nessuna parola identica di lunghezza 3 18 Parole lunghe 4 con 2 errori ammessi EDW EWW Parole lunghezza 3 Identiche con 1 Errore EDWL EWWA Parole lunghezza 4 Identiche con 2 Errori

Parole simili SLH 16 SIH 14 SMH 13 SVH 13 ALH 13 TLH 13 NLH SFH 12 DLH 12 KLH 12 TMQ SLH Tutte le 8000 parole di lunghezza 3 Matrice di sostituzione Calcolo punteggio di similarità e ordinamento SLH ||| 4+5+7=16 SIH SLH ||| 1-1-2=-2 AAA SLH ||| =12 DLH Parole simili a SLH Parole Non-simili A SLH Valore soglia = 12

Blast Sequenza A > Sequenza B > Sequenza A > Sequenza B >

NWHNNLCRHW C W Y M C G K Q N Parole lunghezza 3 similarità > di 14

NWHNNLCRHW C W Y M C G K Q N Parole lunghezza 3 similarità > di 14 - Estensione fino a quando similarità > di 10

Migliore Punteggio - Lunghezza della sequenza - Grandezza banca dati - Composizione della sequenza

Punteggio sequenze random Punteggio OPT Opt = 1070 Numero Sequenze casuali

Significatività statistica Punteggio OPT Numero Sequenze casuali Opt = 1070

Significatività statistica Punteggio OPT Numero Sequenze casuali E = 1.21*10-21 E value = Numero atteso per caso di sequenze con punteggio > opt