RNS_BOVIN ANG1_MOUSE TPA_HUMAN UROK_HUMAN

Slides:

Advertisements

Presentazioni simili

Sequenza-struttura-funzione

Advertisements

gruppi di amminoacidi in base alle catene laterali

RICERCA DI SIMILARITA’ IN BANCHE DATI

I programmi di ricerca in banche dati possono essere oppure essere utilizzabili via web residenti in un calcolatore di cui siamo proprietari o utenti.

Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.

Analisi della struttura primaria delle proteine

I programmi di ricerca in banche dati possono essere

Esempio di utilizzo del programma BLAST disponibile all’NCBI

ALLINEAMENTO DI SEQUENZE

Rappresentazione Del Modulo di una Costante Per calcolare il punto dove la costante si interseca con l’asse y: 20log 10 della costante |G| W [ ]

Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.

Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.

Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.

Esempio di allineamento Due regioni simili delle proteine di Drosophila melanogaster Slit e Notch SLIT_DROME FSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFC..:.:

Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.

LA MEMORIA CENTRALE. La memoria nella struttura generale del calcolatore MEMORIA CONTROLLO INGRESSO E USCITA ARITMETICA E LOGICA CPU Dispositivi esterni.

Programmi per l’ALLINEAMENTO DELLE SEQUENZE La creazione di programmi per l’allineamento delle sequenze richiede la definizione di: *** Un criterio oggettivo.

Giuditta Cantoni, 4 E S.I.A I DATABASE. Definizione databese In informatica, il termine database, banca dati o base di dati (a volte abbreviato con il.

RICERCA DI SIMILARITA’ in DB Problema: identificare all’interno di una banca dati di sequenze quelle sequenze che sono più simili ad una sequenza di nostro.

Proteine. Le proteine Le proteine sono essenziali per la struttura e le funzioni degli organismi viventi – Una proteina è un polimero biologico formato.

le fonti di informazione scientifica

© 2007 SEI-Società Editrice Internazionale, Apogeo

La APP di Italia Nostra per i Beni Culturali

CALENDARIO LEZIONI AGGIORNATO

Definizioni: genoma trascrittoma proteoma.

DALLA TABELLA DELLE OSSERVAZIONI ALLA TABELLA DELLE FREQUENZE

Progettare algoritmi veloci usando strutture dati efficienti

La Fabbrica delle Proteine

Come cercare le fonti di informazione scientifica RISORSE

ESERCITAZIONI ANTROPOLOGIA

Spiegazione di alcuni concetti

Synthesis (1) Autore: Frederik Schroyens e gruppo di ricercatori e collaboratori Informazioni integrate dai seguenti repertori: Boger, Bönninghausen, Boericke,

PERMUTAZIONI Consideriamo i primi cinque numeri naturali 1,2,3,4,5

Il calcolo della probabilità

Le basi dati CINAHL Tutorial sulla ricerca semplice

I mariti dicono delle mogli:

Cluster Analysis Definizione di Classificazione: operazione concettuale condotta adottando un solo criterio (detto fondamento della divisione) per individuare.

Mutazioni Geniche.

Servizi web per la bioinformatica strutturale

La Statistica Istituto Comprensivo “ M. G. Cutuli”

UNA CELLULA EUCARIOTICA E’ SUDDIVISA IN COMPARTIMENTI/ORGANELLI

Daniele Casagrande Argomenti di biologia.

IL DISASTER RECOVERY Ing. Massimiliano Zuffi

A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Prof.

WORKING WITH BIOSEQUENCES Alignments and similarity search

Statistica Scienza che studia i fenomeni collettivi.

1.3 Dama matematica-gioco da tavolo

© 2007 SEI-Società Editrice Internazionale, Apogeo

LEZIONE 4 Allineamento di sequenze nucleotidiche e proteiche

Prof.ssa Carolina Sementa

Definizioni: genoma trascrittoma proteoma.

La Fabbrica delle Proteine

Lezione n°6 Prof.ssa Rossella Petreschi

Concetti base 1.1.

L'ATOMO. ATOMO: è la più piccola parte di un elemento che ne conserva le proprietà. MOLECOLA: è la più piccola particella di una sostanza che ne conserva.

DIREZIONE DIDATTICA “C. Maneri – Ingrassia”

Algoritmi e Strutture Dati

Esercitazione sulle modalità

* 07/16/96 Sez. 2: Ordinamento La consultazione di banche dati è sempre più cruciale in tutte le applicazioni dell’Informatica. Se vogliamo consultare.

WORD 28/02/2019 Informatica - WORD.

Esercitazione 8 Laboratorio di Architetture degli Elaboratori I

APPUNTI SUL LINGUAGGIO C

APPUNTI SUL LINGUAGGIO C

I sistemi di equazioni di I grado

Il questionario: progettazione e redazione II Modulo

Programmi per l’ALLINEAMENTO DELLE SEQUENZE

RICERCA DI SIMILARITA’ in DB

I sistemi di equazioni di 1° grado

Transcript della presentazione:

RNS_BOVIN ANG1_MOUSE TPA_HUMAN UROK_HUMAN http://www.ch.embnet.org/software/LALIGN_form.html Provate ad allineare RNS_BOVIN ANG1_MOUSE Oppure TPA_HUMAN UROK_HUMAN

DOMINI I domini proteici sono delle strutture ripiegate in maniera compatta con un loro proprio nucleo idrofobico . I domini di proteine che si sono evolute recentemente sono frequentemente codificati da esoni diversi e riflettono la fusione genica di moduli piu’ semplici . Sebbene i domini rappresentino un livello importante nella gerarchia organizzativa delle proteine, non tutte le proteine possono essere descritte come strutture multidominio.

un metodo che misuri in base alla matrice di punteggio scelta e al la penalizzazione per i gap e per le loro estensioni scelte tutti i punteggi per tutti i possibili allineamenti di due sequenze, e’ molto dispendioso in termini di tempo e si puo applicare solo a poche sequenze alla volta. non si puo’ applicare per cercare in una banca dati sequenze omologhe alla nostra ATTGGLPPDRTGH | | | || ASGGQRPR---GH | || | || AS-GGQRPR--GH | | | | || ASGGQRP--R-GH

Metodi euristici 1) Si utilizzano metodi rapidi approssimati che consentono di selezionare da una bancadati le sequenze che piu’ probabilmente sono simili a quella di nostro interesse (query sequence) e si localizza la regione di similarieta’ in esse. 2) si restringe l’allinemanto solo alle sequenze della banca dati selezionate e solo ad alcune regioni di esse

Matrici di sostituzione (log-odds matrices) Per una famiglia di proteine ben conosciute: si allineano le sequenze si contano le mutazioni ad ogni posizione si calcola il numero di volte che per esempio ser e’ sostiuta da thr e si divide per la frequenza di ser e di thr, cioe’ per la numero di volte atteso per una sostituzoione casuale di ser in thr (Leu, Ile): 2 (Leu, Cys): -6 ... Punteggi positivi:gli amminoacidi sono stati considerati simili dall’evoluzione e sono stati sostituiti l’uno nell’altro piu’ frequentemente di quando sarebbe accaduto per caso. Punteggi negativi:gli amminoacidi sono stati considerati dissimili dall’evoluzione e sono stati sostituiti l’uno nell’altro meno frequentemente di quanto sarebbe dovuto accadere per caso. PAM250

BLAST .......AAAERTYPFGRTSF..... si può scomporre in tante parole di lunghezza w. se w=3 avremo AAA, AAE,AER, ERT,RTY,YPF..... se si allinea AAA con AAA si ottiene un certo punteggio usando per esempio PAM250=6,allineando AER con AER =12. selezioniamo le parole che diano un punteggio per esempio >10 tipo AER

Cerchiamo nella banca dati tutte le sequenze che contengano la parola AER AAAERTYPFGRTST query AAAERSFGGLWAA db a partire dalla parola allineata tra la query e la sequenza della db, cerchiamo di allungare l’allineamento fino a quando il punteggio che daremmo utilizzando PAM250 si mantiene alto

http://us.expasy.org/tools/ - similarity provate il primo ed il terzo link a blast VSLLDFNGNMSQVTGETTLLYKEIARNVEKTKKIKIIDFGIGQPDLPTFKRIRDAAKEAL DQGFTFYTSAFGIDELREKIAQYLNTRYGTDVKKEEVIVTPGAKPALFLVFILYINPSDE VILPDPSFYSYAEVVKLLGGKPIYANLKWSREEGFSIDVDDLQSKISKRTKMIVFNNPHN PTGTLFSPNDVKKIVDISRDNKIILLSDEIYDNFVYEGKMRSTLEDSDWRDFLIYVNGFS KTFSMTGWRLGYIVAKREIIQKMGILAANVYTAPTSFVQKAAVKAFDTFDEVNQMVSLFK KRRDVMYDELTKVKGVEVSKPNGAFYMFPNVSKILKTSGFDVKSLAIKLIEEKGVVTIPG EVFPLNIGKEFLRLSFAVNEEVIKEGIQKIREFAEQMMNSR

UN ALLINEMENTO MULTIPLO RIFLETTE LA STRUTTURA DELLE PROTEINE

COME SI COSTRUISCE UN CONSENSO

COME COSTRUIRE UN PATTERN

COME SI COSTRUISCE UN PATTERN

dopo aver mandato l’analisi cliccate su PDOC00098 http://us.expasy.org/prosite/ dopo aver mandato l’analisi cliccate su PDOC00098 secuite l’EC number e andate sulla banca Brenda VSLLDFNGNMSQVTGETTLLYKEIARNVEKTKKIKIIDFGIGQPDLPTFKRIRDAAKEAL DQGFTFYTSAFGIDELREKIAQYLNTRYGTDVKKEEVIVTPGAKPALFLVFILYINPSDE VILPDPSFYSYAEVVKLLGGKPIYANLKWSREEGFSIDVDDLQSKISKRTKMIVFNNPHN PTGTLFSPNDVKKIVDISRDNKIILLSDEIYDNFVYEGKMRSTLEDSDWRDFLIYVNGFS KTFSMTGWRLGYIVAKREIIQKMGILAANVYTAPTSFVQKAAVKAFDTFDEVNQMVSLFK KRRDVMYDELTKVKGVEVSKPNGAFYMFPNVSKILKTSGFDVKSLAIKLIEEKGVVTIPG EVFPLNIGKEFLRLSFAVNEEVIKEGIQKIREFAEQMMNSR