RNS_BOVIN ANG1_MOUSE TPA_HUMAN UROK_HUMAN http://www.ch.embnet.org/software/LALIGN_form.html Provate ad allineare RNS_BOVIN ANG1_MOUSE Oppure TPA_HUMAN UROK_HUMAN
DOMINI I domini proteici sono delle strutture ripiegate in maniera compatta con un loro proprio nucleo idrofobico . I domini di proteine che si sono evolute recentemente sono frequentemente codificati da esoni diversi e riflettono la fusione genica di moduli piu’ semplici . Sebbene i domini rappresentino un livello importante nella gerarchia organizzativa delle proteine, non tutte le proteine possono essere descritte come strutture multidominio.
un metodo che misuri in base alla matrice di punteggio scelta e al la penalizzazione per i gap e per le loro estensioni scelte tutti i punteggi per tutti i possibili allineamenti di due sequenze, e’ molto dispendioso in termini di tempo e si puo applicare solo a poche sequenze alla volta. non si puo’ applicare per cercare in una banca dati sequenze omologhe alla nostra ATTGGLPPDRTGH | | | || ASGGQRPR---GH | || | || AS-GGQRPR--GH | | | | || ASGGQRP--R-GH
Metodi euristici 1) Si utilizzano metodi rapidi approssimati che consentono di selezionare da una bancadati le sequenze che piu’ probabilmente sono simili a quella di nostro interesse (query sequence) e si localizza la regione di similarieta’ in esse. 2) si restringe l’allinemanto solo alle sequenze della banca dati selezionate e solo ad alcune regioni di esse
Matrici di sostituzione (log-odds matrices) Per una famiglia di proteine ben conosciute: si allineano le sequenze si contano le mutazioni ad ogni posizione si calcola il numero di volte che per esempio ser e’ sostiuta da thr e si divide per la frequenza di ser e di thr, cioe’ per la numero di volte atteso per una sostituzoione casuale di ser in thr (Leu, Ile): 2 (Leu, Cys): -6 ... Punteggi positivi:gli amminoacidi sono stati considerati simili dall’evoluzione e sono stati sostituiti l’uno nell’altro piu’ frequentemente di quando sarebbe accaduto per caso. Punteggi negativi:gli amminoacidi sono stati considerati dissimili dall’evoluzione e sono stati sostituiti l’uno nell’altro meno frequentemente di quanto sarebbe dovuto accadere per caso. PAM250
BLAST .......AAAERTYPFGRTSF..... si può scomporre in tante parole di lunghezza w. se w=3 avremo AAA, AAE,AER, ERT,RTY,YPF..... se si allinea AAA con AAA si ottiene un certo punteggio usando per esempio PAM250=6,allineando AER con AER =12. selezioniamo le parole che diano un punteggio per esempio >10 tipo AER
Cerchiamo nella banca dati tutte le sequenze che contengano la parola AER AAAERTYPFGRTST query AAAERSFGGLWAA db a partire dalla parola allineata tra la query e la sequenza della db, cerchiamo di allungare l’allineamento fino a quando il punteggio che daremmo utilizzando PAM250 si mantiene alto
http://us.expasy.org/tools/ - similarity provate il primo ed il terzo link a blast VSLLDFNGNMSQVTGETTLLYKEIARNVEKTKKIKIIDFGIGQPDLPTFKRIRDAAKEAL DQGFTFYTSAFGIDELREKIAQYLNTRYGTDVKKEEVIVTPGAKPALFLVFILYINPSDE VILPDPSFYSYAEVVKLLGGKPIYANLKWSREEGFSIDVDDLQSKISKRTKMIVFNNPHN PTGTLFSPNDVKKIVDISRDNKIILLSDEIYDNFVYEGKMRSTLEDSDWRDFLIYVNGFS KTFSMTGWRLGYIVAKREIIQKMGILAANVYTAPTSFVQKAAVKAFDTFDEVNQMVSLFK KRRDVMYDELTKVKGVEVSKPNGAFYMFPNVSKILKTSGFDVKSLAIKLIEEKGVVTIPG EVFPLNIGKEFLRLSFAVNEEVIKEGIQKIREFAEQMMNSR
UN ALLINEMENTO MULTIPLO RIFLETTE LA STRUTTURA DELLE PROTEINE
COME SI COSTRUISCE UN CONSENSO
COME COSTRUIRE UN PATTERN
COME SI COSTRUISCE UN PATTERN
dopo aver mandato l’analisi cliccate su PDOC00098 http://us.expasy.org/prosite/ dopo aver mandato l’analisi cliccate su PDOC00098 secuite l’EC number e andate sulla banca Brenda VSLLDFNGNMSQVTGETTLLYKEIARNVEKTKKIKIIDFGIGQPDLPTFKRIRDAAKEAL DQGFTFYTSAFGIDELREKIAQYLNTRYGTDVKKEEVIVTPGAKPALFLVFILYINPSDE VILPDPSFYSYAEVVKLLGGKPIYANLKWSREEGFSIDVDDLQSKISKRTKMIVFNNPHN PTGTLFSPNDVKKIVDISRDNKIILLSDEIYDNFVYEGKMRSTLEDSDWRDFLIYVNGFS KTFSMTGWRLGYIVAKREIIQKMGILAANVYTAPTSFVQKAAVKAFDTFDEVNQMVSLFK KRRDVMYDELTKVKGVEVSKPNGAFYMFPNVSKILKTSGFDVKSLAIKLIEEKGVVTIPG EVFPLNIGKEFLRLSFAVNEEVIKEGIQKIREFAEQMMNSR