A C G T A T G G T T A AC T A G T T A G G A A T C G C G C A T T A T G T C C A C G T T A G G T T G A A C G G C A G G T T T A A A T C G A T T C.

Slides:



Advertisements
Presentazioni simili
I protidi o proteine Le proteine sono i costituenti fondamentali degli organismi viventi  e occupano una posizione primaria nell'architettura e nelle funzioni.
Advertisements

Premessa: si assume di aver risolto (correttamente
Flusso Massimo Applicazione di algoritmi
Il problema del cammino minimo tra 2 nodi in un grafo non cooperativo
Prof. Salvatore Di Gregorio Dr. William Spataro Dr. Donato D’Ambrosio
Alberi binari Definizione Sottoalberi Padre, figli
Informatica Generale Alessandra Di Pierro
Algoritmi e Strutture Dati
Breath-first search Visita in ampiezza di un grafo Algoritmo Esempio
Breath-first search Visita in ampiezza di un grafo Algoritmo Esempio
Insiemi disgiunti.
Implementazione dell algortimo di Viterbi attraverso la soluzione del problema di cammino mi- nimo tramite software specifico. Università degli studi di.
Gli alberi binari sono contenitori efficienti.
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 12/05/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 28/04/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 19/05/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 15/05/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
Algoritmi e strutture Dati - Lezione 7
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
Algoritmi e Strutture Dati
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl Alberi AVL (Adelson-Velskii.
Il problema del cammino minimo tra 2 nodi in un grafo con archi privati.
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
Algoritmi e Strutture Dati
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Flusso Massimo Applicazione di algoritmi
Cammini minimi Algoritmo SPT.Acyclic
Flusso Massimo Applicazione Algoritmi Esercizio 1 Sia dato la seguente rete di flusso, in cui la sorgente è il nodo 1 e la destinazione è il nodo 6. I.
Algoritmi e strutture dati
Modelli e Algoritmi per la Logistica
Modelli e Algoritmi per la Logistica
1. ( punti 7 ) Siano dati un insieme di localizzazioni potenziali (nodi grandi) ed un insieme di clienti da servire (nodi piccoli). Il costo di afferenza.
1. ( punti 7 ) Siano dati un insieme di localizzazioni potenziali (nodi grandi) ed un insieme di clienti da servire (nodi piccoli). Il costo di afferenza.
Algoritmi e Strutture Dati
Modello dati ALBERO Albero: Albero: insieme di punti chiamati NODI e linee chiamate EDGES EDGE: linea che unisce due nodi distinti Radice (root): in una.
Il "Dogma centrale" Replicazione DNA Trascrizione Trascrizione
Copolimero Assegnazione dei codoni mediante uso di copolimeri ripetuti contenenti due o tre nucleotidi Codoni presenti Amminoacidi incorporati Codoni.
Fondamenti di Informatica
Università degli Studi di Padova Progetto Lauree scientifiche Buratto Alessandra Dipartimento Di Matematica Pura Ed Applicata Liceo Scientifico "L. da.
Corso di Laurea in Biotecnologie corso di Informatica Paolo Mereghetti DISCo – Dipartimento di Informatica, Sistemistica e Comunicazione.
Progetto RSA Analisi di un progetto di una rete per la direzione dei veicoli negli opportuni parcheggi in base alla loro lunghezza Cappa Francesca
grafi e reti Ottimizzazione su Reti - Network Optimization Testi :
Prof. Cerulli – Dott.ssa Gentili
Cerchiamo di rispondere alla seconda domanda 2)La soluzione trovata con lalgoritmo goloso è ottima o esistono anche soluzioni con più di quattro attività?
e gode della proprietà di poter essere inscritto in una circonferenza
Programmazione di calcolatori
Algoritmi e Strutture Dati
Monitoraggio tempo scuola
Cammini minimi da un sorgente
MUTAZIONE: cambio di un bit Viene effettuata con bassa frequenza, ad es. 1bit ogni 1000 Ha la funzione di recupero di eventuali perdite di informazione.
Proprietà del DNA Appaiamento (associazione)
Capitolo 13 Cammini minimi: Ordinamento topologico Algoritmi e Strutture Dati.
Olimpiadi di Informatica 2010 Giornate preparatorie
UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA
NP completezza. Problemi decisionali I problemi decisionali sono una classe di problemi dove per ogni possibile ingresso un algoritmo deve scegliere una.
Il Problema del Commesso Viaggiatore. Traveling Salesman’s Problem (TSP) Un commesso viaggiatore deve visitare un certo numero di città Conosce la distanza.
Flusso Massimo Applicazione di algoritmi
Capitolo 13 Cammini minimi Algoritmi e Strutture Dati.
Capitolo 13 Cammini minimi: Bellman e Ford Algoritmi e Strutture Dati.
DNA: The life molecule La ricerca del materiale genetico (da Eissman a Hershey e Chase) La struttura del DNA (da Chargaff a Watson e Crick) Le funzioni.
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
FINCH TV visualizzare cromatogrammi esportare sequenze in formato FASTA.
Algoritmo per il calcolo del maggiore tra tre numeri qualsiasi Francesco PUCILLO matr
OTTIMIZZAZIONE DI UN PERCORSO GRAFO CAMMINO MINIMO.
Algoritmi Avanzati a.a.2014/2015 Prof.ssa Rossella Petreschi Lezione n°10.
Algoritmi Avanzati a.a.2012/2013 Prof.ssa Rossella Petreschi Albero Ricoprente Lezione n°9.
Alberi binari Definizione Sottoalberi Padre, figli
Transcript della presentazione:

A C G T A T G G T T A AC T A G T T A G G A A T C G C G C A T T A T G T C C A C G T T A G G T T G A A C G G C A G G T T T A A A T C G A T T C C A C G T T A T G A A A T T G G G G C A G G T T T A A C G C G C C C

M V N S T P L K G Q Metionina Valina Asparagina STOP Serina Treonina A U G G UU A A C U A G UU A G G A A U C G C G C A U U A U G U C C A C G U Metionina Valina Asparagina STOP Serina Treonina Prolina Lisina Leucina Glicina Glutamina A C G U U A G G U U G A A C G G C A G G U U U A A A U C G A U U C C C A G U A C G U U A UG A A A U U G G G G C A G G U U U A A C G C G C C C

ATTACGGCCATGCGGAGCCGGAAG presente in ? algoritmo che richiede un numero di confronti pari alla lunghezza di

confronto approssimato di stringhe ALLINEAMENTO T G T A C G G A A T C G G A T C T C C G A C C A T C G G A 4 3 + = 7 T G - T A - C G G A - - A T C G G A T - C T - C C G - A C C A T C G G A T G C TAC C G G A C C A T C G G A

T G T A C G G A A T C G G A T C G A T C G A T G T A C G G A A T C G G A

4 3 + = 7 T - G T A C - G G A - - A T C G G A T C - T - C C - G A C C A T C G G A T G - T A - C G G A - - A T C G G A T - C T - C C G - A C C A T C G G A

cammino minimo quante operazioni ? N.B. : il numero di cammini è molto elevato impossibile la valutazione esplicita !

RICORSIONE ! +1 = min +1

ogni arco viene considerato esattamente una volta numero operazioni = numero archi = due sequenze di 1000 basi richiedono un milione di operazioni

Diverso modello: sostituzioni ammesse T G T A C G G A A T C G G A T C T C C G A C C A T C G G A 4 T G T A C G G A - - A T C G G A T C T C C G - A C C A T C G G A 2 2 8

T G T A C G G A A T C G G A T C G A 6 14

T G T A C G G A - A T C G G A T C T C C G A C C A T C G G A T G T A C G G A - - A T C G G A T C T C C G - A C C A T C G G A

ALLINEAMENTO MULTIPLO T G T A C G G A A T C G G A T C T C C G A C C A T C G G A A C T C A G A C A A T G A T G T A C G - G A A T C G G A T C T C C G A C C A T C G G A A C T C A G A C A A T - - G A

Numero confronti = prodotto lunghezze stringhe 3 stringhe lunghe 1000 un miliardo di operazioni !

? ATAGA CTAGA CTAGA ATGA CTGA AGGA ATGA TAGA CTGA ATGA TAGA TACA TAGA A G - G A - T A C A - T A G A C T - G A A T - G A A G - G A - T A C A - T A G A C T - G A A T - G A

AUGCCGAUUCAACGGUCCUACUCGGACUUUACC M P I Q R S Y S D F T M R I S R S D S D Y T punteggio (M<->M, P<-> R ...) basato sulle probabilità di mutazione

RICOSTRUZIONE DEI FRAMMENTI

ACGTTACG TTACGGAT CGGATTCA CGGCGATT AACAAGCTT CGGAATCG TTACCGGAT CGGTTAGG CGAATTAG TGGCGAA GGCCTTAA ACGACGAT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCGCGAT GTGTAGAG CTTGATCT CGGATATA CGCGATAT TGTGAATA ACGTTACG TTACGAAT CGGATTCA CGGCGATT AACCAGCTT CGGAATCG TTACCGGAT CGGTTAGG CGAATTAG TGGCGAA AGCCTTAA ACGACGAT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCGCGAT GTGCAGAG CTTGATCT CGGATATA CGCGATAT TGTGAATA ACGTTACG TTACGGAT CGGATTTA CGGCGATT AACAAGCTT CGGAATCG TTACCGGAT CGGTTAGG AGAATTAG TGGCGAA GGCCTTAA ACGACGAT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TCTCGCGA CGCGCGAT GTGTAGAG CTTGATCT CGGATATA CGCGCTAT TGTGAATA ACATTACG TTACGGAT CGGATTCA CGGCGACT AACAAGCTT CGGAATCG TTACCGGAT CGGTTAAG CGAATTAG TGGCGAA GGCCTTAA ACGACGTT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCGCGAT TTGTAGAG CTTGATCT CGGATATA CGCAATAT TGTGAATA ACGTTACG TTACTGAT CGGATTCA CGGCGATT AACAAGCGT CGGAATCG TTACCGGAT CGGTTAGG AGAATTAG TGGCGAA GGCCTTAA ACGACGAT GCATTGGA ATATCGAT CGCGCGAA TGTGCATA AACGGAC TGTCGCGA CGCGCGAT GTGTAGAG CTTGTTCT CGGATATA CGCGATAT TGTGAATA ACGTTACG TTACGGAT CGGATTCA CGGCAATT AACAAGCTT CGGAATAG TTACCGGAT CGGTTAGG CGAATTAG TGGCGAA GGCCTTAA ACGACGAT GTATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCTCGAT GTGTAGAG CTTGATCT AGGATATA CGCGATAT TGTGAATA

ACGTTACG TTACGGAT CGGATTCA CGGCGATT AACAAGCTT CGGAATCG TTACCGGAT CGGTTAGG CGAATTAG TGGCGAA GGCCTTAA ACGACGAT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCGCGAT GTGTAGAG CTTGATCT CGGATATA CGCGATAT TGTGAATA ACGTTACG TTACGAAT CGGATTCA CGGCGATT AACCAGCTT CGGAATCG TTACCGGAT CGGTTAGG CGAATTAG TGGCGAA AGCCTTAA ACGACGAT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCGCGAT GTGCAGAG CTTGATCT CGGATATA CGCGATAT TGTGAATA ACGTTACG TTACGGAT CGGATTTA CGGCGATT AACAAGCTT CGGAATCG TTACCGGAT CGGTTAGG AGAATTAG TGGCGAA GGCCTTAA ACGACGAT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TCTCGCGA CGCGCGAT GTGTAGAG CTTGATCT CGGATATA CGCGCTAT TGTGAATA ACATTACG TTACGGAT CGGATTCA CGGCGACT AACAAGCTT CGGAATCG TTACCGGAT CGGTTAAG CGAATTAG TGGCGAA GGCCTTAA ACGACGTT GCATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCGCGAT TTGTAGAG CTTGATCT CGGATATA CGCAATAT TGTGAATA ACGTTACG TTACTGAT CGGATTCA CGGCGATT AACAAGCGT CGGAATCG TTACCGGAT CGGTTAGG AGAATTAG TGGCGAA GGCCTTAA ACGACGAT GCATTGGA ATATCGAT CGCGCGAA TGTGCATA AACGGAC TGTCGCGA CGCGCGAT GTGTAGAG CTTGTTCT CGGATATA CGCGATAT TGTGAATA ACGTTACG TTACGGAT CGGATTCA CGGCAATT AACAAGCTT CGGAATAG TTACCGGAT CGGTTAGG CGAATTAG TGGCGAA GGCCTTAA ACGACGAT GTATTCGA ATATCGAT CGCGCGAA TGTGCATA ACCGGAC TGTCGCGA CGCTCGAT GTGTAGAG CTTGATCT AGGATATA CGCGATAT TGTGAATA

ACCGT CGTGC TTAC TACCGT - - ACCGT - - - - - - CGTGC TTAC - - - - - - TACCGT - - TTACCGTGC TTAC - - - - - - TACCGT - - - - ACCGT - - - - - - CGTGC 1 + 2 = ___ 4

TAGG AGGT CGTC GTCG TAGG AGGT 1 TAGG AGGT 3 TAGG AGGT CGTC GTCG 4 1 3 4 4 2 1 2 4

TAGG 4 1 3 4 4 GTCG AGGT 2 1 4 2 4 4 CGTC CGTC - GTCG - - - - TAGG - AGGT CGTCGTAGGT lunghezza 10

TAGG 1 4 4 3 4 4 GTCG AGGT 2 TAGG 1 4 2 4 - AGGT 4 - - GTCG CGTC - - CGTC TAGGTCGTC lunghezza 9 CGTCGTAGGT

ALBERI FILOGENETICI A B C D E F

a b c d e A 1 B C D E F

00110 00010 00100 10010 00011 00101 00100 01011 00010 10011 10010

1 1 1 1

1 1 1 1

1 1 1 1

a b c d e A 1 B C D E F esiste un albero filogenetico perfetto con A,B,C,D,E,F nodi?

2 foglie A B A B C 3 foglie A B C 4 foglie 12 6 18 5 foglie 60 30 120

caratteri ordinati: solo 0 --> 1 ammesso problema facile a b c d e A B C D E F 1

a b c d e A 1 B C D E F

A B C D E F a b c d e 1 a b c d e E C 1 B F D A a b c d e C F B E A D

caratteri non ordinati (filogenia perfetta) B C D E F a b c d e 1 f g A B C D E F a b c d e 1 f g

1001011 1101011 1001010 0101011 1101011 1001010 1001010 E B 1101011 0101011 C 0100011 F 1101001 D A