UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA Corso di BIOINFORMATICA: TECNICHE DI BASE Prof. Giancarlo Mauri Lezione 11 Distanza genomica
2 4Brassica Oleracea (cavolo) e Brassica Campestris (rapa): geni mitocondriali per il 99% identici, ma in ordine molto diverso 4Nel cromosoma X dei mammiferi sono molto conservati i geni, ma non il loro ordine 4Il confronto tra grandi porzioni di genomi può dare indicazioni sull’evoluzione 4Si cercano quali operazioni possono trasformare un genoma in un altro, spostando parti di genoma Introduzione
3 Il riarrangiamento genomico è quel fenomeno per cui alcune parti del genoma vengono duplicate e collocate in posizioni lontane dalla loro origine Operazioni possibili: 4 su un solo cromosoma 4 su due cromosomi Riarrangiamento genomico
4 Operazioni su un solo cromosoma 4 Cancellazione ê abc ac 4 Inserimento ê ac abc 4 Duplicazione (tandem o no) ê abc abbc, abcd abcbd, abcd acbcd 4 Inversione ê abcdefgh abfedcgh 4 Trasposizione ê abcd acbd 4 Transversione ê una delle sottosequenze trasposte viene invertita Riarrangiamento genomico
5 Operazioni su due cromosomi 4 Traslocazione ê scambio di “code”. Possibile solo se non si perde il centromero 4 Fusione ê due cromosomi si fondono 4 Fissione ê un cromosoma si divide in due Riarrangiamento genomico
6 4Il problema studiato considera una sola tra le possibili operazioni: l’inversione 4Dati due genomi si etichettano i geni che compongono il primo con numeri crescenti da 1 a n. Il secondo genoma sarà etichettato da una permutazione di {1,2,…,n} 4Un’inversione equivale al rovesciamento di una sequenza di numeri Riarrangiamento genomico con inversioni
7 Esempio Genoma1: Genoma2: Genoma2 è stato ottenuto da Genoma1 tramite l’inversione del segmento Riarrangiamento genomico con inversioni
8 Dal cavolo alla rapa
9 Dal verme all’uomo
10 Distanza di inversione tra le sequenze S 1 e S 2 : numero minimo di operazioni di inversione necessarie per trasformare S 1 in S 2 Esempio: S S Distanza di inversione d(S 1,S 2 ) = 3
11 Riarrangiamento genomico con inversioni INPUT INPUT: una permutazione dell’insieme {1,2,…,n} OUTPUT OUTPUT: distanza tra e la permutazione identica I NB: la permutazione identica è I=1,2,…,n NB: la permutazione identica è I=1,2,…,n 4 Il problema è NP-hard 4 Esiste però la possibilità di approssimarlo
12 Si definisca un breakpoint tra le posizioni i e i+1 di se e solo se | (i) - (i+1)| ≠ 1 dove (i) e (i+1) sono gli elementi di alle posizioni i e i+1 La permutazione identica I non ha breakpoints, quindi il riarrangiamento secondo I corrisponde all’eliminazione dei breakpoints da 4In generale ogni inversione toglie al più due breakpoint Ne segue che d( )≥b( )/2, dove d( ) è la distanza di da I e b( ) è il numero di breakpoints in Riarrangiamento genomico con inversioni
13 L’euristica Definizione Definizione: una striscia in è un sottointervallo massimale di senza breakpoints 4decrescente se formata da numeri in ordine decrescente Es: crescente se formata da numeri in ordine crescente Es: NB: una striscia di lunghezza 1 è considerata decrescente
14 while ci sono breakpoints in do begin if c’è una striscia decrescente then trovane una che riduca il numero di bp e invertila (Lemma 1) else trova e inverti una striscia crescente (diventa decrescente; non aumenta i bp: Lemma 2) L’euristica Lemma 1 - Se contiene una striscia decrescente, allora esiste una inversione che riduce il numero di bp di almeno uno Lemma 1 - Se contiene una striscia decrescente, allora esiste una inversione che riduce il numero di bp di almeno uno Lemma
15 4Trovo la striscia decrescente con estremo più piccolo, K 4Trovo K-1 4Inverto tutta la sequenza tra K e K > … > L’algoritmo
16 Esempio
17 4In questa versione del problema ogni numero è dotato di segno (+ oppure -) 4Il segno cambia ogni volta che il numero è contenuto in un intervallo di inversione Riarrangiamento con permutazioni con segno
18 4Il problema a differenza della versione priva di segno non è NP-hard 4Esistono algoritmi risolutivi esatti in tempo quadratico Riarrangiamento con permutazioni con segno