La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Argomenti trattati Struttura di un gene e alternative splicing (AS)

Presentazioni simili


Presentazione sul tema: "Argomenti trattati Struttura di un gene e alternative splicing (AS)"— Transcript della presentazione:

1 Argomenti trattati Struttura di un gene e alternative splicing (AS)
3/25/2017 Argomenti trattati Struttura di un gene e alternative splicing (AS) Definizione del problema AS e algoritmo per risolverlo ASPic software

2 Introduzione biologica
DNA Doppia catena polinucleotidica definita sull’alfabeto: A, C, G, T Gene Regione di DNA che codifica proteine

3 Numero geni e genomi in eucarioti
3/25/2017 Numero geni e genomi in eucarioti Number of genes in prokaryotes (up to 8000) Genoma in procarioti (> 9 Mb)

4 Espressione di un gene 5’ 3’ DNA 3’ 5’ 5’ 3’ pre-mRNA mRNA EST
3/25/2017 Espressione di un gene 5’ 3’ DNA 3’ 5’ TRASCRIZIONE 5’ 3’ exon 1 exon 2 exon 3 pre-mRNA SPLICING exon 1 exon 2 exon 3 prodotto dello splicing mRNA EST Expressed Sequence Tag (cDNA) exon 2 exon 1 exon 3

5 Trascritti e sequenze EST
3/25/2017 Trascritti e sequenze EST Un trascritto è l’elenco delle basi (A, T, C, G) che compongono un mRNA maturo Un EST è un frammento di cDNA (copia complementare di un mRNA, prodotta in vitro ) ATTGCGTTAACTGGACTGA mRNA AATTGACC EST TAACGCAATTGACCTGACT cDNA

6 Pattern di un introne Introni canonici: 99.24 % GT AG
3/25/2017 Pattern di un introne Introni canonici: % GT AG Introni non canonici: 0.69 % 0.05 % 0.02 % GC AG AT AC ALTRO Burset et al., Nucleic Acids Res. 2000, 28:

7 Ma le cose funzionano davvero così?
3/25/2017 Espressione di un gene Ma le cose funzionano davvero così? Numero Geni corpo umano : circa Numero Proteine : centinaia di migliaia La corrispondenza 1 a 1 non è rispettata. Perché? SPLICING ALTERNATIVO

8 Tipi di Alternative Splicing
3/25/2017 Tipi di Alternative Splicing Mutually exclusive exons Exon skipping Splice/don’t splice Competing 3’ Competing 5’ A’ A I1 B A I1 B A I1 B A I1 B A A I1 B I1 B’ B C B C D GENOMICA A B C D mRNA1 A B D B mRNA2 A I1 B C D A’ C D B C D A C D B’ A C

9

10 3/25/2017 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002) AS genera numerosi trascritti a partire da un singolo gene AS is specifico del tessuto in cui si trova la cellula (Graveley, 2001) AS è correlato alle malattie

11 Problema di AS AS è ancora un problema aperto
3/25/2017 Problema di AS AS è ancora un problema aperto Si ha la necessità di software tools per predire le forme di splicing alternativo di un gene analizzare il meccanismo di splicing tramite la rappresentazione delle possibili isoforme

12 Cosa c’è a disposizione?
3/25/2017 Cosa c’è a disposizione? Programmi veloci che producono l’allineamento di una singola sequenza EST contro la genomica: Spidey (Wheelan et al., 2001) Squall (Ogasawara & Morishita, 2002) Ma la predizione della struttura in esoni e introni di un gene è complicata da errori di sequenziamento nell’EST (inserzioni, delezioni e mismatch) => criteri di ottimizzazione sequenze duplicate sulla genomica => analisi combinata di un cluster di sequenze EST

13 st = suff (fit) o st = pref (fit)
3/25/2017 Definizioni formali Def 1 Sequenza genomica, G = I1 f1 I2 f2 I3 f3 … In fn In+1, con Ii (i=1, 2, …, n+1) introni e fi (i=1, 2, …, n) esoni Def 2 Fattorizzazione in esoni di G, GE = f1 f2 f3 … fn Def 3 Fattorizzazione di un EST S compatibile con GE S=s1 s2 … sk t.c. per 1  i1 < i2 < … < ik  n si abbia: edit (st, fit)  errore per t=2, 3, …, k-1 edit(s1, suff(fi1))  errore e edit(sk, pref(fik))  errore Def 1 Sequenza genomica, G = I1 f1 I2 f2 I3 f3 … In fn In+1, con Ii (i=1, 2, …, n+1) introni e fi (i=1, 2, …, n) esoni Def 2 Fattorizzazione in esoni di G, GE = f1 f2 f3 … fn Def 3 Fattorizzazione di un EST S compatibile con GE S=s1 s2 … sk t.c. per 1  i1 < i2 < … < ik  n si abbia: st = fit per t=2, 3, …, k-1 s1 è un suffisso di fi1 e sk è un prefisso di fik st = suff (fit) o st = pref (fit) variante di splicing

14 Il problema Input - Una sequenza genomica G
3/25/2017 Il problema Input - Una sequenza genomica G - Un cluster di sequenze EST S = {S1, S2, …, Sn} Output Una fattorizzazione GE di G (GE = f1, f2, …, fn) e un set di fattorizzazioni degli EST compatibili con GE Obiettivo: minimizzare n

15 Esempio A2 A2 A2 A2 D1 C1 A2 A1A2 A1A2 A1A2 A1A2 B D1 B B B D1 D1 D1
3/25/2017 Esempio Sequenza genomica G A2 A2 A2 A2 D1 C1 A2 A1A2 A1A2 A1A2 A1A2 B D1 B B B D1 D1 D1 C1 C1 D1D2 D1D2 D1D2 D1D2 C1C2 C1C2 C1C2 C1C2 4 esoni 7 exons EST set S = {S1, S2, S3} C1 S1 A2 D1 S2 A1A2 B D1 S3 A2 D1D2 C1C2

16 Risultati Il problema è MAX-SNP-hard (riduzione lineare da NODE-COVER)
3/25/2017 Risultati Il problema è MAX-SNP-hard (riduzione lineare da NODE-COVER) Euristica: Processo iterativo per fattorizzare ogni EST backtracking per ricomputare fattorizazzioni precedenti se si giunge ad una fattorizzazione non compatibile con GE

17 L’algoritmo si-1 1 si-1 j-1 si-1 j si-1 n si1 si j-1 sij em e1 e2 em
3/25/2017 L’algoritmo Passo j-esimo: Fattorizzazione parziale dell’EST Si (fattore sij) Si-1 si-1 1 si-1 j-1 si-1 j si-1 n Si si1 si j-1 sij em G e1 e2 em After placing all the factors sij for the set S, place the external factors; if (Compatible(em, exon_list)) then add em to exon_list; otherwise try to place sij elsewhere; If not possible then backtrack;

18 L’algoritmo (dettagli)
3/25/2017 L’algoritmo (dettagli) Calcolo del fattore sij ag gt G esone c2 Si si1 si j-1 si jy si j c1 c1 c1 c1 c2 c2 c3 c4 c5 sij Find the rightmost gt pattern such that the edit distance between sijy and the genomic substring from ag to gt is bounded Sij can be divided into n components ck (k=1,2,…,n) At least one of these components for k from 1 to (n-1) is error-free and can be placed on G Then the entire factor sij can be placed on G Find the canonical ag pattern on the left Then the algorithm searches a perfect match of c2 on G The algorithm searches a perfect match of c1 on G Suppose that c2 has a perfect match on G Suppose that c1 has no perfect match on G

19 ASPic software (Alternative Splicing PredICtion)
3/25/2017 ASPic software (Alternative Splicing PredICtion) Input - La lunghezza minima prevista per un esone - La lunghezza della componente di matching perfetto - L’errore di riduzione degli introni - L’errore di sequenziamento di un EST - La sequenza genomica - Il cluster di EST Output - Un file di testo per tutti gli allineamenti EST-genomica - Un file HTML degli allineamenti in prossimità dei siti di splicing predetti

20 3/25/2017 ASPic web site ASPic è un web-based tool disponibile all’indirizzo che permette di predire i siti di splicing per un gene in input

21 3/25/2017 ASPIC web site

22 3/25/2017 ASPIC web site

23 ASPIC web site http://www.caspur.it/ASPIC/ OUTPUT:
3/25/2017 ASPIC web site OUTPUT: Information about the input A graphical view of the predicted gene structure A table of the predicted introns A graphical view of the transcript-genome alignments A graphical view of the predicted full-length isoforms A table of the predicted full-length isoforms

24 3/25/2017 ASPIC web site

25 3/25/2017 ASPIC web site

26 3/25/2017 ASPIC web site

27 3/25/2017 ASPIC web site

28 3/25/2017 ASPIC web site

29 3/25/2017 ASPIC web site

30 3/25/2017 ASPIC web site

31 Prediction of p53 protein isoforms
3/25/2017 Prediction of p53 protein isoforms

32 GRAZIE!


Scaricare ppt "Argomenti trattati Struttura di un gene e alternative splicing (AS)"

Presentazioni simili


Annunci Google