La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Corso di Laurea Specialistica in Informatica Bioinformatica A.A. 2010/2011 Prof. Alfredo Ferro 09/03/2011.

Presentazioni simili


Presentazione sul tema: "Corso di Laurea Specialistica in Informatica Bioinformatica A.A. 2010/2011 Prof. Alfredo Ferro 09/03/2011."— Transcript della presentazione:

1 Corso di Laurea Specialistica in Informatica Bioinformatica A.A. 2010/2011 Prof. Alfredo Ferro 09/03/2011

2 Contatti Prof. Alfredo Ferro: Dott. Giuseppe Pigola: Dott. Alfredo Pulvirenti: Dott.ssa Rosalba Giugno:

3 Orari di Ricevimento (per appuntamento) Prof. Alfredo Ferro Lunedì,Mercoledì,Venerdì – Ufficio 324 – Blocco I, 2° Piano Tel Dott. Giuseppe Pigola Lunedì,Mercoledì,Venerdì – Ufficio 308- Blocco I, 2° Piano Tel

4 Orario lezioni Lunedì,Mercoledì e Venerdì – Aula 2

5 Modalità d'esame Prova orale/laboratorio Progetto

6 Testi consigliati Valle et al. Introduzione alla Bioinformatica Zanichelli Jambeck, Gibas Developing Bioinformatics Computer Skills O'Reilly Lewin Il Gene – Edizione Compatta Zanichelli

7 Genomica e Proteomica La genomica è una branca della biologia molecolare che si occupa dello studio del genoma degli organismi viventi. –In particolare si occupa della struttura, contenuto, funzione ed evoluzione del genoma. La proteomica è una disciplina che studia il proteoma, il complemento tempo-specifico e cellulo- specifico del genoma. Il proteoma è l'insieme di tutte le proteine espresse in una cellula: –Dinamico nel tempo –Varia in risposta a fattori esterni –Differisce tra i diversi tipi cellulari di uno stesso organismo

8 Cos'è la Bioinformatica? E la disciplina che studia le interazioni fra Informatica e processi biologici. Essa viene anche chiamata Biologia Computazionale. Utilizza i metodi propri dell'informatica per la risoluzione di problemi biologici. La genomica e la proteomica sono basate sulla Bioinformatica, per l'elaborazione, l'interpretazione e la visualizzazione dell'enorme quantità di dati che producono. La nuova era è iniziata con il Progetto Genoma Umano e con la produzione della sequenza completa del DNA umano e di altri organismi.

9 La Bioinformatica Necessità di interpretare la grande mole di dati collezionate dai biologi. DNA(memoria), RNA(comunicazione), Proteine(computazione-esecuzione) etc.. Quali parti del DNA controllano certi processi? Qual è la funzione di certe proteine?

10 I principali tipi di dati Biosequenze –DNA, RNA, Proteine Strutture –DNA, Secondaria dell'RNA, Secondaria e Terziaria delle proteine Dati di interazione –DNA-Proteina, RNA-RNA, RNA-Proteina, Proteina- Proteina Livelli di espressione –RNA (microarray) –Proteine (protein array)

11 Esempio 1 In una sequenza proteica è possibile individuare regioni funzionalmente importanti. Ogni sequenza proteica è codificata da una sequenza genomica. Supponiamo che la regione X nel moscerino sia cruciale in una certa funzione. Domanda: esiste un analogo nell'uomo? Risposta: effettuando una ricerca per similarità della regione X nel genoma umano è possibile individuare dei geni candidati.

12 Esempio 2 Tutte le cellule di un individuo contengono lo stesso DNA. Eppure un neurone è molto diverso da un globulo bianco! Che cosa li rende così diversi nella forma e nella funzione? Sebbene il DNA sia lo stesso, esso contiene delle regioni importanti in tutte le cellule ed altre specifiche per alcune di esse. Mediante un'analisi del trascrittoma (microarray) è possibile stabilire quali regioni del DNA contengono informazioni relative al funzionamento di ognuna delle due cellule.

13 Esempio 3: Eyless e Aniridia: wet-biology Eyless è un gene della Drosophila melanogaster (moscerino della frutta) la cui rimozione (wet biology) causa la generazione di mosche senza occhi. I biologi hanno anche identificato un gene umano Aniridia la cui mancanza o eccessiva mutazione, tale da non far funzionare la corrispondente proteina, causa il mancato sviluppo delliride negli occhi.

14 Eyless e Aniridia: Bioinformatica Operiamo una query a NCBI dando come input a BLAST la biosequenza del gene Eyless e ricercando match con Aniridia. Il risultato mostra due regioni altamente simili. Il match è illustrato da una sequenza in mezzo alle due confrontate, contenente lamminoacido nel caso di match perfetto, il segno + se cè una similarità chimica (ad esempio D ed E sono acidi aspartico e glutammico), blank (cioè spazio vuoto) nel caso di NON MATCH.

15 QUERY BLAST EYLESS-ANIRIDIA

16 Match Parziale e NON Esatto Eyless ed Aniridia hanno match significativi solo nelle posizioni e di Eyless con le posizioni e di Aniridia rispettivamente. Tutto il resto NON presenta match significativi. Tuttavia il match è significativo per cui possiamo dedurre proprietà dellAniridia da quelle del più conosciuto Eyeless (struttura, funzione,effetti sul fenotipo(caratteristiche visibili o misurabili) etc..)

17 Programma del corso Biologia molecolare: cellule, genomi ed evoluzione Biologia molecolare: RNA e trascrizione Biologia molecolare: La traduzione e le proteine Basi di dati biologiche Allineamento di sequenze Gene prediction Predizione della struttura secondaria dellRNA RNA non codificanti: miRNA e siRNA Analisi del trascrittoma – Microarray Systems Biology e Network biologiche Sistemi per il mining di network biologiche Il linguaggio Perl

18 Cellule, genomi e Dogma della Biologia Molecolare La cellula Il Genoma –Geni, pseudogeni, ripetizioni Struttura dei geni Il Dogma della Biologia Molecolare –Trascrizione (DNA -> RNA) –Traduzione (RNA -> Proteine)

19 Basi di dati biologiche Dati biologici e loro formati –Sequenze biologiche Banche dati generiche –NCBI, EMBL, DDBJ NCBI –Entrez: Nucleotide, Protein, Gene EMBL –Ensembl!

20 Allineamento di sequenze Omologia, similarità e distanza Funzioni di scoring e matrici di sostituzione Allineamento Pairwise: algoritmo di Needleman-Wunsch Allineamento Pairwise locale: BLAST, Smith-Waterman Allineamento Multiplo Funzioni di scoring: sum-of-pairs, entropia, circular sum Center star method Profili Allineamento progressivo: algoritmo di Feng-Doolittle ClustalW Metodi basati su consistenza: T-Coffee, ProbCons Valutazione di allineamenti multipli Motif finding

21 Il linguaggio Perl Perl –Il linguaggio di scripting più utilizzato in Bioinformatica –Interpretato –Punto di forza: espressioni regolari –Linguaggio "colla": utile nell'automatizzazione di esperimenti, test e nella conversione di formati

22 Gene prediction Modelli di Markov Nascosti (HMM) Metodi per la predizione di geni –ORF –Modelli statistici –Individuazione di Esoni ed introni Tool per la predizione di geni –GenScan

23 Predizione della struttura secondaria dellRNA Struttura secondaria dellRNA Rappresentazione di strutture secondarie Metodi probabilistici per la predizione Tool per la predizione della struttura dellRNA –MFold

24 Analisi del trascrittoma e Microarray Microarray technology Analisi di dati da microarray Cenni su protein array

25 RNA non codificanti e miRNA I miRNA Database di miRNA Predizione di geni miRNA Predizione di target per miRNA –miRanda RNA interference e siRNA

26 Database specializzati NCBI –Pubblicazioni scientifiche:Pubmed –Profili di espressione: GEO –Polimorfismi: dbSNP –Interrogazione del DB via script: EUtils Browser genomici –NCBI MapViewer –UCSC Genome Browser miRNA –miRBase, TarBase, miRò GO: Gene Ontology Pathways –KEGG, Pathway Commons Ensembl! BioMart

27 Network biologiche Teoria dei grafi Misure di Centralità Classificazione delle network Clustering e metodi per l'identificazione dei clusters Network scale-free e gerarchiche Rilevamento della struttura modulare Algoritmi tradizionali –Single linkage clustering –Average linkage clustering Algoritmi basati su betweenness centrality (Girvan, Newman)

28 Sistemi per il mining di network biologiche Sistemi di visualizzazione di network –Cytoscape Ricerca –Netmatch Annotazione di network con miRNA –miRScape


Scaricare ppt "Corso di Laurea Specialistica in Informatica Bioinformatica A.A. 2010/2011 Prof. Alfredo Ferro 09/03/2011."

Presentazioni simili


Annunci Google