Corso di Laurea Specialistica in Informatica Bioinformatica A. A

Slides:



Advertisements
Presentazioni simili
Geni costitutivi e non costitutivi
Advertisements

Genetica dei Microrganismi ed Applicata
LA LAUREA MAGISTRALE IN BIOINFORMATICA Università degli studi
RICERCA DI SIMILARITA’ IN BANCHE DATI
Network Biologiche.
Bioinformatica Pictar – miRanda - TargetScan – miRiam
Bioinformatica Corso di Laurea Specialistica in Informatica RNA non codificanti ed RNA regolatori 29/04/2011.
Allineamento di sequenze
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Le proteine: come sono fatte, come funzionano, e come si sono evolute
Bioinformatica Presentazione del Corso
Bioinformatica Prof. Mauro Fasano
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
BASI DI DATI BIOLOGICHE - 3
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Come nasce la Bioinformatica? Progetti di sequenziazione del genoma Sforzi sperimentali per determinare la struttura e le funzioni di molecole biologiche.
Algoritmi per la visualizzazione
Ulteriori Abilità Informatiche
Bioinformatica Corso di Laurea Specialistica in Informatica Analisi della struttura dell’RNA 27/04/2011.
Bioinformatica Corso di Laurea Specialistica in Biologia Cellulare e Molecolare Ricerca pattern e di motivi funzionali 8/5/2008 Stefano Forte.
Introduzione alla bioinformatica
Metodi basati sulle similitudini per dedurre la funzione di un gene

RNA interference Premio NOBEL 2006 Fire e Mello.
Bioinformatica Andrea G. B. Tettamanzi.
Bioinformatica Per la laurea triennale in: Biologia Umana
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
Software per la Bioinformatica
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
Alcuni esempi di domande di esame
La vita in codice Prof.ssa Carmela Allocca.
Algoritmi e Strutture dati a.a. 2013/2014 Informazioni sul corso
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Dr.
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
Fondamenti di Bioinformatica e di Biologia di sistemi (c.i. 18 CFU)
Annotare i geni Gene xxxx Gene zzzz 3 esoni 7 esoni proteina y
CORSO INTEGRATO Fondamenti Bio-Genetici
Algoritmi e Strutture Dati Introduzione agli algoritmi
Flusso delle informazioni biologiche. In ogni istante della propria vita ogni cellula umana contiene: 46 cromosomi ( geni) mRNA diversi.
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Informatica e Bioinformatica Informazioni generali sul corso Corso di Laurea in Biologia Molecolare Università degli Studi di Padova AA
IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
Computational analysis of data by statistical methods
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
La parola “Bioinformatica”
Allineamento di sequenze
Cenni di Bioinformatica
Dal neolitico al Xxi secolo.
IV LEZIONE Dati d'espressione genica: ESTs SAGE Microarray NCBI GEO.
POSTGENOMICA O GENOMICA FUNZIONALE
Lunedimartedimercoledigiovedivenerdi Biol Mol ORARIO.
Era PostGenomica Sara Palumbo
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
Corso di Biologia Molecolare I Pagina web.
DIAGNOSI MOLECOLARE DI UNA MALATTIA GENETICA E SVILUPPO DI UNA TERAPIA GIUSEPPINA ANDREOTTI M.VITTORIA CUBELLIS.
Geni “cliccabili”. SRS : Ensembl : NCBI : Sanger centre :
La Fabbrica delle Proteine
1 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI 6 Gruppi di Ricerca: G. Pesole C. Gissi G. Pavesi D. Horner F. Mignone.
FIRB 2003 (art.8) D.D LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: CNRBA ATTIVITA’  Sviluppo programmi di analisi  Sviluppo.
Fabio Rinnone Matricola 667/ Università di Catania Facoltà di SS. MM. FF. NN. Dipartimento di Matematica e Informatica Corso di Laurea di Primo Livello.
Transcript della presentazione:

Corso di Laurea Specialistica in Informatica Bioinformatica A. A Corso di Laurea Specialistica in Informatica Bioinformatica A.A. 2010/2011 Prof. Alfredo Ferro 09/03/2011

Contatti Prof. Alfredo Ferro: ferro@dmi.unict.it Dott. Giuseppe Pigola: pigola@dmi.unict.it Dott. Alfredo Pulvirenti: apulvirenti@dmi.unict.it Dott.ssa Rosalba Giugno: giugno@dmi.unict.it

Orari di Ricevimento (per appuntamento) Prof. Alfredo Ferro Lunedì,Mercoledì,Venerdì 16.00 – 17.00 Ufficio 324 – Blocco I, 2° Piano Tel. 095 7383071 ferro@dmi.unict.it Dott. Giuseppe Pigola Lunedì,Mercoledì,Venerdì 16.00 – 17.00 Ufficio 308- Blocco I , 2° Piano Tel. 095 7383087 pigola@dmi.unict.it

Orario lezioni Lunedì,Mercoledì e Venerdì 17-19 – Aula 2

Modalità d'esame Prova orale/laboratorio Progetto

Testi consigliati Valle et al. Introduzione alla Bioinformatica Zanichelli Jambeck, Gibas Developing Bioinformatics Computer Skills O'Reilly Lewin Il Gene – Edizione Compatta

Genomica e Proteomica La genomica è una branca della biologia molecolare che si occupa dello studio del genoma degli organismi viventi. In particolare si occupa della struttura, contenuto, funzione ed evoluzione del genoma. La proteomica è una disciplina che studia il proteoma, il complemento tempo-specifico e cellulo-specifico del genoma. Il proteoma è l'insieme di tutte le proteine espresse in una cellula: Dinamico nel tempo Varia in risposta a fattori esterni Differisce tra i diversi tipi cellulari di uno stesso organismo

Cos'è la Bioinformatica? E’ la disciplina che studia le interazioni fra Informatica e processi biologici. Essa viene anche chiamata Biologia Computazionale. Utilizza i metodi propri dell'informatica per la risoluzione di problemi biologici. La genomica e la proteomica sono basate sulla Bioinformatica, per l'elaborazione, l'interpretazione e la visualizzazione dell'enorme quantità di dati che producono. La nuova era è iniziata con il Progetto Genoma Umano e con la produzione della sequenza completa del DNA umano e di altri organismi.

La Bioinformatica Necessità di interpretare la grande mole di dati collezionate dai biologi. DNA(memoria), RNA(comunicazione), Proteine(computazione-esecuzione) etc.. Quali parti del DNA controllano certi processi? Qual è la funzione di certe proteine?

I principali tipi di dati Biosequenze DNA, RNA, Proteine Strutture DNA, Secondaria dell'RNA, Secondaria e Terziaria delle proteine Dati di interazione DNA-Proteina, RNA-RNA, RNA-Proteina, Proteina-Proteina Livelli di espressione RNA (microarray) Proteine (protein array)

Esempio 1 In una sequenza proteica è possibile individuare regioni funzionalmente importanti. Ogni sequenza proteica è codificata da una sequenza genomica. Supponiamo che la regione X nel moscerino sia cruciale in una certa funzione. Domanda: esiste un analogo nell'uomo? Risposta: effettuando una ricerca per similarità della regione X nel genoma umano è possibile individuare dei geni candidati.

Esempio 2 Tutte le cellule di un individuo contengono lo stesso DNA. Eppure un neurone è molto diverso da un globulo bianco! Che cosa li rende così diversi nella forma e nella funzione? Sebbene il DNA sia lo stesso, esso contiene delle regioni importanti in tutte le cellule ed altre specifiche per alcune di esse. Mediante un'analisi del trascrittoma (microarray) è possibile stabilire quali regioni del DNA contengono informazioni relative al funzionamento di ognuna delle due cellule.

Esempio 3: Eyless e Aniridia: wet-biology Eyless è un gene della Drosophila melanogaster (moscerino della frutta) la cui rimozione (wet biology) causa la generazione di mosche senza occhi. I biologi hanno anche identificato un gene umano Aniridia la cui mancanza o eccessiva mutazione, tale da non far funzionare la corrispondente proteina, causa il mancato sviluppo dell’iride negli occhi.

Eyless e Aniridia: Bioinformatica Operiamo una query a NCBI dando come input a BLAST la biosequenza del gene Eyless e ricercando match con Aniridia. Il risultato mostra due regioni altamente simili. Il match è illustrato da una sequenza in mezzo alle due confrontate, contenente l’amminoacido nel caso di match perfetto, il segno + se c’è una similarità chimica (ad esempio D ed E sono acidi aspartico e glutammico), blank (cioè spazio vuoto) nel caso di NON MATCH.

QUERY BLAST EYLESS-ANIRIDIA

Match Parziale e NON Esatto Eyless ed Aniridia hanno match significativi solo nelle posizioni 24-169 e 398-477 di Eyless con le posizioni 17- 161 e 222-301 di Aniridia rispettivamente. Tutto il resto NON presenta match significativi. Tuttavia il match è significativo per cui possiamo dedurre proprietà dell’Aniridia da quelle del più conosciuto Eyeless (struttura, funzione,effetti sul fenotipo(caratteristiche visibili o misurabili) etc..)

Programma del corso Biologia molecolare: cellule, genomi ed evoluzione Biologia molecolare: RNA e trascrizione Biologia molecolare: La traduzione e le proteine Basi di dati biologiche Allineamento di sequenze Gene prediction Predizione della struttura secondaria dell’RNA RNA non codificanti: miRNA e siRNA Analisi del trascrittoma – Microarray Systems Biology e Network biologiche Sistemi per il mining di network biologiche Il linguaggio Perl

Cellule, genomi e Dogma della Biologia Molecolare La cellula Il Genoma Geni, pseudogeni, ripetizioni Struttura dei geni Il Dogma della Biologia Molecolare Trascrizione (DNA -> RNA) Traduzione (RNA -> Proteine)

Basi di dati biologiche Dati biologici e loro formati Sequenze biologiche Banche dati generiche NCBI, EMBL, DDBJ NCBI Entrez: Nucleotide, Protein, Gene EMBL Ensembl!

Allineamento di sequenze Omologia, similarità e distanza Funzioni di scoring e matrici di sostituzione Allineamento Pairwise: algoritmo di Needleman-Wunsch Allineamento Pairwise locale: BLAST, Smith-Waterman Allineamento Multiplo Funzioni di scoring: sum-of-pairs, entropia, circular sum Center star method Profili Allineamento progressivo: algoritmo di Feng-Doolittle ClustalW Metodi basati su consistenza: T-Coffee, ProbCons Valutazione di allineamenti multipli Motif finding

Il linguaggio Perl Perl Il linguaggio di scripting più utilizzato in Bioinformatica Interpretato Punto di forza: espressioni regolari Linguaggio "colla": utile nell'automatizzazione di esperimenti, test e nella conversione di formati

Gene prediction Modelli di Markov Nascosti (HMM) Metodi per la predizione di geni ORF Modelli statistici Individuazione di Esoni ed introni Tool per la predizione di geni GenScan

Predizione della struttura secondaria dell’RNA Rappresentazione di strutture secondarie Metodi probabilistici per la predizione Tool per la predizione della struttura dell’RNA MFold

Analisi del trascrittoma e Microarray Microarray technology Analisi di dati da microarray Cenni su protein array

RNA non codificanti e miRNA I miRNA Database di miRNA Predizione di geni miRNA Predizione di target per miRNA miRanda RNA interference e siRNA

Database specializzati NCBI Pubblicazioni scientifiche:Pubmed Profili di espressione: GEO Polimorfismi: dbSNP Interrogazione del DB via script: EUtils Browser genomici NCBI MapViewer UCSC Genome Browser miRNA miRBase, TarBase, miRò GO: Gene Ontology Pathways KEGG, Pathway Commons Ensembl! BioMart

Network biologiche Teoria dei grafi Misure di Centralità Classificazione delle network Clustering e metodi per l'identificazione dei clusters Network scale-free e gerarchiche Rilevamento della struttura modulare Algoritmi tradizionali Single linkage clustering Average linkage clustering Algoritmi basati su betweenness centrality (Girvan, Newman)

Sistemi per il mining di network biologiche Sistemi di visualizzazione di network Cytoscape Ricerca Netmatch Annotazione di network con miRNA miRScape