Bioinformatica Andrea G. B. Tettamanzi
Programma del Corso Parte I – Elementi di Biologia, Biochimica e Genetica Caratteristiche strutturali di cellule pro- ed eucariotiche Chimica fisica delle molecole biologiche Replicazione, trascrizione e traduzione del messaggio genetico Parte II – Tecniche e algoritmi per la Biologia Molecolare Programmazione dinamica e string matching approssimato Pattern matching Algoritmi paralleli e parallelizzazione di algoritmi Parte III – Tecniche computazionali ispirate alla Biologia Algoritmi evolutivi
Docenti Andrea Tettamanzi (coordinamento, tecniche “bioispirate”) Anna Corazza (Tecniche di pattern matching su stringhe) Giorgio Colombo (simulazione e drug design) Ernesto Damiani (parallelismo) Sandro Fornili (Elementi di Biologia, Biochimica e Genetica) Giovanni Righini (Tecniche di programmazione dinamica) …
Bibliografia M.J. Farabee, On-Line Biology Book, 2001 D. Gusfield, Algorithms on Strings, Trees, and Sequences, Cambridge University Press, 1997 A. Tettamanzi, M. Tomassini, Soft Computing, Springer-Verlag, 2001 C.D. Manning, H. Schütze, Foundations of Statistical Natural LanguageProcessing, MIT Press, 1999 Z. Michalewicz, Genetic Algorithms + Data Structures = Evolution Programs, 3rd ed., Springer-Verlag, 1996 Th. Bäck, Evolutionary Algorithms in Theory and Practice, Oxford University Press, 1996 D.E. Goldberg, Genetic Algorithms in Search, Optimization, and Machine Learning, Addison Wesley, 1989
Ricevimento Studenti Mercoledì, dalle ore 14.00 alle ore 16.00 Per appuntamento: e-mail: tettamanzi@dti.unimi.it tel.: 03 73 89 82 48
Come nasce la Bioinformatica? Sforzi sperimentali per determinare la struttura e le funzioni di molecole biologiche Progetti di sequenziazione del genoma Masse di dati senza precedenti DB di biologia molecolare (geni e proteine) interpretazione Tecniche, strumenti, algoritmi per analizzare, confrontare, classificare
Dove si situa la Bioinformatica? Biologia Informatica Medicina Biotecnologie Società
Scopi della Bioinformatica Analisi di sequenze biologiche Ricerca di sequenze omologhe Identificare i geni, localizzare regioni di codifica Trovare “motivi”, siti di legame del DNA Biologia molecolare computazionale (simulazione) Sequenza Struttura Funzione Evoluzione Geni Conoscenza biologica (pathway metabolici, reti genetiche) Progettazione e gestione di DB di biologia molecolare DB di acidi nucleici e di proteine Immagazzinamento e recupero efficiente di informazioni Relazioni evolutive (filogenetica) Trovare le proteine comuni a tutte le forme di vita Costruire classificazioni e alberi filogenetici di specie e delle popolazioni umane
Applicazioni della Bioinformatica Sequenziazione e analisi del Genoma Analisi sperimentali con migliaia di geni simultaneamente DNA chips per analisi dell’espressione genica analisi comparative tra speci e sottospeci “Proteomica”, cioè trovare il proteoma di un organismo Farmaceutica e industria biotecnologica Applicazioni legali e forensi Applicazioni all’agricoltura (OGM & Co.) Medicina …
Bioinformatica in senso lato Paradigmi di calcolo ispirati alla biologia Sistemi di calcolo a base biologica (DNA computing etc.) Informatica Biologia Bioinformatica in senso stretto
Paradigmi di calcolo ispirati alla biologia (Bio-inspired Computing) Algoritmi Evolutivi Codifica genetica delle soluzioni Selezione naturale, mutazione, incrocio Genetica delle popolazioni Metodi di ottimizzazione stocastici Reti neurali Sistema nervoso centrale Parallelismo massiccio Emergenza Codifica come ‘pattern di attivazione’ Altri paradigmi Classifier systems, reti genetiche, ecc.
Sistemi di calcolo a base biologica: 1. Molecular computing
Sistemi di calcolo a base biologica: 2. DNA computing Codifica appropriata degli elementi del problema Soluzione a base di DNA in provetta Operazioni: Estrai, Unisci, Verifica, Amplifica