A.A. 2014-2015 CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Dr. Stefania Bortoluzzi
SVOLGIMENTO DEL CORSO Valle 16 Bortoluzzi I semestre del I anno Impegno didattico di 6 crediti: 32 ore di lezione frontale 32 ore di esercitazioni al computer Così suddivise: Insegnamento Lezione Esercitazione Valle 16 Bortoluzzi
esito delle esercitazioni verifica scritta individuale MODALITÀ D’ESAME Valutazione finale: esito delle esercitazioni verifica scritta individuale
WEB SITE DEDICATO AL CORSO http://compgen.bio.unipd.it/~stefania/Didattica/
ORGANIZZAZIONE DEL CORSO Valle Bortoluzzi Database e data retrieval (biosequenze, database secondari e di conoscenza, strutture) Allineamento di sequenze di acidi nucleici e proteine, matrici di sostituzione, metodi di allineamento esatto e euristici. Ricerca di similarità, BLAST. Allineamento multiplo di sequenze, Clustal Omega e Tcoffee. Evoluzione molecolare, determinazione delle distanze genetiche tra sequenze, filogenesi molecolare. Genome sequencing, assembly, and annotation. Genome resequencing. Risorse Genomiche (Navigare i genomi: NCBI, UCSC Genome Browser, ENSEMBL). Cenni su Metodi di mappaggio per l'analisi di dati NGS e transcriptome assembly. Genomica comparativa Metagenomica Predizione della struttura tridimensionale delle biomolecole. Folding delle proteine (metodi ab inizio, comparative modeling e threading) e degli RNA.
TESTI e materiali CONSIGLIATI Materiale lezioni Risorse e tutorial online Bioinformatica. Dalla sequenza alla struttura delle proteine Stefano Pascarella e Alessandro Paiardini Zanichelli 2014
Nature journal Issue of 4 2008 THE BIG DATA ERA “Researchers need to be obliged to document and manage their data with as much professionalism as they devote to their experiments.” Importance of data: Retrieval Integration Analysis Nature journal Issue of 4 2008 An at least basic knowledge of bioinformatic methods in unavoidable also for experimental researchers Bioinformatics from basic methods for managing biosequences to systems biology models
NIH BIG DATA to Knowledge (BD2K) With advances in technologies, investigators are increasingly generating and using large, complex, and diverse datasets. Consequently, the biomedical research enterprise is increasingly becoming data-intensive and data-driven. However, the ability of researchers to locate, analyze, and use Big Data (and more generally all biomedical and behavioral data) is often limited for reasons related to access to relevant software and tools, expertise, and other factors. D2K aims to develop the new approaches, standards, methods, tools, software, and competencies that will enhance the use of biomedical Big Data by supporting research, implementation, and training in data science and other relevant fields.
Importance of Bioinformatics Deep sequencing data analysis
ORARIO E AULE