Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
Bioinformatica Scienza osservativa o deduttiva?
Lo sviluppo delle Biotecnologie, che negli ultimi venti anni ha consentito di elevare la moderna biologia a "Big Science", e delle Scienze dell’Informazione, hanno introdotto nei settori delle moderne scienze biologiche una nuova branca di ricerca: la Bioinformatica. (Valle et al., 2003) Scienza osservativa o deduttiva?
2
La Bioinformatica nasce agli inizi degli anni ‘80 in concomitanza con lo sviluppo dei metodi di sequenziamento rapido degli acidi nucleici
3
Tecnologie del DNA ricombinante
Sequenziamento degli acidi nucleici strumenti informatici per l’immagazzinamento e la caratterizzazione dei dati.
4
Una grande quantità di dati
Databases 1.6 × 1010 base pairs (16 Gbp) Genoma umano 3.2 Gbp HUman Genome EquivalentS (huges) 2.5 volte il genoma umano
5
Grande quantità di dati
Traguardi immaginabili: Comprendere gli aspetti integrativi della biologia degli organismi Correlare la sequenza, la struttura, le interazioni e le funzioni di biomolecole e loro complessi Usare dati contemporanei per dedurre eventi evoluzionistici e prevedere future modificazioni Dare precise indicazioni per la progettazione di molecole bioattive (industria, agricoltura, medicina…)
6
Il nuovo dogma Sequenza Struttura Funzione
7
Archivi di dati Banche dati o basi di dati? Databank / Database
Messa a punto dei sistemi idonei per collezionare e interrogare l'enorme mole di dati biologici disponibili.
8
Archivi di dati Archivi di informazioni biologiche
Archivi di informazioni derivate Archivi bibliografici Archivi di siti web
9
Archivi di dati Archivi di informazioni biologiche Sequenze annotate
Strutture Pattern di espressione di proteine
10
Archivi di dati Archivi di informazioni biologiche
Archivi di informazioni derivate Patterns, signature, consensus motifs Mutazioni e varianti Classificazioni o relazioni (es. classificazione gerarchica della struttura di proteine)
11
Archivi di dati Archivi di informazioni biologiche
Archivi di informazioni derivate Archivi bibliografici Tutti i riferimenti bibliografici con link al pdf, se consentito
12
Archivi di dati Archivi di informazioni biologiche
Archivi di informazioni derivate Archivi bibliografici Archivi di siti web Archivi degli archivi di cui sopra Collegamenti tra archivi
13
Cosa possiamo chiedere al database?
Data una sequenza, trovare sequenze simili (string matching) Data la struttura di una proteina, trovare strutture simili Data una sequenza, trovare strutture simili Data una struttura, trovare sequenze che hanno strutture simili
14
The World Wide Web Client-server
15
Le principali infrastrutture
EBI, il laboratorio Europeo di Bioinformatica, NCBI, il National Center of Biotechnology Information, ExPASy, Expert Protein Analysis System,
16
Quali gli aspetti rilevanti dell’era post-genomica?
STUDI DI GENOMICA FUNZIONALE Caratterizzazione funzionale dei geni Umani e degli altri organismi modello mediante lo studio del TRASCRITTOMA e del PROTEOMA
17
Quali gli aspetti rilevanti dell’era post-genomica?
GENOMICA COMPARATA Analisi comparativa fra i genomi a supporto della Genomica Funzionale
18
Quali gli aspetti rilevanti dell’era post-genomica?
FARMACOGENOMICA Lo studio dell’influenza dell’eredità genetica sulla risposta al farmaco da parte di ciascun individuo.
19
Why do similarity search?
Similarity indicates conserved function Human and mouse genes are more than 80% similar at sequence level But these genes are small fraction of genome Most sequences in the genome are not recognizably similar Comparing sequences helps us understand function Locate similar gene in another species to understand your new gene Rosetta stone
20
Issues to consider Dealing with gaps Do we want gaps in alignment?
What are disadvantages of Many small gaps? Some big gaps?
21
Warning: similarity not transitive!
If 1 is “similar” to 2, and 3 is “similar” to 2, is 1 similar to 3? Not necessarily AAAAAABBBBBB is similar to AAAAAA and BBBBBB But AAAAAA is not similar to BBBBBB “not transitive unless alignments are overlapping”
22
Summary Why are biological sequences similar to one another?
Start out similar, follow different paths Knowledge of how and why sequences change over time can help you interpret similarities and differences between them
23
BLAST Basic Local Alignment Search Tool
Algorithm for comparing a given sequence against sequences in a database A match between two sequences is an alignment Many BLAST databases and web services available
24
Example BLAST questions
Which bacterial species have a protein that is related in lineage to a protein whose amino-acid sequence I know? Where does the DNA I’ve sequenced come from? What other genes encode proteins that exhibit structures similar to the one I’ve just determined?
25
Global vs. Local Global – both sequences aligned along entire lengths
Local – best subsequence alignment found Global alignment of two genomic sequences may not align exons Local alignment would only pick out maximum scoring exon
26
BLAST Overview Three heuristic layers: seeding, extension, and evaluation Seeding – identify where to start alignment Extension – extending alignment from seeds Evaluation – Determine which alignments are statistically significant
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.