Gene details Annotation Tracks official sequence comparisons SNPs NAVIGATING GENOMES By Genome Browsers.

Slides:



Advertisements
Presentazioni simili
Primary Italian Saying How You Are.
Advertisements

Trieste, 26 novembre © 2005 – Renato Lukač Using OSS in Slovenian High Schools doc. dr. Renato Lukač LinuxDay Trieste.
Sfogliandomi… Viaggio tra me e me alla scoperta dellaltro… A travel between me and myself discovering the other…
Centro Internazionale per gli Antiparassitari e la Prevenzione Sanitaria Azienda Ospedaliera Luigi Sacco - Milano WP4: Cumulative Assessment Group refinement.
L’esperienza di un valutatore nell’ambito del VII FP Valter Sergo
Cache Memory Prof. G. Nicosia University of Catania
Teoria e Tecniche del Riconoscimento
1. Web 1.0 al Web 2.0: come cambiano le modalità del comunicare, la società e la formazione 2. I nativi digitali chi sono e come apprendono: risultati.
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
Linked Data in Digital Library Nicola Ghirardi - Cineca StarHotels Excelsior Bologna, 23 Maggio 2013.
EUROPA TERRA DI MISSIONE. Flags of Europe This page contains flags and maps for Europe and its countries. European Union MAPS Europe 1 -- no flag references.
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
The lac operon gal operon Glucose-1-phosphate
Bioinformatica BioPerl Dr. Giuseppe Pigola –
Outline Gene Finding: Struttura ed identificazione di geni in procarioti ed eucarioti; Hidden Markov Models; Genscan; Dept. of Mathematics and Computer.
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
1.E un algoritmo ricorsivo: Tutti le istanze di oggetti raggiungibili da un oggetto persistente diventano anchessi persistenti.
© and ® 2011 Vista Higher Learning, Inc.4B.1-1 Punto di partenza Italian uses two principal tenses to talk about events in the past: the passato prossimo.
Sta andando meglio? oppure ti senti uguale? Is it getting better? Or do you feel the same?
MySQL Esercitazioni. Ripasso Connessione a MySQL. Creazione delle basi di dati e delle tablelle. Inserimento dei dati. Interrogazioni.
Raffaele Cirullo Head of New Media Seconda Giornata italiana della statistica Aziende e bigdata.
prompt> java SumAverage
LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: Pubmed CENTRO DI BIOTECNOLOGIE SETTORE DOCUMENTAZIONE BIOMEDICA A.O.R.N. A.CARDARELLI- NAPOLI Prof.ssa.
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
Ergo : what is the source of EU-English? Standard British English? Standard American English? Both!!!! See morphology (use of British.
1. Conoscere luso delle collezioni in Java Comprendere le principali caratteristiche nelle varie classi di Collection disponibili Saper individuare quali.
NLM - National Library of Medicine NLM - National library of Medicine Che cosè? Dove? Bethesda, MD, USA Affiliazione: –Department of Health and Human.
Watson et al. , BIOLOGIA MOLECOLARE DEL GENE, Zanichelli editore S. p
Chistmas is the most loved holiday of the years. Adults and children look forward to Chistmas and its magical atmosphere. It is traditional to decorate.
Players: 3 to 10, or teams. Aim of the game: find a name, starting with a specific letter, for each category. You need: internet connection laptop.
FUNZIONI DI GRUPPO Le funzioni di gruppo operano su un set di record restituendo un risultato per il gruppo. AVG ([DISTINCT|ALL] n) media, ignora i valori.
Mobile e Social per portare traffico nei negozi H&m Isabella Federico.
Project Review byNight byNight December 6th, 2011.
THE BIG DATA ERA Researchers need to be obliged to document and manage their data with as much professionalism as they devote to their experiments. Nature.
Funzioni stringhe. chr Restituisce il carattere di un valore ascii dato. Per vedere lelenco dei codici ascii clicca QQQQ uuuu iiiiEsempio
Corso di Laurea in Biotecnologie Sanitarie
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Project Review byNight byNight December 21th, 2011.
Project Review byNight byNight December 6th, 2011.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Project Review byNight byNight December 5th, 2011.
SPLICING eliminazione introni unione esoni esone1 introne1 esone2
III LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Ricerca di similarita’ con sequenze genomiche: BLAT.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Uso di Genome Browser per l'annotazione di sequenze genomiche.
BY: ERIC B. Italian Fashion Project. Italian And American clothing brands are different in many ways In this presentation, I am going to explore the similarities.
Analysis and Development of Functions in REST Logic: Application to the «DataView» Web App UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO.
Collection & Generics in Java
PLURALI - with NOUNS PAY ATTENTION TO THE ENDING OF THE NOUN! “O” ---> “I” ex) il quaderno -> i quaderni “A” ---> “E” ex) la matita -> le matite “E” --->
"We firmly believe that the on-the-run issues should command a high liquidity premium in the current environment. But with very high probability, the.
Regolazione della traduzione generale specifica.
Teorie e tecniche della Comunicazione di massa Lezione 7 – 14 maggio 2014.
Italian 6 Preparation for Final Exam Signorina Troullos.
La DNA Polimerasi può commettere errori Nei batteri: 1 errore ogni 10 9 basi in ogni generazione.
Guida alla compilazione del Piano di Studi Curricula Sistemi per l’Automazione Automation Engineering.
CESANELLA PRIMARY SCHOOL SENIGALLIA - ITALY PLAYGROUND GAMES ELASTIC -ELASTIC -ELASTIC -ELASTIC -ELASTIC - ELASTIC - ELASTIC - ELASTIC - ELASTIC - ELASTIC.
Well and Truly by Roni Horn. Mind map Artist’s name Techniques Life Groupworks Artworks My opinion Her message My artwork inspiried by…
Buon giorno Io sono Professoressa Kachmar. Buon giorno Io sono Professoressa Kachmar.
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.
Docenti: Dr. Stefania Bortoluzzi, Dr Alessandro Coppe Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Viruses.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Bioinformatica Scienza osservativa o deduttiva?
Accesso al corpus it. / ing. parola cercata sintagmi preposizioni.
(A) Structural models of all published Mcr proteins (Mcr-1 to -8) and Mcr-9, based on lipooligosaccharide phosphoethanolamine transferase EptA. (A) Structural.
Transcript della presentazione:

gene details Annotation Tracks official sequence comparisons SNPs NAVIGATING GENOMES By Genome Browsers

V LEZIONE Navigare le sequenze genomiche NCBI Map View UCSC Genome Browser UCSC BLAT ENSEMBL VEGA

PROGETTO GENOMA UMANO Milestones: 1990: Inizio (U.S. Department of Energy and the National Institutes of Health) Giugno 2000: Completamento della sequenza working draft dellintero genoma umano Febbraio 2001: Pubblicazione prime analisi sul genoma completo Aprile 2003: Completamento della sequenza

Una sequenza viene detta finita quando presenta un livello di errore inferiore a 1/10000 basi e non ha gaps. Il Progetto Genoma Umano era complesso dal punto di vista tecnico ma anche dal punto di vista computazionale. Loutput di una singola reazione di sequenza (read) = bp Tutti i singoli frammenti dovevano essere assemblati in una singola stringa lineare. NCBI fornisce ora lassembly di riferimento per i 3 principali portali genomici: MapView Ensembl Genome Browser

La sequenza primaria del genoma non è sufficiente… Annotazione del genoma E necessario riportare sullassembly le informazioni e i dati sperimentali già ottenuti. Riconciliare e integrare lassembly con le mappe fisiche, genetiche e citogenetiche Gli STS sono mappati sulla sequenza usando e-PCR La corrispondenza con la mappa citogenetica utilizzando FISH sistematica di BAC. Lannotazione dei geni è attuata con metodi leggermente diversi dai 3 genome browser –LNCBI allinea mRNA di RefSeq, mRNA di GenBank utilizzando MegaBlast. –Ensembl allinea tutte le proteine umane note di SP/Trembl utilizzando un suo algoritmo –UCSC allinea mRNA di Refseq e GenBank e dalle ultime release SP/Trembl con BLAT

Annotazione dei geni ab initio, in base a sensori, funzioni che tentano di dedurre la presenza di una caratteristica genica in base a motivi o proprietà statistiche del DNA. –Sensori per TSS (G+C) –Sensori per siti splicing (AG-GT) –Sensori che misurano la composizione in basi di esoni putativi Loutput dei vari sensori è combinato per generare un modello genico metodi basati sulla similarità: lallineamento di una regione genomica con un cDNA o un EST sono una buona evidenza. Lo splicing alternativo complica linterpretazione degli allineamenti tra DNA genomico, cDNA e ESTs I dati di similarità sono incompleti: trascritti poco espressi o espressi transientemente sono assenti… I programmi di ultima generazione come Grail/Exp, Genie EST, GenomeScan combinano predizioni ab inizio con dati di similarità ottenendo risultati migliori

Viral Genomes

3 milioni di basi in formato testo = nessuna utilita Servono: Annotazione dellinformazione sulla sequenza Possibilita di recuperare velocemente la sequenza di regioni specifiche del genoma in base a criteri di Contenuto di informazione Caratteristiche di sequenza Genomi disponibili Human Homo sapiens assembly 99% delle regioni contenenti geni accuratezza 99.99% 2.84 Gb finite highly contiguous Species A. gambiae A. mellifera C. briggsae C. elegans C. intestinalis Chicken Chimp Cow D. ananassae D. erecta D. grimshawi D. melanogaster D. mojavensis D. persimilis D. pseudoobscura D. sechellia D. simulans D. virilis UCSC Genome Browser Sistema per la navigazione della sequenza e dellannotazione di genomi, che permette la visualizzazione dellinformazione a diverso ingrandimento ed il recupero di porzioni di sequenza con associate le informazioni di annotazione, come: Geni noti e geni predetti ESTs, mRNAs Isole CpG assembly gaps e coverage, bande cromosomiche Omologia con altri genomi … D. yakuba Dog Fugu Human Mouse Opossum Rat Rhesus S. purpuratus SARS Tetraodon X. tropicalis Yeast Zebrafish

UCSC Genome Browser Molte possibilita per la ricerca di una regione specifica: chr7 un cromosoma intero 20p13 una regione (banda p13 del cr. 20) chr3: il primo milione di basi del cr. 3 dal ptel D16S3046 regione intorno al marcatore (100,000 basi per lato) RH18061;RH80175 regione tra i due marcatori AA regione genomica che si allinea con la sequenza con questo GB accession number PRNP regione del genoma che comprende il gene PRNP NM_ NP_ (LLID) Oppure di liste di regioni: pseudogene mRNA Lists transcribed pseudogenes, but not cDNAs homeobox caudal Lists mRNAs for caudal homeobox genes zinc finger Lists many zinc finger mRNAs huntington Lists candidate genes associated with Huntington's disease

Overview of the whole Genome Browser page (mature release) } Genome viewer section mRNA and EST Tracks Expression and Regulation Comparative Genomics ENCODE Tracks Variation and Repeats Groups of data Mapping and Sequencing Tracks Genes and Gene Prediction Tracks

Sample Genome Viewer image, BRCA1 region Genome backbone STS markers Known genes RefSeq genes Gene predictions GenBank mRNAs repeats GenBank ESTs conservation SNPs MGC clones

Annotation Track options, defined Hide: removes a track from view Dense: all items collapsed into a single line Squish: each item = separate line, but 50% height + packed Pack: each item separate, but efficiently stacked (full height) Full: each item on separate line

Clicking an annotation line, new page of detailed information You will get detail for that single item you click Example: click on the BRCA1 Black Known Genes line Click the line New web page opens Many details and links to more data about BRCA1

Click annotation track = BRCA1 Known gene detail page informative description other resource links microarray data mRNA secondary structure links to sequences protein domains/structure homologs in other species Gene Ontology descriptions mRNA descriptions pathways Not all genes have This much detail. Different annotation tracks carry different detail data. SNP detail page sample

Getting the sequences Get DNA, with Extended Options; or Details pages Use the DNA link at the top Plain or Extended options Change colors, fonts, etc.

Accessing the BLAT tool Rapid searches by INDEXING the entire genome Works best with high similarity matches BLAT = BLAST-like Alignment Tool

BLAT tool overview: Submit Make choices DNA limit bases Protein limit aa 25 total sequences Paste one or more sequences Or upload

BLAT results, with links Results with demo sequences, settings default; sort = Query, Score –Score is a count of matcheshigher number, better match sorting Click browser to go to Genome Browser image location (next slide) Click details to see the alignment to genomic sequence (2 nd slide)

BLAT results, alignment details browser From browser click in BLAT results A new line with your Sequence from BLAT Search appears! query matches Click to flip frame Watch out for reading frame! Click > to flip frame Base position = full and zoomed in enough to see amino acids

BLAT results, alignment details Your query Genomic match, color cues Side-by-side alignment

Ensembl Genome Browser

NCBI Map Viewer

UCSC Genome Browser

What Distinguishes Ensembl from the UCSC and NCBI Browsers? The gene set. Automatic annotation based on mRNA and protein information. Programmatic access via the Perl API (open source) BioMart Integration with other databases (DAS) Comparative analysis (gene trees)

VEGA ED ENCODE: annotazione dettagliata dei genomi I Genome Browsers di cui abbiamo parlato sono basati essenzialmente sui risultati di analisi computazionali volte allintegrazione di dati ed al riferimento di queste ai genomi. Altri database collegati a Browsers genomici sono legati a progetti sperimentali per una maggiore caratterizzazione funzionale di elementi di DNA (ENCODE) o prevedono comunque una fase supplementare di curation manuale dei dati relativi a geni e trascritti (VEGA).