Bioinformatica Corso di Laurea Specialistica in Biologia Cellulare e Molecolare Ricerca pattern e di motivi funzionali 8/5/2008 Stefano Forte.

Slides:



Advertisements
Presentazioni simili
Università degli Studi G. DAnnunzio (Chieti – Pescara) Dipartimento di Scienze Storia dellinformatica Laurea in Economia Informatica Stefano Bistarelli.
Advertisements

Sistemi Operativi - Vi 1 Il sistema operativo LINUX Leditor vi Giorgio Di Natale Stefano Di Carlo Politecnico di Torino Dip. Automatica e Informatica.
Milano, 6 marzo 2008 Informazione logica e testuale Goffredo Haus LIM - Laboratorio di Informatica Musicale, scientific director Dipartimento di Informatica.
PHP.
Universita di Camerino
Dipartimento di Matematica
Informazioni sul Corso
Query OQL e XQUERY a confronto
RICERCA DI SIMILARITA’ IN BANCHE DATI
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Corso di Laurea Specialistica in Informatica Bioinformatica A. A
Università di Catania Facoltà di Scienze MM FF NN Laurea Specialistica in Chimica Curricula: Chimica dei Materiali Chimica per le Tecnologie Agroalimentari.
Bioinformatica Presentazione del Corso
Bioinformatica Prof. Mauro Fasano
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Le stringhe di caratteri in Java Anno Accademico 2009/2010.
Corso di Informatica Applicata - Lezione 3 - © 2005 Saverio De Vito Corso di Informatica Applicata Lezione 3 Università degli studi di Cassino Corso di.
Bioinformatica Corso di Laurea Specialistica in Biologia Cellulare e Molecolare Analisi di Dati di Espressione 6/5/2008 Stefano Forte.
Fogli elettronici - Spreadsheet
Fogli di Calcolo Elettronici Corso di Informatica Generale per SMID a.a. 2002/03 docente: Giorgio Delzanno (DISI)
Bioinformatica Andrea G. B. Tettamanzi.
Lezione 7 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
Corso di Laurea in Ingegneria per lAmbiente e il Territorio Informatica per lAmbiente e il Territorio Docente: Giandomenico Spezzano Tutor: Alfredo Cuzzocrea.
Introduzione ai fogli elettronici: EXCEL
Sistemi Operativi - Introduzione 1 Il sistema operativo UNIX Dettagli e comandi avanzati Niccolò Battezzati Politecnico di Torino Dip. Automatica e Informatica.
SELECT STATEMENT Clausola WHERE permette di limitare il numero di record da estrarre SELECT */ [DISTINCT] colonna/ espressione [alias],… FROM table [WHERE.
INSIEMI NUMERABILI L’analisi matematica introduce il concetto di insieme numerabile come insieme i cui elementi possono essere “contati” ossia che possiede.
4 Tipi di dati & variabili
ESERCITAZIONE PROSITE & INTERPRO. Prosite Elenco dei motivi in PROSITE.
Bioinformatica Per la laurea triennale in: Biologia Umana
Parte 4 Elementi di Informatica di base
SCAN PROSITE ExPASy proteomic tool.
AWK Salvatore Campagna
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
Laboratorio di Informatica1 Parte 4 Laboratorio di Informatica Dott.ssa Elisa Tiezzi Dott.ssa Elisa Mori.
In questa lezione ci occuperemo
Tutorial per l’utilizzo di k ScanProsite
Esercitazioni di Ingegneria del Software con UML
Laboratorio di Docimologia e Valutazione dell’apprendimento permanente
SEFOC – SETTORE FORMAZIONE CONTINUA DEL PERSONALE CORSO MYSQL AVANZATO ROBERTO PENNOLINO – CARMELO MASSIMO PRIOLO PALERMO – 07 | 06 | 2011.
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
TEORIE E TECNICHE DEL RICONOSCIMENTO
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
Cosa sono i Fogli Elettronici? Software applicativo nato dall’esigenza di –organizzare insiemi di dati tramite tabelle, schemi, grafici, ecc. –effettuare.
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Informatica e Bioinformatica Informazioni generali sul corso Corso di Laurea in Biologia Molecolare Università degli Studi di Padova AA
Linguaggi di programmazione: panoramica Linguaggi di programmazione ad alto livello: – –Programmazione procedurale – –Programmazione object oriented –
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
La parola “Bioinformatica”
Linguaggio C: Le basi Stefano Cagnoni e Monica Mordonini
Allineamento di sequenze
Accoppiamento scalare
Scratch.
Eprogram informatica V anno. Introduzione a PHP Introduzione La diffusione di PHP ha avuto un notevole incremento dalla fine degli anni Novanta a oggi,
Approfondimenti SQL.
“ Pseudocodice ” Un programma per computer lavorerà su in insieme di “ variabili ” contenenti i dati del problema, soluzioni intermedie, soluzioni finali.
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Laurea Specialistica “Metodologie Chimiche Avanzate” A.A Gabriele Ricchiardi Ricercatore/Chimica Fisica Tel.:
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
Corso di Biologia Molecolare I Pagina web.
CLASSE 059. PROF. GUGLIELMO RAINALDI DIPARTIMENTO DI BIOSCIENZE BIOTECNOLOGIE E BIOFARMACEUTICA TEL. 080/ CELL.
Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.
Activity diagrams Data & Control Flows Esempi
Esistono delle banche dati derivate simili a pfam, cioe’ banche dati in cui le proteine sono organizzate per famiglie ma che a differenza di pfam comprendono.
Fabio Rinnone Matricola 667/ Università di Catania Facoltà di SS. MM. FF. NN. Dipartimento di Matematica e Informatica Corso di Laurea di Primo Livello.
Accesso al corpus it. / ing. parola cercata sintagmi preposizioni.
Transcript della presentazione:

Bioinformatica Corso di Laurea Specialistica in Biologia Cellulare e Molecolare Ricerca pattern e di motivi funzionali 8/5/2008 Stefano Forte

Orario di ricevimento Stefano Forte Lunedi e Mercoledi – Ufficio 34 dipartimento di Matematica e Informatica (Sopra box bidelli) Tel

Ricerca di pattern e motivi funzionali Data una nuova sequenza, cosa si puo dire della funzione da essa codificata? Ua volta evidenziata, tramite un allineamento multiplo, una regione altamente conservata e possibile identificare nuove sequenze che abbiano regioni simili? La ricerca di pattern studia lorganizzazione e il disegno di sistemi che riconoscono motivi e regolarita nei dati a disposizione

Definizione di un motivo Un motivo e definito come un insieme di caratteri (nucleotidi o aminoacidi) non necessariamente contigui in sequenza, che si trovano sempre o spesso associati ad una precisa struttura o funzione biologica. Una sequenza consenso e un tipico esempio di motivo I motivi possono essere rappresentati utilizzando le espressioni regolari. Queste sono formule che si possono usare per definire pattern testuali.

Le espressioni regolari Le espressioni regolari sono composte da caratteri (nello stesso alfabeto su cui si definisce il pattern) e metacaratteri (altri caratteri a quali vengono attribuiti significati particolari. Esempi di metacaratteri. qualsiasi caratteri singolo * nessuna o piu occorrenze di qualsiasi carattere [abc] uno dei caratteri elencati dentrole parentesi $ fine stringa

Le espressioni regolari Ad esempio, lespressione regolare C*TT.A$ Identifica le stringhe: CGTTTA TTCGTTCGTTTA ACGTGTGGTGTTAA Ma non CTTGCA

Le espressioni regolari e i motivi Attraverso le espressioni regolari possiamo definire un motivo che identifica una o piu sequenze di caratteri. Le espressioni regolari specificano motivi di tipo deterministico: una sequenza puo contenere o non contenere il patter. Altre espressioni piu complesse possono specificare per motivi di tipo probabilistico, in cui esiste una certa associazione probabilistica tra un pattern e le sequenze associate ad una funzione

Motivi funzionali ideali e reali Un motivo funzionale e ideale se tutte le sequenze associate ad una funzione e soltanto le sequenze associate a quella funzione sono identificate dal motivo Il motivo funzionale e reale se identifica anche delle sequenze non associate a quella funzione o se esistono delle sequenze associate a quella funzione che non sono identificate dal motivo funzionale

Calcolare laffidabilita di un motivo Sensitivita =VP / (VP + FN) –Essa rappresenta la misura della proporzione di sequenze della famiglia selezionate dal motivo selettivita = VP / (VP + FP) –Misura la proporzione di sequenze della famiglia sul totale delle sequenze identificate dal motivo Specificita = VN / (VN + FP) –Misura la proporzione di sequenze che non fanno parte della famiglia che non vengono selezionate dal motivo

Scanprosite PROSITE consists of documentation entries describing protein domains, families and functional sites as well as associated patterns and profiles to identify them. The ScanProsite tool allows to scan protein sequence(s) against the PROSITE database. The user can provide either an UniProt Knowledgebase or Protein Data Bank (PDB) sequence identifier(s) (AC(s) or/and ID(s)) or a sequence(s) in fasta or UniProtKB format. By default the motifs to search for the occurrence are PROSITE patterns and profiles The ScanProsite tool also allows to search for hits by specific motif(s) in protein sequence database(s).

Scanprosite

Sintassi dei pattern di Scanprosite