MODELLAMENTO QSAR E PREDIZIONE DELLA TOSSICITA’ DI FENOLI

Slides:



Advertisements
Presentazioni simili
Equazioni e calcoli chimici
Advertisements

Selezione delle caratteristiche - Principal Component Analysis
X Conferenza nazionale di statistica Unità di valutazione degli investimenti pubblici Roma, 16 dicembre 2010 COME RENDERE LA STATISTICA IMPORTANTE PER.
TERRENI DI COLTURA.
Inquinamento atmosferico e traasporto stradale in Europa. Una analisi di cluster e di regressione tra nazioni e città Romeo Danielis Università degli Studi.
Introduzione alle misure strumentali
Il codice neurale.
Fisica: lezioni e problemi
Pierangelo Degano, Emanuel Castellarin, Laura Passaponti
ANALISI DELLA COVARIANZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
On the sources of convergence: A close look at the Spanish regions (Angel de la Fuente) A cura di De Rose Daniela A.A
Apprendimento Non Supervisionato
Paola Gramatica1, Antonio Di Guardo2 ed Ester Papa1
Centro Grafico by S. Sciacovelli Presentazione N° 1 FARMACODINAMICA RAPPORTI TRA ATTIVITA E STRUTTURA (SAR)
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
Laurea Specialistica Chimica e Tecnologia Farmaceutiche Anno Accademico Università degli Studi di Firenze Facoltà di Farmacia.
Università degli Studi di Firenze
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
Scene Modelling, Recognition and Tracking
Introduzione all’algebra lineare
La relazione sulla prima esperienza di laboratorio
Analisi dei gruppi – Cluster Analisys
Linee guida per la Chimica Analitica Statistica chemiometrica
UN DISEGNO PER LA CHIMICA
STATISTICA PER LE DECISIONI DI MARKETING
STUDIO COMPARATO TRA DUE PROCESSI DI CONCIA AL CROMO A BASSO CONTENUTO SALINO SENZA BAGNO E IL PROCESSO CLASSICO J.M. Morera(*), A. Bacardit, Ll. Ollé,
I principali tipi di grafici
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Modelli predittivi delle agenzie di rating internazionali: il modello MEU evoluto (maximum expected utility) Mattia Ciprian*, Daria Marassi°, Valentino.
Unità didattica: Le soluzioni
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
COVARIANZA e CORRELAZIONE.
UNIVERSITÀ DI PISA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA PER LA GESTIONE D’AZIENDA Tesi di laurea: Progettazione.
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
Tesina Titolo, autori Introduzione Apparato sperimentale
ROCK A Robust Clustering Algorithm for Categorical Attributes Sudipto Guha, Rajeev Rastogi, Kyuseok Shim Sistemi Informativi per le Decisioni a.a. 2005/2006.
Perceptron. è la somma effettuata sul nodo i-esimo dello strato j n è il numero di nodi dello strato j-1 è l'output proveniente dal nodo k-esimo dello.
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.
Fisica: lezioni e problemi
Software per la valutazione dell’inquinamento elettromagnetico Giurato Marta A.A. 2012/2013.
Grandezze e Misure
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Il residuo nella predizione
IL CAMPIONE.
Teoria Cellulare La cellula è l’unità strutturale e funzionale della materia vivente Tutti gli organismi viventi sono costituiti da una o più cellule*
RETI NEURALI - 2.
Misure di fotocorrelazione in sistemi colloidali carichi Daniele Di Pietro.
Tecniche di analisi matematica. Gli studi di autenticazione e di tracciabilità sugli alimenti sono generalmente effettuati individuando variabili chimico-fisiche.
Elementi di statistica Le cifre significative
Jacopo Nicolò Toffanetti
NiXuS srl1 Training Galco Italia 22 Gennaio 2000 pMeter Software per l’analisi delle performance aziendali. N I X U S srl Via G. Scarabelli Roma,
Il destino dei farmaci nell’organismo
TRATTAMENTO STATISTICO DEI DATI ANALITICI
I GRUPPI FUNZIONALI.
I GRAFICI – INPUT 1.
LA MATERIA E’ TUTTO CIO’ CHE POSSIEDE MASSA, OCCUPA SPAZIO E POSSIEDE ENERGIA Secondo la teoria atomica la materia è costituita da piccole particelle dette.
  Disegno assistito dal computer STRATEGIE PER LA RICERCA DEI NUOVI LEADS Computer-assisted design utilizza la chimica computazionale per al scoperta.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
Regressione lineare Misure Meccaniche e Termiche - Università di Cassino2 Distribuzioni Correlate Una variabile casuale z, può derivare dalla composizione.
Ottimizzazione dei terreni di coltura Metodi statistici.
Acidimetria.
Milano Chemometrics and QSAR Research Group
Transcript della presentazione:

MODELLAMENTO QSAR E PREDIZIONE DELLA TOSSICITA’ DI FENOLI Francesca Battaini, Ester Papa e Paola Gramatica Unità di ricerca QSAR e di Chimica Ambientale, Dipartimento di Biologia Strutturale e Funzionale, Università degli Studi dell’Insubria (Varese) Web: http://fisio.dipbsf.uninsubria.it/qsar/ e-mail: paola.gramatica@uninsubria.it INTRODUZIONE I fenoli sono composti chimici in grado di persistere nei diversi comparti ambientali e di penetrare facilmente negli organismi espletando la loro azione tossica. Ampiamente utilizzati anche come precursori di molti prodotti, fanno parte degli HPV (High Production Volume Chemicals), sostanze prodotte in quantità superiore alle 1000 tonnellate/anno, per le quali, come richiesto dal recente White Paper dell’Unione Europea [1], è necessario conoscere proprietà chimico-fisiche e tossicità entro il 2005. La loro tossicità è stata oggetto di ampi studi su diversi end-point, ma evidentemente non sono disponibili dati sperimentali per tutti i fenoli e per tutti gli organismi. Il lavoro svolto ha lo scopo di produrre modelli che predicono in modo quantitativo, basandosi sulla struttura delle molecole (QSAR-Quantitative Structure-Activity Relationship), la tossicità di questi composti allo scopo diminuire il lavoro sperimentale necessario per l’ottenimento di tali dati. DESCRITTORI MOLECOLARI La struttura molecolare dei composti utilizzati è stata rappresentata usando diversi descrittori molecolari calcolati con il software DRAGON di R.Todeschini [2]. L’ampio set di descrittori comprende: DATI In questo lavoro sono stati utilizzati i dati di tossicità misurati in Tetraymena pyriformis, protozoo ciliato, per 98 fenoli, variamente sostituiti, ottenuti dalla letteratura [3]. I valori sono espressi in mM/l e in scala logaritmica come il log dell’inverso della IGC50(concentrazione che inibisce la crescita nel 50% della popolazione).  descrittori 0D – descrittori costituzionali  descrittori 1D – ricavati dalla formula bruta della molecola (descrittori empirici, gruppi funzionali, proprietà e frammenti)  descrittori 2D – determinati dal grafo molecolare (descrittori topologici, di autocorrelazione, BCUTs ed indici di Galvez)  descrittori 3D – derivati dalle coordinate spaziali (descrittori geometrici, di carica, di aromaticità, WHIMs, GETAWAY, RDF e 3D-MoRSE). A questi descrittori è stato aggiunto il coefficiente di ripartizione ottanolo/acqua (Log Kow) che fornisce una misura della lipofilicità delle molecole. SELEZIONE DEL TRAINING TEST METODI CHEMIOMETRICI Sono state applicati diversi metodi chemiometrici per selezionare un training set ottimale per i modelli QSAR. Queste tecniche sono:  l’Analisi delle Componenti Principali (PCA): questa analisi permette di concentrare l’informazione di un grande numero di variabili in un numero esiguo di componenti tra loro ortogonali e di identificare gli oggetti che fanno parte di classi e gli outliers. Le componenti più significative sono state utilizzate nella Cluster Analysis e nelle Mappe di Kohonen per eliminare l’informazione ridondante.  la Cluster Analysis: in questo lavoro è stata usata un’analisi di tipo agglomerativo dove le variabili sono rappresentate dalle componenti significative dei descrittori molecolari. Per trovare il miglior modo di raggruppare i composti sono state usate due formule di distanza (Euclidea e di Manhattan) e diversi metodi per determinare la similarità tra i nuovi cluster (Complete, average, ecc.).    le Mappe di Kohonen: le reti neurali artificiali sono un altro modo di raggruppare gli oggetti simili in cluster usando “self organised topological feature maps”, con questa analisi l’informazione multidimensionale viene visualizzata in un grafico bidimensionale. La posizione dei composti nelle celle della mappa mostra il livello di similarità tra le strutture dei fenoli presi in esame. La selezione del training set è stata effettuata mediante la selezione per ogni cella dell’oggetto più caratteristico cioè quello più vicino al centroide. MODELLI DI REGRESSIONE LINEARE OTTENUTI CON UN TRAINING SET DI 55 OGGETTI (test set di 43 oggetti) MODELLI DI REGRESSIONE - MLR La selezione delle variabili più correlate alla risposta e più predittive è stata realizzata con il metodo dei minimi quadrati ordinari (OLS) e con la tecnica dell’Algoritmo Genetico (GA-VSS). I modelli sono stati validati con diversi metodi:  Leave-one-out- viene escluso dal training un oggetto alla volta e predetto  Leave-more-out- viene escluso casualmente il 50% delle molecole del training Y-scrambling- ottenuta mediante una permutazione casuale delle risposte  Validazione esterna- verificata su un test esterno di validazione I descrittori più importanti risultano essere il Log Kow che è legato alla lipofilia della molecola e, quindi, alla capacità di quest’ultima di attraversare le membrane biologiche determinando una tossicità di base; Ui che indica il livello di insaturazione e C-X che indica il numero di frammenti contenenti alogeni. Fattori di polarità che risultano quindi essere importanti nel rappresentare la tossicità potenziale dei fenoli. CONCLUSIONI I modelli ottenuti, riassunti in tabella, hanno buone capacità predittive; il coefficiente di ripartizione ottanolo/acqua, ampiamente utilizzato per modellare la tossicità di composti chimici, si dimostra un buon descrittore, ma può essere validamente affiancato da altri descrittori molecolari teorici, calcolabili quindi anche per molecole non ancora sintetizzate, dando luogo a modelli altamente predittivi. Il lavoro è stato realizzato con fondi della Comunità Europea (progetto BEAM). Si ringrazia Federchimica per la borsa di studio a Francesca Battaini (progetto H.E.L.E.N). RIFERIMENTI BIBLIOGRAFICI [1] White Paper on the strategy for a future Chemicals Policy. www.europa.eu.int/comm/environmental/chemicals/whitepaper.htm [2] Todeschini, R., Consonni, V. e Pavan, E. 2001. DRAGON – Software for the calculation of molecular descriptors, rel. 1.12 for Windows [3] Schultz,T.W. et all. Quantitative structure-activity relationships for the Tetrahymena piryformis population growth end-point: a mechanism of action approach. Practical Application of QSAR in Environmental chemistry and toxicology, 241-262 (1990)