09/05/03 1 Data Minig: clustering con Reti di Kohonen DATA MINING Clustering e Reti di Kohonen.

Slides:



Advertisements
Presentazioni simili
Sistema Informativo per la Sanità
Advertisements

Biochimica Clinica Anni 2008/2009 Chiara Cesano
X Conferenza nazionale di statistica Unità di valutazione degli investimenti pubblici Roma, 16 dicembre 2010 COME RENDERE LA STATISTICA IMPORTANTE PER.
Parma, 15 aprile 2009 Relatore : Giuseppina Rossi
Presentazione del corso Paolo Atzeni 2/03/2012
Maria Vizioli Sabine Mall Roberto Grilli
SISTEMA INFORMATIVO AZIENDALE
Disciplina C.I. - A.4 - Settore scientifico disciplinare:
SISL - Servizi rivolti alla PA Governo, monitoraggio e statistiche.
Il bambino il pediatra la scuola Genova 24 marzo 2007 Il sistema di sorveglianza delle malattie infettive nellASL3 Genovese Il bambino il pediatra la scuola.
ON LINE ANALYTICAL TRANSACTION PROCESSING (OLAP)
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
MILLEGPG uno strumento per migliorare e migliorarsi
Architettura Three Tier
La disposizione a valutare il campione di popolazione che è assistito dal singolo medico è sufficiente per condurre una ricerca clinica autonoma? Quale.
Fasi del processo decisionale prescrittivo: analisi (I) 1 -Valutazione e decisione terapeutica Attori coinvolti a vario titolo: specialista ospedaliero,
1 CSI-Piemonte C onsorzio per il S istema I nformativo Il Sistema Unitario Regionale degli Sportelli Unici Giovanni Gallia Direzione Attività Produttive.
Presentazione del corso Paolo Atzeni 1/03/2011
Basi di dati II Presentazione del corso (include la presentazione di Tecnologia delle basi di dati, corso attivo fino al e sostituito.
Azienda Sanitaria Locale della provincia di Brescia.
Data Mining Introduzione.
1 10/10/2003Seminario Simulazione Sanità CSI-Piemonte C onsorzio per il S istema I nformativo Basi di dati e architetture decisionali per la Sanità piemontese.
1 10/10/2003Seminario Simulazione Sanità CSI-Piemonte C onsorzio per il S istema I nformativo Basi di dati e architetture decisionali per la Sanità piemontese.
Perché STANDARDIZZARE ?
SIMG PE Software della raccolta dati in MG Regione Abruzzo A cura di PIO PAVONE.
Data mining for e-commerce sites
Il sito web di una casa editrice Alcune considerazioni.
Intelligenza Artificiale
LSA - Laboratorio di Sistemi Informativi Economico-Aziendali
UNIVERSITA’ POLITECNICA DELLE MARCHE
MEDICI DI MEDICINA GENERALE E PEDIATRI DI LIBERA SCELTA
Ministero dellIstruzione, dellUniversità e della Ricerca Servizio per lAutomazione Informatica e lInnovazione Tecnologica – Ufficio di Statistica -VII.
PROVE DI AGGREGAZIONE FUNZIONALE TERRITORIALE
Giugliano in Campania (NA) in collaborazione con l’ASL NA 2
1 w w w. g a t 4. c o m WI GAT WebIngelligence rappresenta una piattaforma funzionale e tecnologica per la creazione e gestione di un datawarehouse che.
Data Warehouse Territoriale
Farmacologia VIII modulo Farmaci LASA David Coletta Farmacologia B.3 1.
Prevenzione cardiovascolare
ReportER: strumento per il supporto al processo decisionale regionale Sistema Informativo Politiche per la Salute e Politiche Sociali Bologna 16/05/2014.
Convegno “Dall’infezione HPV alla gestione del pap test anomalo e delle patologie HPV correlate” Introduzione ai lavori Dott.ssa Fiorenza Cartellà Coordinatore.
QMAN Queue Manager Documentazione Commerciale Presentazione prodotti.
RESP.LE SCIENTIFICO F.I.M.M.G.
Percorso Diagnostico-Terapeutico (PDT)
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
Monitoraggio e miglioramento della spesa farmaceutica: audit sull’uso dei farmaci respiratori in pediatria nell’ anno 2010 nella ASL di Salerno Salerno,
SCHEDA INFORMATIVA DI UNITÀ
Metodi per l’integrazione tra la base dati Health Search e l’indagine Istat sulle condizioni di salute Marco Di Zio Di Consiglio L., Falorsi S., Solari.
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
FORUMPA 2006 Strumenti ICT per il supporto alle decisioni e al sistema dei controlli Roma 09/05/2006 Sistemi decisionali della città di Torino e loro integrazione.
Sistemi di supporto alle decisioni aziendali Obiettivi generali del corso.
PART 3: DATA ANALYSIS THROUGH OMNIFIND. Il cliente: una sorgente importante di informazioni Mercato iper-competitivo, altamente caotico. Cliente al centro.
Miner 3D Sistemi Informativi per le decisioni Professore Ing. Marco Patella Anno accademico Presentazione a cura di Di Leo Valentina - Palmieri.
By: Powered by:. Tecnologia Microsoft La soluzione CCAnalyzer utilizza la tecnologia OLAP (On Line Analytical Processing) di Microsoft presente nel software.
Analisi discriminante lineare - contesto
DATA MINING.
La segmentazione comportamentale nel mercato finance Bologna, 21 novembre 2003 © 2003, SPSS Italia & SPSS Inc. Michele Crescenzi, Ph.D. CRM and Data Mining.
INFORMATICA MEDICA.
Esercizio 1. Quesiti esercizio 1 Distribuzione congiunta: dalla definizione di distribuzione condizionale.
SEGMENTAZIONE del mercato.
Literature mining.  Data mining Processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l’applicazione di algoritmi che individuano.
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
Forum PA Criteri e metodologie per le linee guida sui progetti di riuso Renzo Marin Progetto CRC – CNIPA/Formez Forum PA – 10 maggio 2005.
1 LA FARMACOVIGILANZA ATTIVA NELLA REGIONE EMILIA-ROMAGNA Bologna 18 Novembre 2009 Dipartimento Farmaceutico Interaziendale Dott. Stefano Bianchi Area.
Ciclo attivo. n Insieme delle attività con cui i prodotti dell’azienda vengono portati nelle mani dei clienti in cambio dell’equivalente valore monetario,
Le informazioni strategiche dell’Azienda Business Intelligence.
Il pretrattamento La fase di pretrattamento nel DM è pesante e delicata Oltre ai problemi connessi con i valori mancanti e alla mancanza di alcune informazioni.
Data warehouse(B.2.8) Nei database ci sono molti dati di tipo diverso e ciascuna tipologia di dato può avere un formato diverso. Alcuni provengono da legacy.
ARPA - Regione Piemonte Implementazione sistema informativo acque Gruppo di miglioramento 4 – 5 ottobre 2012 Maria Antonietta Sanna Massimo Marighella.
ROMA 23 GIUGNO 2016 LABORATORIO NUMERACY Big data nel settore assicurativo e sanitario LABORATORIO NUMERACY Big Data. Metodi statistici per la società.
Transcript della presentazione:

09/05/03 1 Data Minig: clustering con Reti di Kohonen DATA MINING Clustering e Reti di Kohonen

09/05/03 1 Data Minig: clustering con Reti di Kohonen Cos'è il Data Mining: Traduzione letterale: Data : informazione To mine : scavare,estrarre Processo di estrazione di conoscenza (nell'ambito del KDD,knowledge discovery in databases) che sfrutta diverse metodologie statistiche e informatiche,che in particolare permette di trattare GRANDI QUANTITA' DI DATI.

09/05/03 1 Data Minig: clustering con Reti di Kohonen DM a confronto con tecniche informatiche e statistiche tradizionali: Si affianca agli strumenti informatici di Query e Reporting -> Olap -> DATA MINING Statistica classica: approccio top-down(analisi confermative) fatti conosciuti a priori DM: approccio bottom-up(esplorativo) ricerca di informazioni utili spesso non note a priori,nascoste

09/05/03 1 Data Minig: clustering con Reti di Kohonen Metodologie: Analisi Associazioni : Basket analysis(Probabilità) Modelli Previsivi : Regressione lineare(Statistica),Alberi Decisionali e Reti Neurali(Intelligenza Artificiale) Clustering : Reti di Kohonen(IA) e K-medie (Statistica) Altri : Algoritmi genetici, Reti bayesiane, Serie temporali...

09/05/03 1 Data Minig: clustering con Reti di Kohonen Le fasi di un processo di Data Mining: a) Definizione obiettivi b) Selezione,organizzazione e trattamento dei dati c) Analisi esplorativa dei dati d) Scelta del modello applicativo e) Elaborazione f) Valutazione ed interpretazione dei risultati ottenuti g) Ritorno a punto a) SEMMA:sample, explore, model, modify, assess.

09/05/03 1 Data Minig: clustering con Reti di Kohonen Principali software suites commerciali: IBM Intelligent Miner SPSS Clementine SAS Enterprise Miner TERADATA Warehouse Miner

09/05/03 1 Data Minig: clustering con Reti di Kohonen Link: (eng) (eng) www:// (fra,eng) (ita)

09/05/03 1 Data Minig: clustering con Reti di Kohonen Testi: Mastering data mining, Berry,Linoff (Wiley) Knowledge discovery and DM, Bramer (Iee Books) Data mining, Berry,Linoff (Apogeo) Data mining, Giudici (Mcgraw-Hill) DM Webmining e crm, Tassinari,Camillo (FrancoAngeli)

09/05/03 1 Data Minig: clustering con Reti di Kohonen CSI-Piemonte C onsorzio per il S istema I nformativo del Piemonte

09/05/03 1 Data Minig: clustering con Reti di Kohonen La nascita dei Data Warehouse della PA Dal 1996 si è lavorato per proporre alla Pubblica Amministrazione piemontese un cambiamento di architettura nei sistemi informativi: lobiettivo non è più costruire singoli programmi orientati alla produzione di report statistici, ma strutturare uno strato informativo organico, storicizzato e periodicamente aggiornato sul quale predisporre funzioni di accesso flessibili e di semplice utilizzo. Nascono in questo modo le prime proposte di realizzazione dei Data Warehouse per i singoli Enti

09/05/03 1 Data Minig: clustering con Reti di Kohonen Client browser Web Web server Application servers Dati destinazione DB server magazzino operazionale DB server operazionale DB server decisionale Dati destinazio ne Dati sorgente Architettura informatica supporto decisionale

09/05/03 1 Data Minig: clustering con Reti di Kohonen Base dati decisionale delle prescrizioni farmaceutiche della.

09/05/03 1 Data Minig: clustering con Reti di Kohonen 1- Come sta incrementato la spesa rispetto allanno scorso ? 2- Quale profilo di popolazione contribuisce di più alla spesa ? 3- Qual è lantibiotico più prescritto dai pediatri ? In estate e in inverno ? 4- Qual è la ripartizione sul territorio degli assistiti rispetto alla spesa ? 5- Qual è il principio attivo più prescritto ? 6- Come si diffondono i farmaci generici nel tempo? 7- Come varia la spesa media per assistito secondo la fascia di età ? 8- Per quali patologie abbiamo la spesa per assistito più elevata ? Le domande a cui rispondere Una base dati decisionali per estrarre quali informazioni ?

09/05/03 1 Data Minig: clustering con Reti di Kohonen Luniverso di riferimento Linsieme delle ricette di prescrizioni farmaceutiche erogate nelle farmacie del Piemonte il cui pagamento dellimporto totale o parziale viene sostenuto dal SSN Importo Totale Importo Galenico, Ossigeno, Integrativa Timbro medico Data prescrizione Farmaco 1 Farmaco 2 Codice assistito Data spedizione

09/05/03 1 Data Minig: clustering con Reti di Kohonen Banca dati decisionale della Farmaceutica Per visualizzarePer analizzarePer scoprire DB Farmaceutica DB Medici DB Farmaci DB Anagrafe Assistibili DB Anagrafe Strutture Sanitarie ricette al mese 4000 medici di base Farmaci assistibili DB Farmaci 22 ASL 70 distretti 1500 Farmacie Report grafici per medici Tabelle dinamiche OLAP Analisi speciali Data Mining Evoluzioni verso il Data mining

09/05/03 1 Data Minig: clustering con Reti di Kohonen Obiettivo : raggruppare i medici con profili simili nel trattamento farmacologico prescelto (monotrattamento, trattamenti combinati…) nel trattamento dellipertensione. Verificare in quale modo le linee guida OMS per il trattamento dellipertensione sono rispettate. Periodo di osservazione : primo semestre 2002 Soggetti : Medici di base generici Analisi modelli prescrittivi piemontesi trattamento farmacologico dellipertensione Data mining

09/05/03 1 Data Minig: clustering con Reti di Kohonen Pazienti ipertesiPazienti a rischio (età X sesso, altre patologie) Trattamento prescritto - monosomministrazione - associazioni da linee guide - altre associazioni OK OK se non a rischio OK se a rischio KO Data mining Contesto

09/05/03 1 Data Minig: clustering con Reti di Kohonen Metodologia seguita Fonte : Base Table semestrale delle singole prescrizioni Filtro : prescrizione di Farmaci di principio attivo C02,C07,C08 … Aggregazione e calcolo di variabili ad hoc al livello del medico di base : N° pazienti ipertesi N° pazienti curati con linea guida (associazione giusta di farmaci) N° pazienti per ogni gruppo terapeutico N° pazienti per ogni associazione di gruppo terapeutico N° pazienti a rischio N° confezioni / assistito per ogni principio attivo … Aggiunta di variabili supplementari N° assistiti totale anni di anzianità, sesso localizzazione geografica (ASL, campagna/città) Filtro di medici outliers : con meno di 30 assistiti, meno di 100 ricette… Definizione di variabili Target : peso dei pazienti con comportamento giusto (buona condotta) distinzione per pazienti a rischio o no Data mining

09/05/03 1 Data Minig: clustering con Reti di Kohonen Flusso delle analisi realizzate con Entreprise Miner Data mining con Entreprise Miner

09/05/03 1 Data Minig: clustering con Reti di Kohonen Lista delle variabili considerate

09/05/03 1 Data Minig: clustering con Reti di Kohonen Data mining / analisi associazioni

09/05/03 1 Data Minig: clustering con Reti di Kohonen Analisi Esplorativa delle Associazioni di farmaci Data mining / analisi associazioni

09/05/03 1 Data Minig: clustering con Reti di Kohonen Flusso delle analisi realizzate con Entreprise Miner Data mining / Cluster analisi

09/05/03 1 Data Minig: clustering con Reti di Kohonen Distribuzione variabile buona condotta Analisi descrittiva con il Tool Insight Data mining / profili dei medici

09/05/03 1 Data Minig: clustering con Reti di Kohonen 2 Cluster molto diversi Data mining / profili dei medici Risultati cluster analysis con Mappe di Kohonen

09/05/03 1 Data Minig: clustering con Reti di Kohonen Data mining / profili dei medici Risultati cluster analysis con Mappe di Kohonen

09/05/03 1 Data Minig: clustering con Reti di Kohonen Data mining / profili dei medici

09/05/03 1 Data Minig: clustering con Reti di Kohonen Cluster 7 (300 medici) Comportamento : segue linee guida monosomministrazione per pazienti non a rischio, combinazioni esclusive per pazienti a rischio Profilo medio del medico : medico di "campagna" Cluster 3 (150 medici) Comportamento : non segue linee guida, in particolare usa associazioni non consigliate, poco monosomministrazione Profilo medio del medico : pochi anni attività 0-10, medico di "città" Tipo paziente : niente di particolare(età, numero pazienti ipertesi, ipertesi a rischio) Data mining / profili dei medici Azione di informazione specifica

09/05/03 1 Data Minig: clustering con Reti di Kohonen Prossimi passi : modello esplicativo Data mining