Resoconto delle attività del Gruppo di Lavoro DR Disaster Recovery Resoconto delle attività del Gruppo di Lavoro DR CCR LNF 24-26/10/2012 S.Zani
Istituzione del Gruppo Il Gruppo è stato istituito questa estate ed ha lo scopo di individuare e realizzare soluzioni di Disaster Recovery per i “Servizi Fondamentali” dell’ Ente. La “Normativa di legge“ Prevede che l’INFN rediga un documento che preveda soluzioni di disaster recovery per i servizi, la interruzione dei quali, compromettesse il “Business” dell’Ente. CCR LNF 24-26/10/2012
Componenti e Riunioni COMPONENTI: Sandro Angius Claudio Bisegni Massimo Donatelli Claudio Galli Guido Guizzunti Dael Maselli Massimo Pistoni Claudio Soprano Riccardo Veraldi Stefano Zani + Collaborazione di Nunzio Amanzi Riunioni effettuate: 26/7 - Definizione degli obiettivi e priorità 13/9 - Identificazione dei principali Servizi ospitati al CNAF ed LNF (Con descrizione della consistenza in termini di server e spazio disco) 16/10 - Primo studio sulle tecniche da implementare per la replica dei dati, degli applicativi e definizione dei primi test di replica remota. Prossima riunione: 21/11 CHIUNQUE FOSSE INTERESSATO A CONTRIBUIRE E’ IL BENVENUTO! CCR LNF 24-26/10/2012
Priorità FASE 0: Replica dei “dati” dei servizi strutturali (permette in caso di disastro almeno di recuperare i dati per un successivo ripristino nella sede originale) FASE 1: Replica degli applicativi e definizione delle procedure per la riattivazione dei servizi nella sede secondaria (in caso di down prolungato, consente di ripristinare i servizi essenziali) CCR LNF 24-26/10/2012
Quali sono i servizi informatici di base “Strutturali” per il funzionamento dell’Ente? DISTRIBUITO + replica geografica (By design) DNS MAILING AAI AAI DB GODIVA Sistema Informativo Contabilità (CNAF) Portale Missioni (CNAF) Gestione Presenze (CNAF) Stipendiale (LNF) Documentale (LNF) Protocollo (LNF) DISTRIBUITO + Mail Relay (in caso di failure di un sito) REPLICATO DR DR DR DR DR DR CCR LNF 24-26/10/2012 DR
Altri Servizi Nazionali rilevanti che verranno replicati in fasi successive WWW.INFN.IT (Sito WEB istituzionale dell’INFN) WWW.AC.INFN.IT (Portale di accesso al DB delle assegnazioni) LISTS.INFN.IT (Mailing List Nazionali) AGENDA.INFN.IT (Indico server centrale) WEB.INFN.IT (Server WEB on demand per siti istituzionali di gruppi ed esperimenti.. Ad oggi ospita circa 70 siti) PHONE.INFN.IT (Sistema di fonoconferenze) .. CCR LNF 24-26/10/2012
Componenti del Sistema informativo installati al CNAF da replicare a Frascati Gestione Presenze : 2 VM Capacità: (100GB+12GB) Contabilità: 2 Macchine Fisiche Capacità: (300GB+300GB) Portale Utente (Missioni): 1 VM Capacità: 10 GB Lo spazio disco necessario ai LNF per ospitare I DB dei servizi di base e le VM necessarie è stimato in 1TB (considerare 2TB per margine) CCR LNF 24-26/10/2012
Componenti del Sistema informativo installati a Frascati da replicare al CNAF SXGEST 2 Stipendiale (HR) Documentale Protocollo 1 SUN Capacità 500 GB 2 VM Capacità 300 GB GODIVA (AAI) Prevista (entro fine anno?) sostituzione di SXGEST2 con una installazione dell’applicativo CEZANNE Non sono ancora noti dettagli della implementazione ma si baserà su di un DB Oracle della dimensione di circa 500/600 GB Lo spazio disco al CNAF per ospitare i DB dei servizi di base e le VM necessarie è stimato in 1TB (considerare 2TB per margine) CCR LNF 24-26/10/2012
Metodi di replica dei dati La maggior parte dei dati risiede su DB oracle quindi si pensa di utilizzare la soluzione Software “DataGuard” di Oracle per la replica dei DB. Si stanno valutando anche sistemi di storage in grado di realizzare nativamente una replica geografica a livello di LUN o Filesystem (per esempio EMC Snap View + MirrorView). Per altri servizi meno complessi e per la replica delle immagini delle VM, si stanno prendendo in considerazione soluzioni semplici (Scripting + RSYNC) oppure l’utilizzo della funzionalità di replica delle celle AFS. CCR LNF 24-26/10/2012
Programmazione delle attività Ottobre 2012: test di replica con DataGuard in rete locale. Novembre 2012: test di replica geografica con DataGuard. Fine Novembre 2012 :Replica del DB di Godiva Dicembre 2012: Replica dei DB di Contabilità, Presenze ed a seguire tutti gli altri. Q1 2013: Implementazione degli “script” per la replica delle VM degli applicativi. 2013: Definizione delle procedure per il ripristino dei servizi nelle rispettive sedi remote di backup 2013: Replica degli altri Servizi Nazionali rilevanti CCR LNF 24-26/10/2012