G.Russo, Università di Napoli Federico II La razionalizzazione delle infrastrutture IT Una metodologia di intervento: i CED di Ateneo G.Russo, Università di Napoli Federico II
Proliferazione dei CED Scelta in passato giusta, in quanto: Le reti di telecomunicazioni in Italia hanno sempre stentato a decollare Non vi erano applicazioni web-based Non vi erano molti servizi centralizzati Non vi erano grosse banche dati centralizzate Non vi erano grosse esigenze per i CED (pochi server, poca potenza elettrica, normale condizionamento ambientale)
Razionalizzazione dei CED Scelta ora necessaria, in quanto: Le reti di telecomunicazioni in Italia stanno decollando Vi sono molte applicazioni web-based Vi sono molte banche dati centralizzate Vi sono molti servizi centralizzati Vi sono grosse esigenze per i CED (molti server, molta potenza elettrica, condizionamento ambientale non sufficiente)
La metodologia Ripartire da zero, non basarsi sul passato Nuovo locale CED Solo macchine, 2 risorse per monitoraggio locale solo hardware, H24 Altissima concentrazione: 300 server in 120 mq Server blade Monitoraggio remoto Gestione remota Paradigma del GRID computing Sistemi operativi: Open Source
LA DISPONIBILITA’ IT E’ LEGATA AL FUNZIONAMENTO DELL’INFRASTRUTTURA HARDWARE E DEI LOCALI SERVER I GUASTI ALLA STRUTTURA IT COMPORTANO COSTI INGENTI PER UN ENTE E NORMALMENTE SONO CAUSATI DA UNA INADEGUATEZZA DELLA STESSA Computer centre Network Server, storage Operating system Application Fire detection, fire protection walls, access control Cooling management, power management, access control, fire detection Virus protection, data backup management, access management Virus protection, intrusion detection, firewalls Power supply, cooling systems, rack, cabling Intrusion detection, firewalls Infrastruttura Fisica CED Critical business process
INFRASTRUTTURE INADEGUATE: Non è più consona una infrastruttura tradizionale in quanto porta notevoli costi iniziali di approntamento prevedendo l’espandibilità massima entro successivi 4/5 anni. RACK: i tradizionali (con porte traforate ) non consentono un alto raffreddamento e quindi necessità di molti più rack per il contenimento delle macchine di calocolo = inadeguati con le nuove tecnologie BLADE SERVER. Climatizzazione Ambientale: consente un raffreddamento di max 3/5Kw x rack non gestibile l’HOT SPOT = totalmente inadeguata con le nuove tecnologie BLADE SERVER e comporta alti costi iniziali e di esercizio . UPS non trasformless e non modulari: non garantiscono il filtraggio della corrente di alimentazione in ingresso, i trasformatori dissipano parte della potenza a scapito del rendimento, non consentono una espandibilità in spazi ridotti, costi alti di esercizio
Razionalizzazione delle 5 aree di intervento ! 4. SICUREZZA : Controllo Accesso ai Rack Controllo Temperatura Controllo Umidità Controllo Fumo Controllo Antincendio Controllo Alimentazioni Invio segnali di allarmi 1. SOLUZIONI CON Racks ad Alte Performance : Riduzione degli Spazi per i CED Riduzione dei Costi di attrezzaggio Alta concentrazione di calcolo Espandibilità Futura 3. SOLUZIONI INNOVATIVE PER L‘ENERGIA: UPS modulari scalabili VFI-SS-111 Architettura Parallela Decentralizzata Espandibilità a Caldo Sistemi a FUEL CELL fino 200KW Costi ridotti di manutenzione e di esercizio 2. SOLUZIONI INNOVATIVE DI RAFFREDDAMENTO: Sistemi LCP con scambiatori Aria Acqua , performance di raffreddamento 4 volte superiori all‘aria Sistemi modulari espandibili a caldo Riduzione costi di manutenzione e di esercizio 5. MONITORAGGIO da REMOTO : Monitoraggio e visualizzazione su di unica piattaforma di gestione dell‘intera infrastruttura fisica e di tutti gli allarmi potendoli tra loro correlare e fornire azioni di risposta
Razionalizzazione della infrastruttura Razionalizzazione della infrastruttura ! Infrastruttura fisica indipendendente dall’ambiente esterno , scalabile, modulare e facilmente manutenibile. Progettata per potersi espandere in modo plug&play Hot swappable Razionalizzazione degli spazi ! Rack universali ad alto contenimento di apparati svincolati dall’ambiente esterno(specialmente BLADE SERVER = minor manutenzione filtri apparati)
Climatizzazione indipendente Climatizzazione indipendente ! Svincolarsi da sistemi di tipo ambientali e raffreddare i singoli rack con sistemi scambiatori di calore aria/acqua modulari hot swappable con potenze da 12Kw fino a 40 Kw per rack ( gestione immediata Hot Spot localizzati dei server = miglior rendimento ). Nuovi sistemi di Energia e distribuzione ! Nuovi sistemi UPS secondo CEI 62040-3 VDE 0558 parte 530 VFI-SS-111, modulari scalabili hot swappable con architettura Parallela Decentralizzata (ciascun modulo è autonomo e indipendente dagli altri ma concorre alla efficacia finale) . Distribuzione secondaria agli armadi rack server attraverso quadri di distribuzione modulari precablati plug & play hot swappable ( riduzione di almeno il 30 % dei tempi di installazione e facilmente manutenibili e upgradabili) . Sistemi di alimentazione innovativi attraverso FUEL CELL fino a 200Kw.
Sicurezza completa ! Protezione fisica e ambientale della infrastruttura attraverso sistemi che controllando : accesso ai rack con schede magnetiche-tastierini-sistemi biometrici e transpoder, Temperatura, Umidità, Fumo , Sistemi Antincendio da Rack, Alimentazioni elettriche, Web Cam, Sistemi SMS per gli allarmi . Sistemi tutti plug & play facilmente manutenibili e upgradabili hot swappable. Monitoraggio e controllo a distanza ! Attraverso il software di controllo che fornisce una rappresentazione grafica planimetrica di tutti i componenti fisici installati si possono gestire tutti i dati e le informazioni dell’intero impianto realizzato visualizzando le attività di controllo impostando ed incrociando azioni in risposta agli eventi. Tutti i dati importanti per la sicurezza vengono raccolti e documentati per le più disparate attività.
Alta Disponibilità =Modularità e scalabilità della infrastruttura ALTA DISPONIBILITA’!!! MINORI COSTI di downtime MINORE Mean Time To Repair (MTTR) L’ MTTR è il vero fattore che influenza la DISPONIBILITA’ A (Availability) MTBF=100’000 h MTBF=200’000 h MTBF=300’000 h MTBF=400’000 h MTBF=500’000 h MTTR 0.5h 1h 2h 6h 12h 24h 36h 48h 72h 96h A = ___ MTBFUPS________ ( MTBFUPS+ MTTR )
Avere una griglia di protezione a 360 gradi per i centri di elaborazione dati con un servizio esteso a 5 aspetti strategici: Rack, Power e distribuzione, Cooling, Monitoring e Remote Management. Soluzione management - Monitoring rack power cooling sec. security
Il progetto specifico: S.Co.P.E. Riunificazione dei CED per il calcolo scientifico, con paradigma GRID Costi: € 5.000.000 tutto compreso Numero server: 300 Automatismi nella allocazione delle risorse di calcolo Automatismi nella allocazione dello spazio disco Sistemi di autenticazione degli utenti
Problemi: Spazi Energia elettrica Raffreddamento Rete telematica Persone Telecontrollo Monitoraggio Configurazione Diversificazione delle applicazioni Necessità di un middleware
Non-problemi: Server Storage IBM, DELL, HP etc tutti molto affidabili Management remoto non complesso Alta densità Storage SAN: si, ma non sempre serve Database, ma non solo Molti file grandi, accesso sequenziale
Il paradigma del GRID Grid Service Center Grid Site LFC DGAS VOMS SAM WN CE YAIM UI GRID DGAS TS SAM MS LFC II VOMS RB Grid Service Center Grid Site
Il Middleware High level Medium level Low level Portali Strumenti di visualizzazione Librerie scientifiche ottimizzate per le specifiche applicazioni Monitoraggio dell’andamento delle prestazioni dell’applicazione Selezione delle risorse di calcolo più opportune Low level Accesso a dati memorizzati su file system remoti Autenticazione sicura sulla rete Gestione dell’esecuzione su risorse remote
La rete LAN e WAN LAN Dorsale di rete a 10 Gbit/sec Rete ridondata (2x Gbit/sec, 4x Gbit/sec) Rete a bassa latenza (1x infiniband) Rete separata per monitoraggio e management (1x 100 Mbit/sec) WAN Collegamenti Intranet a 2.4 Gbit/sec, ridondati Collegamenti Internet a 1 Gbit/sec, ridondati
L’impiantistica Ripartire da zero, non basarsi sul passato Nuova cabina elettrica 1 Mwatt Nuovo Gruppo Elettrogeno 1 Mwatt Rack della RITTAL, che consentono: Raffreddamento ad acqua dei rack, con unità LCP e chiller esterno Rack a tenuta stagna Impianto antincendio interno ai rack Monitoraggio e telecontrollo Sensori su tutto (apertura porte rack, tensione di ogni presa, utilizzo ampere, etc)
e di Infrastruttura Grid collective 10 srv Servizi collettivi e di Infrastruttura Grid UI & test node 10 srv Switch fast ethernet 2 srv Computing element worker node TIPO A 96 blade Switch gigabit ethernet Nodi di Calcolo Biprocessori ed SMP worker node TIPO B 128 blade Switch Infiniband worker node Storage element 10 srv Grid Storage Element SCSI SATA Sistemi di Storage
La rete metropolitana MEDICINA SCIENZE LETTERE GIURISPRUDENZA INGEGNERIA Optical Fiber
Il vecchio CED
Il nuovo CED, il progetto
Il nuovo CED, il progetto
Il nuovo CED, in costruzione
Il prototipo
CONCLUSIONI Non modifiche lente e graduali, ma grosse modifiche tutte insieme Vedere i CED come un luogo “remoto”, virtualizzando tutta la gestione Massima attenzione ai problemi di energia elettrica e di raffreddamento Disponibilità di una rete LAN e WAN state-of-the-art (SPC del tutto inutile per questo) Sicurezza dei dati, con replica remota