CCR Servizi Nazionali 12-15 settembre 2016 Stefano Longo (CNAF) Massimo Pistoni (LNF)
Argomenti Idee su sviluppi tecnici futuri Idee su sviluppi organizzativi Richieste di finanziamento LNF 12 settembre 2016 CCR - Lecce
Sviluppi tecnici La CCR ha deciso di creare un’infrastruttura di calcolo centrale e distribuita geografica-mente sui 3 siti: Bari, CNAF e LNF I 3 siti saranno in comunicazione tramite la rete GARR attraverso una rete logica dedicata allo scopo (una Virtual Private Network di livello 3 basata su MPLS, ad uso esclusivo dei nodi che fanno parte di tale intrastruttura di calcolo centrale) 12 settembre 2016 CCR - Lecce
INFN CC Network Layout 12 settembre 2016 CCR - Lecce CNAF LNF BARI GARR NETWORK Int. N/Vlan ID Int. N GARR BARI Int. N Int. N/Vlan ID CNAF-XXX RX2-BO1 XXX-BA INFN CC L3 VPN 90.147.174.0/24 10.202.0 0/16 192.135.24.0/24 10.200.0.0/16 GARR-LNF Int. N Int. N/Vlan ID XXX-LNF 90.147.175.0/24 10.201.0 0/16 CNAF Ptp: Public192.135.24.0/24 DMZ: 90.147.176.0/26 Private:10.200.0.0/16 LNF Ptp: Public: 90.147.175.0/24 DMZ: 90.147.176.64/26 Private:10.201.0.0/16 BARI Ptp: Public: 90.147.174.0/24 DMZ: 90.147.176.128/26 Private:10.202.0.0/16 12 settembre 2016 CCR - Lecce
INFN-CC Su tale infrastruttura di rete Corporate Cloud dell’INFN basata su OpenStack Questa deve essere vista come un conteni-tore di servizi che possono essere istanziati con adeguato livello di affidabilita’ Portare i servizi nazionali (o anche solo parte di essi) su tale infrastruttura potrebbe essere uno degli obiettivi da raggiungere in un futuro piu’ possibile prossimo 12 settembre 2016 CCR - Lecce
VPN L3 e VPN L2? L’infrastruttura di rete VPN L3 o, magari in aggiunta, una VPN L2 tra CNAF e LNF (e Bari) che permetta di avere un’unica VLAN/Network comune, possono fornire i presupposti di base su cui costruire un’intelaiatura solida e affidabile per l’implementazione di servizi che abbiano le caratteristiche di alta affidabilita’ e alta disponibilita’ 12 settembre 2016 CCR - Lecce
VPN L2: routing La VPN L2 potrebbe quindi essere instradata sia dal router del CNAF sia da quello dei LNF (con gestione delle opportune priorita’ di routing) e quindi sempre e comunque raggiungibile in caso di fault di uno dei 2 siti. E su tale VLAN/network si potrebbero installare tutti i servizi nazionali di base, a partire ad esempio da un paio di DNS HA. 12 settembre 2016 CCR - Lecce
VMWare vs. oVirt? (e soluzioni per il DR) Si puo’ pensare ad esempio di realizzare un “cluster” di macchine distribuito geograficamente con sopra un sistema di virtualizzazione che permetta live migration anche tra macchine geograficamente “distanti” (RTT dell’ordine dei 6 o 7 ms). VMWare oppure oVirt possono essere testati per tale scopo, con la VPN di livello 2 le macchine virtuali potrebbero migrare senza la necessita’ di cambiare IP address. Bisogna capire se le distanze (latenze) consentono di avere un sistema contemporaneamente affidabile e responsivo. VMWare tool per il Disaster Recovery 12 settembre 2016 CCR - Lecce
Replica a/sincrona? (e soluzioni per il BC) Limite critico per la copia sincrona: 200km Si puo’ pensare anche di aumentare un poco la complessita’ dell’infrastruttura coinvolgendo altre sedi per ottenere un maggiore livello di affidabilita’ e responsivita’ dei sistemi Coinvolgere ad esempio altre 2 sedi Una vicino al CNAF L’altra vicino ai LNF L’alternativa e’ fornire una soluzione di HA tutta installata su una singola sede 12 settembre 2016 CCR - Lecce
Altre soluzioni Un alternativa e’ quella di studiare e testare soluzioni tecniche di fornitori specifici oppure opensource Sincronizzazione di sistemi di storage (H/W) Ad esempio EMC, NetApp, Nec, o altri Sincronizzazione di File System oppure di Object Storage (soluzioni brand e OpenSource): Ceph, Gluster, etc GPFS, VMWare vSphere, VMWare Site Recovery Manager, VMware Virtual SAN, etc 12 settembre 2016 CCR - Lecce
Sviluppi organizzativi Un’ esigenza particolarmente sentita dagli utenti dei servizi informatici, e’ quella di avere un riferimento tecnico e sistemistico per ogni problema che si dovesse presentare durante l’uso delle risorse Per i servizi locali gli utenti hanno come riferimento il Servizi di Calcolo di sede Il discorso cambia per i servizi nazionali 12 settembre 2016 CCR - Lecce
Sviluppi organizzativi (2) Attualmente i Servizi Nazionali sono gestiti in modalita’ best-effort, da persone che spesso hanno altri compiti istituzionali, legati prevalentemente alle esigenze della sede per la quale lavorano E’ ovvio che tale organizzazione puo’ non essere sempre soddisfacente per chi deve utilizzare i servizi. E cio’ non dipende soltanto dalla criticita’ dei servizi. 12 settembre 2016 CCR - Lecce
Sviluppi organizzativi (3) Riteniamo che siano maturi i tempi per pensare alla definizione di un’organizzazione che prevede la strutturazione di uno o piu’ servizi nell’INFN con compiti istituzionali: gestire e mantenere l’insieme dei servizi nazionali dare supporto agli utenti con SLA adeguati Ad. Esempio, di recente, sulla lista di CCR e’ circolato un documento che propone la “Strutturazione di un servizio nazionale AAI per l’INFN” 12 settembre 2016 CCR - Lecce
Sviluppi organizzativi (4) Al CNAF gia’ esiste un Servizio dedicato ai Servizi Nazionali, ma e’ purtroppo carente di ManPower Ai LNF, sebbene il Servizio di Calcolo si dedichi anche alla gestione di alcuni servizi Nazionali, non esiste alcun tipo di “entita’” ufficiale e riconosciuta per tali compiti 12 settembre 2016 CCR - Lecce
Sviluppi organizzativi (5) Sarebbe importante disegnare una struttura organizzativa che comprenda: le persone che si occupano della gestione dell’infrastruttura informatica di base su cui si poggiano i servizi nazionali rete locale e geografica e VPN L2/L3 Sistemi di storage e cluster di macchine fisiche Layer di virtualizzazione Eventuale layer della Cloud le persone che si occupano della gestione dei servizi nazionali 12 settembre 2016 CCR - Lecce
Sviluppi organizzativi (6) Le prime dovrebbero essere localizzate nelle sedi che ospitano le infrastrutture stesse Le seconde potrebbero essere persone di qualunque sede che a vario titolo si sono occupate da tempo e continuano ad occuparsi della gestione dei servizi nazionali. Quindi non necessariamente personale delle sedi che ospitano l’infrastruttura. 12 settembre 2016 CCR - Lecce
Sono solo idee Ma queste sono solo idee che avevamo piacere di condividere Lo scopo di questa introduzione e’ quello di aprire una discussione su tali argomenti Benvenga qualunque contributo e chiunque abbia suggerimenti tecnici o organizzativi; benvenga soprattutto chiunque abbia voglia di contribuire fattivamente alle sfide che da ora in avanti dovremo affrontare 12 settembre 2016 CCR - Lecce
Richieste LNF Ridondanza: 5 Macchine per Virtualizzazione (256 GB RAM) per la gestione di servizi nazionali in alta affidabilita' e Alta disponibilita' (con VMWare) 35KE 14 HD da 4TB (circa 50TB) come update di un sistema di storage esistente per la gestione dei servizi nazionali e soprattutto come area per il DR (dal CNAF) 10KE Ridondanza: 5 Macchine per Virtualizzazione (256 GB RAM) da installare come sistema ridondato per la gestione dell'High Availability di servizi nazionali critici, eventualmente anche in sede diversa ma adiacente ai LNF ) 35KE Sistema di storage (circa 50TB) per l'infrastruttura ridondata per la gestione dell'High Availability di servizi nazionali critici, eventualmente anche in sede diversa ma adiacente ai LNF 25KE 12 settembre 2016 CCR - Lecce
Discussione e domande 12 settembre 2016 CCR - Lecce