CCR Servizi Nazionali settembre 2016 Stefano Longo (CNAF)

Slides:



Advertisements
Presentazioni simili
Servizio Sistema Informativo - Area Gestione Sistemi e Sicurezza – LNF – Dael Maselli Area Gestione Sistemi e Sicurezza LNF Plenaria Servizio Sistema Informativo.
Advertisements

Roberto Covati – Roberto Alfieri INFN di Parma. Incontri di lavoro CCR dicembre Sommario VmWare Server (in produzione dal 2004) VmWare ESX.
Servizi Nazionali Stefano Longo (CNAF) Massimo Pistoni (LNF) WS CCR maggio 2016.
Referaggio sigla CALCOLO D. Bonacorsi, G. Carlino, P. Morettini CCR – Roma 9 Settembre 2014.
Disaster Recovery Resoconto delle attività del Gruppo di Lavoro DR CCR CNAF 5-7/2/2013 S.Zani.
Virtualizzazione nell’INFN Andrea Chierici 11 Dicembre 2008.
Implementazione di TRIP ai LNF Commissione Calcolo e Reti 31 maggio 2007 Massimo Pistoni.
CCR, LNF ott 2011 Proposte assegnazioni server & storage L. Carbone, A. Gianoli, M. Serra.
Attività Formazione Valeria Ardizzone (INFN Catania)
INFN-AAI Stato dell’infrastruttura centrale Dael Maselli Workshop INFN CCR 2010.
Referaggio delle richieste dei gruppi di lavoro G. Ambrosi, R. Fantechi, M. Gulmini, O. Pinazza Commissione Calcolo e Reti, CNAF, 16 Marzo 2011.
IL blueprint e le esigenze per il progetti internazionali (EMI e EGI- InSPIRE) L. Gaido, INFN Torino Riunione del Comitato di Coordinamento IGI Roma, 12.
Referaggio delle richieste dei gruppi di lavoro G. Ambrosi, R. Fantechi, M. Gulmini, O. Pinazza Commissione Calcolo e Reti, Roma, 5-7 Ottobre 2010.
Giuseppe Andronico CCR-WS10 Santa Tecla, 18 Maggio 2010 Introduzione MPI & GPU.
PRIN NAPOLI Enzo Capone, Gianpaolo Carlino, Alessandra Doria, Rosario Esposito, Leonardo Merola, Silvio Pardi, Arturo Sanchez Pineda.
Attività PRIN STOA a Cagliari Alessandro De Falco Università/INFN Cagliari.
Università degli Studi - “ G. d'Annunzio ” Chieti - Pescara FACOLTÀ DI ECONOMIA Corso di laurea in Economia Informatica/s Seminario di: Giovanni Placentino.
Presentazione della piattaforma e - learning MOODLE a cura di Davide Afretti Bologna, 24 aprile 2013.
WORKSHOP CCR 2008 LNGS 10 – 13 giugno 2008 S. Parlati - Riunione CCR CNAF 3-4 marzo 2008.
Acquisti TIER T2 team e Pistoni per la consulenza sull’hardware.
Piano di Formazione CCR per il 2017
!CHAOS e Cloud Enrico Fattibene INFN-CNAF
Infrastruttura cloud servizi realizzata nella Sezione di Napoli
Riccardo Veraldi - Massimo Donatelli CCR 3-4 Marzo 2008
Resoconto delle attività del Gruppo di Lavoro DR
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Summary di (quasi) tutti gli utenti non presentati…
Piani di sviluppo e consolidamento
CARATTERISTICHE DI UN DATACENTER
Referaggio delle richieste dei gruppi di lavoro
Workshop dei Gruppi di lavoro CCR LNF, 12 dicembre 2007
Comput-ER l'infrastruttura di calcolo distribuito in Emilia Romagna
l’organizzazione di IGI
Tavola rotonda sulla Virtualizzazione
Breve report su corso RedHat Enterprise Virtualization (RH318)
Risultati ultimi mesi Piano di lavoro prossimi mesi Reclutamento
Report e riflessioni sui Servizi nazionali dell’INFN (ai LNF)
Richieste di upgrade dei link di accesso alla rete Geografica
Collegamento a Garr-X Il collegamento alla nuova rete Garr-X dovrà garantire il massimo della efficienza nella gestione della banda. Per identificare opportunamente.
Matteo Panella PCM !CHAOS 7 Luglio 2015
Cloud per HA nei Servizi
Netgroup Attività 2007 R.Gomezel.
PRIN Roma1 – status Luciano Barone, Alessandro De Salvo
Referaggi SST Riunione settembre 2017
Sicurezza e Grid Computing
Rapporto del Gruppo NetArch
L’INFN per il Collaborative esteso e distribuito Alessandro De Salvo
Formazione in CCR S. Arezzini R. Lulli 31 maggio 2007
Carbone, Gianoli, Mezzadri
Referaggio apparati di rete.
Aggiornamento sullo stato del Tier-2 di Catania
Nuove funzionalità e futura implementazione nella Sezione di Trieste
Parlando di network i discorsi naturalmente diventano complessi (creazione di un intero ecosistema virtuale comparabile ad uno reale): Separazione layers.
INFN-TS INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo.
Strutture informatiche e servizi nazionali
Agenda CE IGI
Luciano Gaido (INFN - Torino) Workshop CCR/INFNGRID – Palau
ATLAS PRIN Next Steps Alessandro De Salvo
Interfacce SRM: l'utilizzo di STORM - Overview e prospettive (ALICE)
Il lavoro di gruppo Cfr - Tratto da materiale corso di formazione su: organizzazione aziendale dott. Stefano Colferai.
Premesse, requisiti, obiettivi, azioni e funzionamento
Comitato Paritetico Strategia Nazionale Biodiversità
Organizzazione di una rete Windows 2000
Smart City.
Premesse, requisiti, obiettivi, azioni e funzionamento
I servizi di backup locale e backup in cloud
IA2 Massimo Sponza IA2 – Osservatorio Astronomico di Trieste 2018 ICT Workshop - Catania.
Preventivi CCR 2018 INFN Roma Tor Vergata.
PowerDNS + Zabbix soluzione HA per servizi core di INFN-CC
CLOUD.
Transcript della presentazione:

CCR Servizi Nazionali 12-15 settembre 2016 Stefano Longo (CNAF) Massimo Pistoni (LNF)

Argomenti Idee su sviluppi tecnici futuri Idee su sviluppi organizzativi Richieste di finanziamento LNF 12 settembre 2016 CCR - Lecce

Sviluppi tecnici La CCR ha deciso di creare un’infrastruttura di calcolo centrale e distribuita geografica-mente sui 3 siti: Bari, CNAF e LNF I 3 siti saranno in comunicazione tramite la rete GARR attraverso una rete logica dedicata allo scopo (una Virtual Private Network di livello 3 basata su MPLS, ad uso esclusivo dei nodi che fanno parte di tale intrastruttura di calcolo centrale) 12 settembre 2016 CCR - Lecce

INFN CC Network Layout 12 settembre 2016 CCR - Lecce CNAF LNF BARI GARR NETWORK Int. N/Vlan ID Int. N GARR BARI Int. N Int. N/Vlan ID CNAF-XXX RX2-BO1 XXX-BA INFN CC L3 VPN 90.147.174.0/24 10.202.0 0/16 192.135.24.0/24 10.200.0.0/16 GARR-LNF Int. N Int. N/Vlan ID XXX-LNF 90.147.175.0/24 10.201.0 0/16 CNAF Ptp: Public192.135.24.0/24 DMZ: 90.147.176.0/26 Private:10.200.0.0/16 LNF Ptp: Public: 90.147.175.0/24 DMZ: 90.147.176.64/26 Private:10.201.0.0/16 BARI Ptp: Public: 90.147.174.0/24 DMZ: 90.147.176.128/26 Private:10.202.0.0/16 12 settembre 2016 CCR - Lecce

INFN-CC Su tale infrastruttura di rete  Corporate Cloud dell’INFN basata su OpenStack Questa deve essere vista come un conteni-tore di servizi che possono essere istanziati con adeguato livello di affidabilita’ Portare i servizi nazionali (o anche solo parte di essi) su tale infrastruttura potrebbe essere uno degli obiettivi da raggiungere in un futuro piu’ possibile prossimo 12 settembre 2016 CCR - Lecce

VPN L3 e VPN L2? L’infrastruttura di rete VPN L3 o, magari in aggiunta, una VPN L2 tra CNAF e LNF (e Bari) che permetta di avere un’unica VLAN/Network comune, possono fornire i presupposti di base su cui costruire un’intelaiatura solida e affidabile per l’implementazione di servizi che abbiano le caratteristiche di alta affidabilita’ e alta disponibilita’ 12 settembre 2016 CCR - Lecce

VPN L2: routing La VPN L2 potrebbe quindi essere instradata sia dal router del CNAF sia da quello dei LNF (con gestione delle opportune priorita’ di routing) e quindi sempre e comunque raggiungibile in caso di fault di uno dei 2 siti. E su tale VLAN/network si potrebbero installare tutti i servizi nazionali di base, a partire ad esempio da un paio di DNS HA. 12 settembre 2016 CCR - Lecce

VMWare vs. oVirt? (e soluzioni per il DR) Si puo’ pensare ad esempio di realizzare un “cluster” di macchine distribuito geograficamente con sopra un sistema di virtualizzazione che permetta live migration anche tra macchine geograficamente “distanti” (RTT dell’ordine dei 6 o 7 ms).  VMWare oppure oVirt possono essere testati per tale scopo, con la VPN di livello 2 le macchine virtuali potrebbero migrare senza la necessita’ di cambiare IP address. Bisogna capire se le distanze (latenze) consentono di avere un sistema contemporaneamente affidabile e responsivo. VMWare  tool per il Disaster Recovery 12 settembre 2016 CCR - Lecce

Replica a/sincrona? (e soluzioni per il BC) Limite critico per la copia sincrona: 200km Si puo’ pensare anche di aumentare un poco la complessita’ dell’infrastruttura coinvolgendo altre sedi per ottenere un maggiore livello di affidabilita’ e responsivita’ dei sistemi Coinvolgere ad esempio altre 2 sedi Una vicino al CNAF L’altra vicino ai LNF L’alternativa e’ fornire una soluzione di HA tutta installata su una singola sede 12 settembre 2016 CCR - Lecce

Altre soluzioni Un alternativa e’ quella di studiare e testare soluzioni tecniche di fornitori specifici oppure opensource Sincronizzazione di sistemi di storage (H/W) Ad esempio EMC, NetApp, Nec, o altri Sincronizzazione di File System oppure di Object Storage (soluzioni brand e OpenSource): Ceph, Gluster, etc GPFS, VMWare vSphere, VMWare Site Recovery Manager, VMware Virtual SAN, etc 12 settembre 2016 CCR - Lecce

Sviluppi organizzativi Un’ esigenza particolarmente sentita dagli utenti dei servizi informatici, e’ quella di avere un riferimento tecnico e sistemistico per ogni problema che si dovesse presentare durante l’uso delle risorse Per i servizi locali gli utenti hanno come riferimento il Servizi di Calcolo di sede Il discorso cambia per i servizi nazionali 12 settembre 2016 CCR - Lecce

Sviluppi organizzativi (2) Attualmente i Servizi Nazionali sono gestiti in modalita’ best-effort, da persone che spesso hanno altri compiti istituzionali, legati prevalentemente alle esigenze della sede per la quale lavorano E’ ovvio che tale organizzazione puo’ non essere sempre soddisfacente per chi deve utilizzare i servizi. E cio’ non dipende soltanto dalla criticita’ dei servizi. 12 settembre 2016 CCR - Lecce

Sviluppi organizzativi (3) Riteniamo che siano maturi i tempi per pensare alla definizione di un’organizzazione che prevede la strutturazione di uno o piu’ servizi nell’INFN con compiti istituzionali: gestire e mantenere l’insieme dei servizi nazionali dare supporto agli utenti con SLA adeguati Ad. Esempio, di recente, sulla lista di CCR e’ circolato un documento che propone la “Strutturazione di un servizio nazionale AAI per l’INFN” 12 settembre 2016 CCR - Lecce

Sviluppi organizzativi (4) Al CNAF gia’ esiste un Servizio dedicato ai Servizi Nazionali, ma e’ purtroppo carente di ManPower Ai LNF, sebbene il Servizio di Calcolo si dedichi anche alla gestione di alcuni servizi Nazionali, non esiste alcun tipo di “entita’” ufficiale e riconosciuta per tali compiti 12 settembre 2016 CCR - Lecce

Sviluppi organizzativi (5) Sarebbe importante disegnare una struttura organizzativa che comprenda: le persone che si occupano della gestione dell’infrastruttura informatica di base su cui si poggiano i servizi nazionali rete locale e geografica e VPN L2/L3 Sistemi di storage e cluster di macchine fisiche Layer di virtualizzazione Eventuale layer della Cloud le persone che si occupano della gestione dei servizi nazionali 12 settembre 2016 CCR - Lecce

Sviluppi organizzativi (6) Le prime dovrebbero essere localizzate nelle sedi che ospitano le infrastrutture stesse Le seconde potrebbero essere persone di qualunque sede che a vario titolo si sono occupate da tempo e continuano ad occuparsi della gestione dei servizi nazionali. Quindi non necessariamente personale delle sedi che ospitano l’infrastruttura. 12 settembre 2016 CCR - Lecce

Sono solo idee Ma queste sono solo idee che avevamo piacere di condividere Lo scopo di questa introduzione e’ quello di aprire una discussione su tali argomenti Benvenga qualunque contributo e chiunque abbia suggerimenti tecnici o organizzativi; benvenga soprattutto chiunque abbia voglia di contribuire fattivamente alle sfide che da ora in avanti dovremo affrontare 12 settembre 2016 CCR - Lecce

Richieste LNF Ridondanza: 5 Macchine per Virtualizzazione (256 GB RAM) per la gestione di servizi nazionali in alta affidabilita' e Alta disponibilita' (con VMWare)  35KE 14 HD da 4TB (circa 50TB) come update di un sistema di storage esistente per la gestione dei servizi nazionali e soprattutto come area per il DR (dal CNAF)  10KE Ridondanza: 5 Macchine per Virtualizzazione (256 GB RAM) da installare come sistema ridondato per la gestione dell'High Availability di servizi nazionali critici, eventualmente anche in sede diversa ma adiacente ai LNF )  35KE Sistema di storage (circa 50TB) per l'infrastruttura ridondata per la gestione dell'High Availability di servizi nazionali critici, eventualmente anche in sede diversa ma adiacente ai LNF  25KE 12 settembre 2016 CCR - Lecce

Discussione e domande 12 settembre 2016 CCR - Lecce