PowerDNS + Zabbix soluzione HA per servizi core di INFN-CC

Slides:



Advertisements
Presentazioni simili
ISA Server 2004 Enterprise Edition Preview. ISA Server 2004.
Advertisements

ISA Server for the Enterprise. Clients Client Overview Internet ISA Server SecureNAT Client Do not require you to deploy client software or configure.
EUROPA TERRA DI MISSIONE. Flags of Europe This page contains flags and maps for Europe and its countries. European Union MAPS Europe 1 -- no flag references.
MultiSet, Liste Ordinate
Grid monitoring: sviluppi futuri
Analysis and Development of Functions in REST Logic: Application to the «DataView» Web App UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO.
Extreme Cluster Administration Toolkit Alberto Crescente, INFN Sez. Padova.
MCSA Mobile Code System Architecture Infrastruttura a supporto della code mobility Pierfrancesco Felicioni Reti di Calcolatori L.S. 2005/2006.
Online U. Marconi Milano, 21/9/ ~ 9000 optical link 40 MHz PCIe based readout 30 MHz × 100 kB/evt 5 Gb/s, 300 m long fibres from the FEE directly.
BOLOGNA Prin-STOA Report L. Rinaldi Bari – 12/11/2015.
Servizi Nazionali Stefano Longo (CNAF) Massimo Pistoni (LNF) WS CCR maggio 2016.
Open City Platform: i primi risultati Riunione CCR, 16 settembre 2015 Luciano Gaido.
Open City Platform: stato del progetto Workshop CCR, Trento, 17 marzo 2016 Luciano Gaido.
Architettura per servizi ad alta affidabilità Stato e Prospettive del Calcolo Scientifico Febbraio 2011
INFN—Catania Giuseppe Andronico Bologna, 23 Gennaio 2014.
Netgroup (Rapporto di aggiornamento alla Commissione) Stefano Zani (INFN CNAF) CCR Roma, Ottobre 2013.
EEE e Cloud Enrico Fattibene, Andrea Ferraro INFN – CNAF Workshop di CCR sull'Infrastruttura Cloud 15 Dicembre 2014 Quest'opera è distribuita con Licenza.
DNS HA
Gruppo Netarch Incontro di lavoro della CCR Napoli gennaio 2010 Connessioni Tier1/Tier2 a GARR-X 1 GM, Incontro di lavoro della CCR – Napoli
INFN-AAI Stato dell’infrastruttura centrale Dael Maselli Workshop INFN CCR 2010.
Aggiornamento attivita’ gruppo Windows Gian Piero Siroli, Dip. di Fisica, Università di Bologna e INFN CCR, ottobre 2007.
PRIN NAPOLI Enzo Capone, Gianpaolo Carlino, Alessandra Doria, Rosario Esposito, Leonardo Merola, Silvio Pardi, Arturo Sanchez Pineda.
Alessandro De Salvo Status dei Tier2 di ATLAS Alessandro De Salvo
20-21/03/2006Workshop sullo storage - CNAF Alessandro Brunengo.
Agenda Chi è Farobit Fondamenti di sicurezza informatica: vulnerabilità, protezione e integrità fisica hardware, protezione e integrità logico-funzionale.
Valutazione proposte di corsi di formazione S. Arezzini, L
!CHAOS e Cloud Enrico Fattibene INFN-CNAF
Infrastruttura cloud servizi realizzata nella Sezione di Napoli
Configurazione Router IR794- IG601
SCoPE - Stato dei Lavori
Resoconto delle attività del Gruppo di Lavoro DR
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Problema T1 30 settembre Andrea Chierici CDG T1.
DNS Domain Name Server.
Preventivi e Assegnazioni 2008 Dataweb
Crea il tuo sistema aziendale sul web a partire dei fogli Excel che usi. ShareXLS
CCR Servizi Nazionali settembre 2016 Stefano Longo (CNAF)
Riunione INFN – Bologna, 17 January 2013
Monitoring e loadbalancing dei servizi Grid
Gestione, monitoraggio e criticità della sicurezza in INFN e IGI
Comput-ER l'infrastruttura di calcolo distribuito in Emilia Romagna
Workshop CCR ' Maggio
Studio di metodologie e sviluppo di MiddleWare per interoperabilità
Risultati ultimi mesi Piano di lavoro prossimi mesi Reclutamento
Collegamento a Garr-X Il collegamento alla nuova rete Garr-X dovrà garantire il massimo della efficienza nella gestione della banda. Per identificare opportunamente.
Enrico M. V. Fasanelli CCR settembre 2016
Cloud per HA nei Servizi
PRIN Roma1 – status Luciano Barone, Alessandro De Salvo
Introduzione alla sessione sull’analisi per gli esperimenti LHC
L’INFN per il Collaborative esteso e distribuito Alessandro De Salvo
Analisi dei dati dell’Esperimento ALICE
Aurelio LEONE CTS OCP – Bologna 28/07/2016
Referaggio richieste di rete.
JetWalk: Agenda e review committee
INFN-TS INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo.
Gruppo WebTools Workshop CCR – 12 Giugno 2008 Dael Maselli – INFN LNF.
Riunione CCR – 29 Settembre 2008
Job Application Monitoring (JAM)
ONEDATA - distributed data caching -
Highlights del meeting ESPP di Cracovia Settembre 2012 (FISICA DI G1)
Studente : Andrea Cassarà Classe: 5AII A.S. 2014/2015 Link Sito
Domenico Diacono CNAF 22 Marzo 2006
Riunione CCR – 29 Settembre 2008
Gruppo WebTools Workshop CCR – 12 Giugno 2008 Dael Maselli – INFN LNF.
Programmazione parallela in Matlab e Test per ENEA-GRID
Job Management Systems ovvero
ATLAS PRIN Roma1 - status Alessandro De Salvo
-European CS-scanning group-
Preventivi CCR 2018 INFN Roma Tor Vergata.
Wikipedia Wikipedia è un'enciclopedia online, collaborativa e libera. Grazie al contributo di volontari da tutto il mondo, Wikipedia ad ora è disponibile.
Transcript della presentazione:

PowerDNS + Zabbix soluzione HA per servizi core di INFN-CC Emidio Giorgio – INFN LNS, on Behalf of INFN CC Workshop CCR INFN 2019

Outline Il contesto : INFN CC Il problema : affidabilità e fault tolerance Le soluzioni : PowerDNS + Zabbix e la loro integrazione

INFN Corporate Cloud INFN CC è una piattaforma cloud per la comunità INFN Basata su OpenStack e distribuita su tre sedi (Bari, CNAF, Frascati) Ridondanza di dati e servizi Tolleranza ai fallimenti locali

DNS HA : powerDNS I servizi con scope globale sono implementati su tutti e tre i siti Gli endpoint sono esposti attraverso HA Proxy. Ogni sito usa il proprio, scegliendo gli altri come backup Cosa fare quando un intero sito va giù ? PowerDNS ridondato Percona XtraDB Cluster (sempre sui 3 siti) Rest API

Il client pDNScli [1] $ ./powerDNScli.py usage: powerDNScli.py [-h] [--ip IP] [--ttl TTL] [--author AUTHOR] [--comment COMMENT] [--filter FILTER] [--zone] {insert,remove,delete,enable,disable,lookup,isdisabled,listcomment} fqdn Recordset {FQDN:[ {R1}, {R2} ]} Record R {IP, disabled:T/F} insert : Aggiorna uno o più record o crea il recordset. Usato anche per i subdomain. Supporta i commenti enable/disable Record remove Rimuove uno o più record isdisabled controlla se un record è abilitato listcomment: lists all comments for the entry. Supports filter lookup il recordset o la sottozona delete il recordset o la sottozona

Esempio : insert/lookup $ ./powerDNScli.py insert apiclitest.cc.infn.it --ip 192.168.24.11,192.168.19.12 Adding 192.168.24.11,192.168.19.12 to entry apiclitest.cc.infn.it. Entry will be created, if not existing Listing zone cc.infn.it. Entry apiclitest.cc.infn.it successfully updated $ ./powerDNScli.py lookup apiclitest.cc.infn.it Found entry for apiclitest.cc.infn.it. { "comments": [], "name": "apiclitest.cc.infn.it.", "records": [ { "content": "192.168.24.11", "disabled": false }, { "content": "192.168.19.12", "disabled": false }, ], "ttl": 86400, "type": "A" }

se il record è enabled, disabilita inserendo un commento I check Zabbix [2,3] Un host per ogni recordset Discovery degli IP associati Per ogni record vengono fatti due check Ping net.tcp.service[https,${PUBLIC_API_PORT}] Trigger -> action -> recovery { fqdn : keystone.cloud.infn.it, public api port: 5000} [ IP 1, IP 2, IP 3...] Enable: se il record è disabled, e la disabilitazione è stata fatta da zabbix, riabilita il record, inserendo un commento Disable: se il record è enabled, disabilita inserendo un commento Recovery

Osservazioni Dopo una fase iniziale di rodaggio, il sistema si sta dimostrando stabile Soglia del trigger : due fallimenti consecutivi (check ogni 60s) Azioni : disabilitazioni intelligenti Sistema generale, applicabili anche contesti diversi dalla cloud Evoluzioni Migliorie nel client powerdns, implementazione più efficiente Introduzione di livelli diversi di autorizzazione Autogestione delle sottozone per ciascun tenant

Riferimenti [1] Powerdnscli repo : https://baltig.infn.it/giorgioe/powerdnscli [2] Zabbix : http://cc-mon-01.infn.it/zabbix [3] Zabbix repo : https://baltig.infn.it/INFN-CC/monitoring (zabbix-ha folder)