Nagios: un tool per resource & LAN/WAN monitoring

Slides:



Advertisements
Presentazioni simili
Informatica e Telecomunicazioni
Advertisements

Elaborazione del Book Informatico
IL NOSTRO LABORATORIO. Di INFORMATICA.. Presentazione: Nel nostro laboratorio abbiamo 24 postazioni con dei computer di tipo Desktop con queste caratteristiche:
IL NOSTRO LABORATORIO. Di INFORMATICA..
NetSaint: una soluzione OpenSource per il network monitoring
1 Corso di Informatica (Programmazione) Lezione 4 (24 ottobre 2008) Architettura del calcolatore: la macchina di Von Neumann.
UNIVERSITÀ DEGLI STUDI DI BOLOGNA
High-Available Service Manager Diego Costantini Università degli studi di Bologna Corso di Laurea Specialistica.
Reti di Calcolatori L-S Un Sistema Decentrato di Allocazione del Carico per Applicazioni di Calcolo Distribuito Mauro Bampo.
Test sul Cisco VPN Concentrator
Grid monitoring: sviluppi futuri
E. Ferro / CNAF / 14 febbraio /13 GRID.it servizi di infrastruttura Enrico Ferro INFN-LNL.
Corso di Informatica per Giurisprudenza Lezione 7
Software di monitoraggio Open Source
1 Installazione da rete Introduzione Configurazione del server NFS Cosa serve sul client Configurazione kickstart.
Sistema di controllo e supervisione impianti FV small sizes Ing. T. Monti – 04/07/11 – Rev. 02.
L’applicazione integrata per la gestione proattiva delle reti IT
BROKER SERVER Progetto di Ingegneria del Web 2008 Alessio Bianchi Andrea Gambitta Giuseppe Siracusano.
Architettura di storage ad alta affidabilita e bilanciamento di carico per volumi centrali e di esperimento A.Brunengo, M.Corosu INFN Sezione di Genova.
AICA Corso IT Administrator: modulo 4 AICA © EUCIP IT Administrator Modulo 4 - Uso Esperto della Rete Risoluzione dei Problemi e Analisi del Traffico.
Network Manager Ci sono due modi per accedere all'interfaccia grafica per la gestione della rete: Attraverso System Administration Network Cliccando sull'icona.
C. Aiftimiei 1, S. Andreozzi 2, S. Dal Pra 1, G. Donvito 3, S. Fantinel 4, E. Fattibene 2, G. Cuscela 3, G. P. Maggi 3, G. Misurelli 2, A. Pierro 3 1 INFN-Padova.
Dischi in RAID  Redundant Array of Independent Disk Configurazione che permette di combinare più dischi secondo obiettivi di performance e ridondanza.
SIARL ARCHITETTURA DEL SISTEMA E GESTIONE DELLA SICUREZZA Milano, 5 novembre 2003 Struttura Sistemi Informativi e Semplificazione.
10 azioni per lo scheduling su Grid Uno scheduler per Grid deve selezionare le risorse in un ambiente dove non ha il controllo diretto delle risorse locali,
Università Degli Studi di Napoli “ Federico II”
Francesco M. Taurino – INFM Napoli 1 Netdisco Gestione e controllo degli apparati di rete Workshop sulle problematiche di Calcolo.
Tecnologie dell’Informazione e della Comunicazione
Amavis: un wrapper per antivirus su mailserver Gennaro Tortone Workshop CCR INFN – La Biodola – Maggio 2002.
FESR Trinacria Grid Virtual Laboratory Strumenti di gestione Rosanna Catania Rita Ricceri Gianni Mario Ricciardi INFN Catania Task force.
Autenticazione SSH in Windows Sergio Storari, Matteo Schiavi, Matteo Canato Dipartimento di Ingegneria Università di Ferrara.
Competenze e attività gestite dai servizi di calcolo e reti. Paolo Mastroserio.
OSSEC HIDS, Host Based Intrusion Detection System
CUBE firewall Lic. Computers Center aprile 2003 Villafranca di Verona, Italia.
SMTP Sniffing for Intrusion Detection Purposes Gianluca Papaleo Consiglio Nazionale delle Ricerche Istituto di Elettronica.
Progetto di Ingegneria del Web Anno Accademico 2007/2008 Stefano Pigiani Bruno Ricci Marco Ruzzon.
1 Migrazione dei processi: Mosix. 2 Cosa è Mosix/OpenMOSIX ? OpenMOSIX è un è una patch del kernel di Linux che aggiunge funzionalit à avanzate di clustering.
Ernesto Damiani Lezione 5 – Gnutella Sistemi di elaborazione dell’informazione Modulo 3 -Protocolli applicativi Unità didattica 2 - Telnet, FTP e altri.
SnippetSearch Database di snippet bilanciato e replicato di Gianluigi Salvi Reti di calcolatori LS – Prof. A.Corradi.
Grid nelle sezioni: Milano Luca Vaccarossa INFN – Sezione di Milano Workshop sulle Problematiche di Calcolo e Reti nell'INFN.
La Farm di Atlas a Roma 1 Outline Architettura della farm Architettura della farm Installazione Installazione Monitoring Monitoring Conclusioni Conclusioni.
Report HEPiX Spring meeting 2002 Workshop sulle problematiche di calcolo e reti nell'INFN 6-9 Maggio 2002 La Biodola - Isola d'Elba Silvia Arezzini.
La Farm di Alice a Torino Workshop sulle problematiche di calcolo e reti Isola d’Elba 6-9 maggio 2002 Mario Sitta (Università del Piemonte Orientale e.
Enrico Mazzoni, INFN Pisa Workshop CCR La Biodola May 6-10, Sistema di Stampa INFN Sezione di Pisa Presentato da Enrico Mazzoni, INFN Pisa per.
I Sistemi Operativi. Che cosa sono? Il sistema operativo è un software di base che fa funzionare il computer. I Sistemi operativi più importanti sono:
Specialist Security Solutions & Services Soluzioni in “real-time” per la gestione della sicurezza Alberto Dossena Product Marketing Manager.
Security Monitor and Auditing & Event Management Franco Rasello Angelo Bianchi Integra Spa.
Riccardo Veraldi - INFN Firenze sslpasswd e sslpwdd Una soluzione OpenSSL client/server.
I NTERNET Rete interconnessa che permette il collegamento tra due host eterogenei, appartenenti a reti differenti separati anche da grande distanze. Internet.
Realizzazione di hotspot wireless per l’Università degli Studi di Milano Marcello Meroni, Michele de Varda, DIVISIONE TELECOMUNICAZIONI UNIVERSITÀ DEGLI.
Ganglia e Nagios Strumenti di monitor per la Cloud Attilio Santocchia Dipartimento di Fisica – UNIPG 4 aprile 2013 A. Santocchia - Ancona
Panoptes: cluster HA di monitoraggio della rete Giuseppe Sava, INFN Sez. di Catania, Netgroup Andrea Francesco Fornaia, INFN Sez. di Catania Gianni Mario.
Riunione SICR 24/6/2015. Cluster Cluster oVirt – Pronto alla migrazione dei servizi – Macchina virtuale radius per guest_conf in funzione – Tempi migrazione.
Roberto Covati INFN di Parma. Workshop CCR/INFN GRID Palau maggio Sommario VmWare Server (in produzione dal 2004 al 2008) VmWare Infrastructure.
Implementazioni di un analizzatore di protocollo Esistono quattro fondamentali tradeoff per la realizzazione di un analizzatore di protocollo:  Analisi.
FESR Trinacria Grid Virtual Laboratory Rosanna Catania Rita Ricceri INFN Catania 25 Luglio 2006 Grid Monitoring: GridICE – bacct - lsload.
Roberto Covati – Roberto Alfieri INFN di Parma. Incontri di lavoro CCR dicembre Sommario VmWare Server (in produzione dal 2004) VmWare ESX.
Evoluzione di TRIP: Eduroam, portale Web e autenticazione su IdP INFN Riccardo Veraldi, Vincenzo Ciaschini - CNAF.
Monitoring applicativo SaaS Tutorial 30/09/2015. Finalità Il monitoraggio applicativo per verificare, quantificare e controllare l’automazione introdotta.
Raccogliere informazioni ALCUNE DOMANDE FONDAMENTALI È stato modificato qualche componente HW o SW? Il sintomo si presenta regolarmente o ad intermittenza?
..dalla presentazione di Enrico alla riunione SICR 22 novembre.. Attacchi continui –I nodi degli utenti non sono sotto il nostro controllo –Occorre agire.
Attività e servizi di calcolo a Roma Tor Vergata R. Kwatera, R. Lulli, R. Sparvoli Roma Tor Vergata.
IV Corso di formazione INFN per amministratori di siti GRID Tutorial di amministrazione DGAS Giuseppe Patania.
Massimo Valiante WORKSHOP GARR_08 GARR-X: il futuro della Rete _ Milano 1-4 aprile 2008 PROGETTO V.O.C.I. Voice Over Consortium Infrastructure.
Aggiornamento Netgroup R.Gomezel Commissione Calcolo e Reti LNF 29/09/ /10/2008.
Sistema di Monitoraggio Integrato Paolo Mastroserio, Gennaro Tortone, Silvio Pardi Presenta per il gruppo Silvio Pardi.
DNS HA
La gestione della rete e dei server. Lista delle attività  Organizzare la rete  Configurare i servizi di base  Creare gli utenti e i gruppi  Condividere.
Transcript della presentazione:

Nagios: un tool per resource & LAN/WAN monitoring Giuseppe Sava [sava@ct.infn.it] Gennaro Tortone [tortone@na.infn.it] Workshop CCR INFN – La Biodola – Maggio 2002

Introduzione Nagios (evoluzione di NetSaint) e’ un tool per il monitoring di: risorse (CPU load, spazio disco, memoria,...); servizi (http, ftp, ssh, mysql, ...); apparati di rete (switch, router, ...); E’ stato progettato inizialmente per Linux, ma sono disponibili diversi ports (FreeBSD, Solaris, AIX, ...) Nagios e’ un prodotto freeware (GPL2) http://www.nagios.org

Architettura Nagios effettua il monitoring di risorse e servizi tramite l’esecuzione di plugins Un plugin e’ un programma (eseguibile o script Perl/sh/...) che puo’ essere eseguito da linea di comando per controllare una risorsa o un servizio; Per alcuni tipi plugin e’ possibile specificare (tramite argomenti) delle soglie di allarme (warning e critical); Esiste un progetto OpenSource per lo sviluppo di plugins: http://sourceforge.net/projects/nagiosplug

Architettura Plugins disponibili monitoring servizi dhcp, dns, ftp, http, imap, kerberos, ldap, mysql, nntp, ntp, pgsql, pop3, radius, rpc, smtp, ssh, tcp_port, udp_port monitoring risorse ide-smart, diskio, diskspace, load, memory, procs, users, swap monitoring apparati di rete snmp vari flexlm, hpjd, log, ping, lmsensors

Architettura Stati logici di un host UP PENDING DOWN UNREACHABLE RECOVERED Stati logici di un servizio OK PENDING WARNING CRITICAL UNKNOWN RECOVERED

Features NRPE – Nagios Remote Plugin Executor (active checks) ci sono diverse risorse da monitorare che non sono “pubbliche” come i servizi di rete, come ad esempio lo spazio libero su un hard disk, il carico della CPU, ecc. Queste risorse non possono essere monitorate senza l’installazione di un “agente” sull’host da controllare; E’ disponibile un plugin chiamato check_nrpe che si interfaccia via rete con l’agente NRPE il quale lancia il plugin direttamente sull’host remoto e comunica i risultati ottenuti.   Esiste anche NRPEP che possiede le stesse funzionalità di NRPE, ma e’ scritto in Perl e utilizza le librerie Crypt-TripleDES e Digest-MD5 per crittografare lo scambio di informazioni tra il server Nagios e host remoto.

Features NSCA – Nagios Service Check Acceptor (passive checks) Nagios e’ in grado di raccogliere i risultati dei check provenienti dai plugins che vengono eseguiti da host remoti. I check “passivi” sono utili per: monitorare servizi e host localizzati dietro un firewall monitorare servizi “asincroni” (SNMP traps, security alerts, ecc.); Quando un’applicazione esterna compie un check comunica al server Nagios i risultati dell’esecuzione. Periodicamente Nagios effettua la raccolta dei risultati presenti in cache e li elabora secondo la logica di controllo; Nagios effettua dei controlli periodici per verificare che i risultati dei passive check siano comunicati secondo la frequenza prestabilita (freshness checks)

Features Event handlers Un event handler e’ un comando che viene eseguito da Nagios (in locale o su host remoto) quando avviene un cambiamento di stato per un host o un servizio. Esistono due tipi di event handlers: event handlers per servizi event handlers per host Inoltre e’ anche possibile definire degli event handlers globali che vengono eseguiti da Nagios per ogni cambiamento di stato relativo ad un host o ad un servizio. Esempio script di restart remoto (tramite ssh identity) di un daemon http/ftp a seguito di indisponibilita’ del servizio;

Features Notifiche Con Nagios e’ possibile inviare delle notifica (e-mail, SMS, ...) relativamente ad un fault/recovery di host o servizi; in particolare l’invio avviene nelle seguenti transizioni di stato: - da OK a WARNING/CRITICAL/UNKNOWN; fault - da WARNING/CRITICAL/UNKNOWN a OK; recovery - da uno stato non-OK ad un altro stato non-OK; Prima di inviare una notifica Nagios tiene conto di diversi filtri: - program-wide - service and host - contact Moduli opzionali - notification escalation (embedded) - aggregate notification (NANS - Nagios Aggregate Notification System)

Features

Features Flap detection Dipendenze tra host e servizi flapping = frequenti cambiamenti di stato di un host o di un servizio; Dipendenze tra host e servizi correlazione tra lo stato di un host/servizio con lo stato di un altro host/servizio;

Scenari di utilizzo Redundant monitoring Due server Nagios (master e slave) effettuano il monitoring sulla stessa LAN per gli stessi host e servizi. Solo il master invia le notifiche ai contact per eventuali problemi;in caso di fault del master lo slave notifica i contact e abilita il meccanismo delle notifiche diventando server master. Failover monitoring Il master effettua il monitoring mentre lo slave e’ up & running ma non effettua check; in caso di fault del master lo slave abilita il check di host e servizi ed inizia il monitoring;

Moduli aggiuntivi NAGAT interfaccia web per la configurazione di Nagios (aggiunta/modifica host, servizi,..) Nagios-statd agente remoto per il monitoring di macchine Digital Unix, SCO, ... NSclient agente remoto per il monitoring di macchine W9x, WNT, W2K RRD reports rappresentazione grafica delle misure di monitoring (by Monitoring Group INFNGRID)

Conclusioni Nagios e’ un tool di monitoring: - per LAN, WAN, farm, macchine centrali, sale utenti; - con molte features “interessanti”; - opensource (!) ACTION proposte Creare (o riattivare) il Working Group “Monitoring” INFN per: studiare le soluzioni disponibili (opensource e non); sviluppare eventuali add-on da includere nella soluzione da distribuire; fornire una soluzione di monitoring completa alle sezioni (es. suite di prodotti: Nagios + altri); formare e supportare i system administrator nelle attivita’ di installazione e configurazione del sistema di monitoring con particolare riferimento ad eventuali casi specifici;

Esempio di configurazione Oggetti host, host group contact, contact group timeperiod, command, service Host define host { host_name ns1 alias DNS server #1 address 192.168.1.254 parents my-router [host] check_command check-host-alive [command] max_check_attempts 5 notification_interval 30 notification_period 24x7 [timeperiod] notification_options d,u,r }

Esempio di configurazione Host group define hostgroup { hostgroup_name dns-servers alias DNS Servers contact_groups dns-admins [contactgroup] members ns1,ns2 } Contact define contact { contact_name tortone alias Gennaro Tortone service_notification_period 24x7 [timeperiod] host_notification_period 24x7 [timeperiod] service_notification_options w,u,c,r host_notification_options d,u,r service_notification_commands notify-by-email [command] host_notification_commands host-notify-by-email [command] email gennaro.tortone@na.infn.it

Esempio di configurazione Contact group define contactgroup { contactgroup_name dns-admins alias DNS Administrators members tortone,taurino [contact] } Time period define timeperiod { timeperiod_name nonworkhours alias Non-Work Hours sunday 00:00-24:00 monday 00:00-09:00,17:00-24:00 tuesday 00:00-09:00,17:00-24:00 wednesday 00:00-09:00,17:00-24:00 thursday 00:00-09:00,17:00-24:00 friday 00:00-09:00,17:00-24:00 saturday 00:00-24:00

Esempio di configurazione Command define command { command_name check_dns command_line /usr/local/nagios/libexec/check_dns -H $HOSTADDRESS$ } Service define service { host_name ns1 [host] service_description dns check_command check_dns [command] max_check_attempts 5 check_period 24x7 [timeperiod] notification_interval 30 notification_period 24x7 [timeperiod] notification_options w,c,r contact_groups dns-admins [contactgroup]