La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

E. Ferro, LNL, 7 dicembre 2001 1 DataGRID overview + WP4 Installation Enrico Ferro INFN-LNL.

Presentazioni simili


Presentazione sul tema: "E. Ferro, LNL, 7 dicembre 2001 1 DataGRID overview + WP4 Installation Enrico Ferro INFN-LNL."— Transcript della presentazione:

1

2 E. Ferro, LNL, 7 dicembre 2001 1 DataGRID overview + WP4 Installation Enrico Ferro INFN-LNL

3 E. Ferro, LNL, 7 dicembre 2001 2 Datagrid Il progetto è diviso in Work Packages: Il progetto è diviso in Work Packages: –WP1: Workload Management –WP2: Data Management –WP3: Monitoring Services –WP4: Fabric Management –WP5: Mass Storage Management –WP6: Testbed –WP7: Network –WP8-10: Applications La durata complessiva è di 3 anni (2001-2003). La durata complessiva è di 3 anni (2001-2003). Milestones: month 9 (Sept 2001), month 21 (Sept 2002), month 33 (Sept 2003) Milestones: month 9 (Sept 2001), month 21 (Sept 2002), month 33 (Sept 2003)

4 E. Ferro, LNL, 7 dicembre 2001 3 WP4: obiettivi e organizzazione Aims to deliver a computing fabric comprised of all the necessary tools to manage a centre providing Grid services on clusters of thousands of nodes Aims to deliver a computing fabric comprised of all the necessary tools to manage a centre providing Grid services on clusters of thousands of nodes WP4 è diviso in 6 tasks/sottosistemi WP4 è diviso in 6 tasks/sottosistemi –Configuration management (CERN + PPARC) –Resource management (ZIB) –Installation & node management (CERN + INFN + PPARC) –Monitoring (CERN + INFN) –Fault tolerance (KIP) –Gridification (NIKHEF) Le funzionalità offerte possono essere raggruppate: Le funzionalità offerte possono essere raggruppate: –Controllo e gestione dei job Gridification + Resource Management Gridification + Resource Management –Amministrazione dei sistemi automatizzata Configuration + Installation + Monitoring & Fault Tolerance Configuration + Installation + Monitoring & Fault Tolerance

5 E. Ferro, LNL, 7 dicembre 2001 4 Farm A (LSF)Farm B (PBS ) Grid User (Mass storage, Disk pools) Local User Installation & Node Mgmt Configuration Management Monitoring & Fault Tolerance Fabric Gridification Resource Management Grid Info Services (WP3) User job control (WP4) Other Wps Resource Broker (WP1) Data Mgmt (WP2) Grid Data Storage (WP5) Datagrid architecture overview Fabric Mgmt (WP4) - Interface between Grid- wide services and local fabric; - Provides local authentication, authorization and mapping of grid credentials. - Interface between Grid- wide services and local fabric; - Provides local authentication, authorization and mapping of grid credentials. - provides transparent access to different cluster batch systems; - enhanced capabilities (extended scheduling policies, advanced reservation, local accounting). - provides transparent access to different cluster batch systems; - enhanced capabilities (extended scheduling policies, advanced reservation, local accounting). - provides a central storage and management of all fabric configuration information; - central DB and set of protocols and APIs to store and retrieve information. - provides a central storage and management of all fabric configuration information; - central DB and set of protocols and APIs to store and retrieve information. - provides the tools to install and manage all software running on the fabric nodes; - bootstrap services; software repositories; Node Management to install, upgrade, remove and configure software packages on the nodes. - provides the tools to install and manage all software running on the fabric nodes; - bootstrap services; software repositories; Node Management to install, upgrade, remove and configure software packages on the nodes. - provides the tools for gathering and storing performance, functional and environmental changes for all fabric elements; - central measurement repository provides health and status view of services and resources; - fault tolerance correlation engines detect failures and trigger recovery actions. - provides the tools for gathering and storing performance, functional and environmental changes for all fabric elements; - central measurement repository provides health and status view of services and resources; - fault tolerance correlation engines detect failures and trigger recovery actions.

6 E. Ferro, LNL, 7 dicembre 2001 5 Configuration Management diagram High Level Description Low Leve Description Cache Configuration Manager Local Process Configuration Database APIAPI Client Node Configuration Database: stores configuration information and manages modification and retrieval access Cache Configuration Manager: downloads node profiles from CDB and stores them locally

7 E. Ferro, LNL, 7 dicembre 2001 6 Configuration DataBase All computing nodes of CMS Farm #3 use cmsserver1 as NFS Server cmsserver1 /etc/exports /app cmsnode1, cmsnode2,.. cmsserver1 /etc/exports /app cmsnode1, cmsnode2,.. cmsnode3 /etc/fstab cmsserver1:/app /app nfs.. cmsnode3 /etc/fstab cmsserver1:/app /app nfs.. cmsnode2 /etc/fstab cmsserver1:/app /app nfs.. cmsnode2 /etc/fstab cmsserver1:/app /app nfs.. cmsnode1 /etc/fstab cmsserver1:/app /app nfs.. cmsnode1 /etc/fstab cmsserver1:/app /app nfs.. High Level Description ? Low Level Description

8 E. Ferro, LNL, 7 dicembre 2001 7 Installation Management diagram Node Management Agent - manages installation, upgrade, removal and configuration of software packages Software Repository - central fabric store for Software Packages Bootstrap Service - servizi per il boot (DHCP, immagini di sistema)

9 E. Ferro, LNL, 7 dicembre 2001 8 LCFG: Installation & Software Mgmt Prototype Lattuale prototipo è basato su LCFG, un tool originariamente sviluppato allUniversità di Edinburgo tuttora in uso Lattuale prototipo è basato su LCFG, un tool originariamente sviluppato allUniversità di Edinburgo tuttora in uso Caratteristiche e funzionalità: Caratteristiche e funzionalità: –modulare, suddiviso in componenti (oggetti) –installazione automatizzata del S.O. –installazione/upgrade/rimozione di tutti i pacchetti software (RPM-based) –configurazione e gestione centralizzata delle macchine –estendibilità: configurazione e gestione di software applicativo facilmente personalizzabili

10 E. Ferro, LNL, 7 dicembre 2001 9 Client nodes Web Server HTTP XML Profile LCFG Config Files Make XML Profile Server Profile Read Profile LCFG Objects Local cache A collection of agents read configuration parameters and either generate traditional config files or directly manipulate various services Abstract configuration parameters for all nodes stored in a central repository LCFG diagram /etc/services /etc/inetd.conf /etc/hosts.allow in.telnetd : 192.168., 192.135.30. in.rlogind : 192.168., 192.135.30. in.ftpd : 192.168., 192.135.30. sshd : ALL /etc/hosts.allow in.telnetd : 192.168., 192.135.30. in.rlogind : 192.168., 192.135.30. in.ftpd : 192.168., 192.135.30. sshd : ALL Profile Object inet auth +inet.services telnet login ftp +inet.allow telnet login ftp sshd +inet.allow_telnet ALLOWED_NETWORKS +inet.allow_login ALLOWED_NETWORKS +inet.allow_ftp ALLOWED_NETWORKS +inet.allow_sshd ALL +inet.daemon_sshd yes..... +auth.users mickey +auth.userhome_mickey /home/mickey +auth.usershell_mickey /bin/tcsh +inet.services telnet login ftp +inet.allow telnet login ftp sshd +inet.allow_telnet ALLOWED_NETWORKS +inet.allow_login ALLOWED_NETWORKS +inet.allow_ftp ALLOWED_NETWORKS +inet.allow_sshd ALL +inet.daemon_sshd yes..... +auth.users mickey +auth.userhome_mickey /home/mickey +auth.usershell_mickey /bin/tcsh Config files 192.168., 192.135.30...... /home/mickey /bin/tcsh 192.168., 192.135.30...... /home/mickey /bin/tcsh XML profiles /etc/shadow /etc/group /etc/passwd.... mickey:x:999:20::/home/Mickey:/bin/tcsh.... /etc/passwd.... mickey:x:999:20::/home/Mickey:/bin/tcsh....

11 E. Ferro, LNL, 7 dicembre 2001 10 Cose un oggetto LCFG? È un semplice shell script (ma in futuro sarà usato perl) È un semplice shell script (ma in futuro sarà usato perl) Ciascun oggetto fornisce un certo numero di metodi (start, stop, reconfig, query,...) che sono invocati al momento opportuno Ciascun oggetto fornisce un certo numero di metodi (start, stop, reconfig, query,...) che sono invocati al momento opportuno Funzionamento tipico di un oggetto: Funzionamento tipico di un oggetto: –viene avviato dalloggetto manager profile allavvio del sistema e a seguito di notifica di un cambiamento di configurazione –carica dalla cache locale la sua configurazione –configura gli opportuni servizi, o traducendo i parametri di config nei tradizionali files di configurazione oppure controllando direttamente i servizi (ad es. avviando un demone)

12 E. Ferro, LNL, 7 dicembre 2001 11 LCFG: oggetti custom LCFG mette a disposizione gli oggetti per gestire tutti i servizi standard di una macchina: inet, syslog, nfs, cron, dns,... LCFG mette a disposizione gli oggetti per gestire tutti i servizi standard di una macchina: inet, syslog, nfs, cron, dns,... Un amministratore può creare nuovi oggetti custom per configurare e gestire le proprie applicazioni: Un amministratore può creare nuovi oggetti custom per configurare e gestire le proprie applicazioni: –definisce le proprie risorse custom (parametri di configurazione) da aggiungere al profilo di un nodo –include nel nuovo script loggetto generic, in cui sono definite delle common functions usate da tutti gli oggetti (config loading, log, output,...) –ridefinisce i metodi standard (start, stop, reconfig,...) secondo le proprie necessità –per oggetti semplici in genere si tratta di poche righe di codice

13 E. Ferro, LNL, 7 dicembre 2001 12 First boot via floppy or via network Initialization script starts First boot via floppy or via network Initialization script starts LCFG: node installation procedure DHCP Server Software Packages Software Packages IP address Config URL IP address Config URL Root Image with LCFG environment NFS Server LCFG Config Files LCFG Config Files XML Profiles XML Profiles LCFG ServerWEB Server Software Repository Client Node After reboot LCFG objects complete the node configuration Root Image complete with LCFG environment mounted via NFS Load minimal config data via DHCP: IP Address, Gateway, LCFG Config URL Load minimal config data via DHCP: IP Address, Gateway, LCFG Config URL Load complete configuration via HTTP Start object install: disk partitioning, network,... installation of required packages copy of LCFG configuration reboot Start object install: disk partitioning, network,... installation of required packages copy of LCFG configuration reboot

14 E. Ferro, LNL, 7 dicembre 2001 13 LCFG: riepilogo Pro: Pro: –A Edinburgo è in uso da anni in un ambiente complesso ed eterogeneo, con centinaia di nodi da gestire –Supporta la completa installazione e gestione di tutto il software (sia O.S. che applicazioni) –Molto flessibile e facile da estendere e customizzare Contro: Contro: –Complesso: curva di apprendimento iniziale molto ripida –Nello stato attuale è ancora un prototipo: incompleto e probabilmente la versione futura non sarà del tutto compatibile –Mancanza di tools user-friendly per la creazione e gestione dei files di configurazione (ed eventuali errori possono essere molto pericolosi!)

15 E. Ferro, LNL, 7 dicembre 2001 14 Generic Component Profile Object rdxprof Read Profile LCFG Objects Local cache LCFG: sviluppo futuro in WP4 Client nodes Web Server HTTP XML Profile LCFG Config Files Make XML Profile Server Software Repository (RPMs) Installation Server (DHCP, kernel images installroot) NFS Software Repository (RPMs) FTP HTTP NMA Objects NMA Config Cache Manager Configuration DataBase Bootstrap Service Images PXE TFTP DHCP User Interface

16 E. Ferro, LNL, 7 dicembre 2001 15 Conclusioni Il prototipo attuale non è ancora usabile in produzione Il prototipo attuale non è ancora usabile in produzione –incompleto, bugs, mancanza del DB di configurazione, parzialmente incompatibile con la prossima release Prossima milestone: settembre 2002 Prossima milestone: settembre 2002 –il sistema di installazione e management dovrebbe essere sufficientemente completo e usabile –sarà integrato con il DB di configurazione, ma abbiamo dei dubbi su questultimo (solo un prototipo, mancanza di adeguata interfaccia utente) –il sistema di monitoring sarà solo un prototipo (alcuni sensori, protocollo di trasporto dei dati, repository e display solo degli allarmi) LINFN nel WP4 sta spingendo per avere a Set. 2002 un sistema di Fabric Management realmente usabile nelle nostre farm LINFN nel WP4 sta spingendo per avere a Set. 2002 un sistema di Fabric Management realmente usabile nelle nostre farm


Scaricare ppt "E. Ferro, LNL, 7 dicembre 2001 1 DataGRID overview + WP4 Installation Enrico Ferro INFN-LNL."

Presentazioni simili


Annunci Google