Politecnico di Milano © 2001 William Fornaciari La tolleranza ai guasti Concetti generali Docente: William Fornaciari Politecnico di Milano

Slides:



Advertisements
Presentazioni simili
RILEVAZIONE E RACCOLTA DATI
Advertisements

I bridge Standard IEEE 802.1D.
D. Menasce1 Queste trasparenze sono disponibili sul sito web dellautore: (selezionare lopzione COURSES) Queste.
Introduzione al Disegno Tecnico
Il sonar FALCON Un doveroso omaggio vada a tutte le Persone che, a vario titolo, hanno contribuito alla sua realizzazione.
L’Informatica dal Problema alla Soluzione
Basi di Dati prof. A. Longheu
FRED Pensieri notturni di un pessimista R.Giannitrapani Udine, 11 marzo 2004.
Evolvere robot stigmergici in Evorobot*
Amministrazione di una rete con Active Directory
Dependability — I mezzi per la garanzia di funzionamento
Informatica Industriale Monica Bianchini Dipartimento di Ingegneria dellInformazione Università degli Studi di Siena.
1 14. Verifica e Validazione Come assicurarsi che il software corrisponda alle necessità dellutente? Introdurremo i concetti di verifica e validazione.
2. INGEGNERIA DI SISTEMA Il software è inutile a meno che non sia combinato con componenti hardware per formare un “sistema” Introdurremo il concetto di.
Esercitazioni su circuiti combinatori
Affidabilità.
Reti Logiche A Lezione n.1.4 Introduzione alle porte logiche
Politecnico di Milano Algoritmi e Architetture per la Protezione dellInformazione Multichannel Adaptive Information Systems Paolo Maistri Dipartimento.
Life testing di componenti fotonici. Metodologie e strumentazione.
Gestione dei dischi RAID
MODALITÀ DI ACQUISIZIONE DEL SOFTWARE APPLICATIVO Paolo Atzeni Dipartimento di Informatica e Automazione Università Roma Tre 03/12/2008 (materiale da:
Jidoka.
CAPITOLO 2 INTRODUZIONE AL LINGUAGGIO JAVA E ALL'AMBIENTE HOTJAVA.
Strutture dei sistemi di calcolo Funzionamento di un sistema di calcolo Struttura di I/O Struttura della memoria Gerarchia delle memorie Architetture di.
Progettazione di una base di dati
Limiti al trasferimento di informazione u Il tempo necessario per trasmettere dellinformazione dipende da: –la velocita di segnalazione (cioe quanto velocemente.
Da Problema a Programmazione
INPUT / OUTPUT. Connessione tra componenti CPU RAM DischiMonitor StampanteTastieraMouse BUS = Interfacce o Controller.
Manutenzione degli assets produttivi
Sistemi a sensori distribuiti riflessioni tecniche
Modulo 1 - Hardware u.d. 3 (syllabus – 1.3.5)
L’ingegneria del software
Metodi di soluzione guasti nel volo in formazione di velivoli autonomi Candidato: Simone Di Nisio Relatori: Prof. M.Innocenti Prof. A. Balestrino.
Laboratorio Informatico: RETI E INTERNET I
U N INFRASTRUTTURA DI SUPPORTO PER SERVIZI DI FILE HOSTING Matteo Corvaro Matricola Corso di Reti di Calcolatori LS – Prof. A. Corradi A.A.
Ingegneria del software Modulo 1 -Introduzione al processo software Unità didattica 1 - Cicli di vita Ernesto Damiani Università degli Studi di Milano.
Reti di calcolatori 14 novembre 2003 INFORMATICA GENERALE Scienze per Operatori dei Servizi Giuridici Anno Accademico
File e Funzioni Si possono distinguere tre tipi di file che vengono utilizzati in MATLAB: M-file: hanno estensione .m e in essi vengono memorizzati i.
Programma di Informatica Classi Prime
1.1 Sistemi di elaborazione
VHDL per FPGA Courtesy of S. Mattoccia.
Universita’ degli Studi Roma Tre
Carisi Matteo ITIS C.Zuccante Classe 5ISA 12/12/12 N o Slide = 10.
Tecniche di progettazione Fault Tolerant
Sistemi e Tecnologie Informatiche Verifica di correttezza di un programma.
U.O.C. DIREZIONE TECNICA PATRIMONIALE SERVIZIO DI MANUTENZIONE LA MANUTENZIONE NELLA AUSL RIETI.
Editing dei dati.

Circuiti logici.
Università degli studi di Parma Dipartimento di Ingegneria dell’Informazione Politecnico di Milano © 2001/02 - William Fornaciari Reti Logiche A Lezione.
Gestione dei dispositivi di I/O:
Basi Dati e Laboratorio (6 + 6) crediti – curriculum Sistemi e Reti Basi dati 1 e Basi dati 2 prec.ordin. docenti: Barbara Demo Giuseppe Berio mail :
MICROPROCESSORI Un processore è un circuito integrato in grado di effettuare operazioni di calcolo o di elaborazione dell'informazione Il circuito contiene.
MCSA Mobile Code System Architecture Infrastruttura a supporto della code mobility Pierfrancesco Felicioni Reti di Calcolatori L.S. 2005/2006.
Ingegneria del software Modulo 1 - Introduzione al processo software Unità didattica 5 -Test e verifica Ernesto Damiani Università degli Studi di Milano.
Corso di Architetetture degli Elaboratori, A.A. 2004/ Architettura degli Elaboratori Elisa B.P. Tiezzi Orario ricevimento: Giovedì, ( Il materiale.
STUDIO SULLA REPLICAZIONE DEGLI AGENTI NEL SISTEMA SOMA Andrea Sambi.
Strategie di progetto Si possono utilizzare le strategie tipiche dello sviluppo di un processo di ingegnerizzazione (es. ingegneria del software). Strategie.
Sistemi di elaborazione dell’informazione Modulo 1 - Tecniche di comunicazione digitale Unità didattica 3 - Modelli astratti di protocolli Ernesto Damiani.
R.E.V.E.N.G.E. RELIABLE AND VERSATILE NEWS DELIVERY SUPPORT FOR AGENCIES Corso di Reti di Calcolatori LS – AA Professore: Antonio Corradi Referente.
B IBLIO S ERVICE consultazione di articoli online Anna Riccioni Progetto per il corso di Reti di Calcolatori L-S Anno Accademico
Bit singolo e burst u un canale che trasmette voce tollera bene gli errori distribuiti uniformemente –perche’ errori singoli hanno effetti simili al rumore.
Ingegneria del software Modulo 1 - Introduzione al processo software Unità didattica 5 -Test e verifica Ernesto Damiani Università degli Studi di Milano.
Progettazione di basi di dati: metodologie e modelli
Sintesi Reti Combinatorie
Informazione e Informatica - presentazione dei concetti di base -
Cloud SIA V anno.
1 Metodo I metodi sono uno strumento che i programmatori usano per strutturare i programmi, sia per renderli più facili da capire che per permettere il.
INTRODUZIONE ALLA NORMA TECNICA EN ing. Luigi Corbetta Esperto sicurezza del software.
Dispositivi di comando e controllo Dispositivi a logica programmabile.
Transcript della presentazione:

Politecnico di Milano © 2001 William Fornaciari La tolleranza ai guasti Concetti generali Docente: William Fornaciari Politecnico di Milano

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari- 2 - Sommario Storia Concetti fondamentali Correttezza ed affidabilità

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari Avizienis: un sistema è FT se i suoi programmi possono essere eseguiti correttamente nonostante l’occorrenza di guasti fisici. Da qui: Costruzione architetture ridondanti Introduzione codici di errore, duplicazione e triplicazione con votazione per rilevazione e/o correzione degli errori Tecniche diagnostiche per individuazione dei guasti Duplicazione dei principali sottosistemi 1971: Jet Propulsion Laboratory (NASA) e IEEE promuovono la prima conferenza sul calcolo della tolleranza ai guasti La storia

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari- 4 - Definizioni Ridondanza: parte del sistema non necessaria per il corretto funzionamento del sistema in assenza di FT Ridondanza hardware Ridondanza software Ridondanza temporale (algoritmi ripetuti nel tempo) Disponibilità: probabilità in funzione del tempo che il sistema sia correttamente operativo all’istante t Affidabilità: probabilità in funzione del tempo che il sistema sia correttamente funzionante all’istante t se il sistema stesso era funzionante all’istante 0. È un parametro più stringente della disponibilità

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari- 5 - Definizioni Avaria o insuccesso (failure): cambiamento fisico nell’hardware Guasto (fault): stato erroneo di hw o sw derivante da: avaria, errori di progetto, interferenze ambientali, errori umani. Un guasto può essere: Permanente: guasto continuo e stabile Intermittente: guasto o errore occasionale e instabile Transiente: guasto o errore risultato di particolari e temporanee condizioni ambientali (non riparabili) Errore (error): manifestazione di un guasto in un programma Avaria -> Guasto -> Errore

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari- 6 - La classificazione dei guasti Guasti per difetti fisici, tipo difetti di fabbricazione di un chip (che si evitano con test di affidabilità delle singole componenti, ma non ci riguarda) Guasti per difetti a livello logico Stuck-at: i valori di una linea, porta o pin sono fissi a 0 o 1. Bridging: due o più segnali adiacenti sono cortocircuitati (possibile creazione di AND o OR) Short or open: è presente una connessione in più o in meno Unidirezionale: a causa della geometria dei circuiti un guasto può avere un effetto cascata su più linee.

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari- 7 - La classificazione dei guasti Guasti dovuti a difetti a livello di sistema. Si hanno quindi dei modelli di guasto, basati su distribuzioni probabilistiche (esponenziali e Weibull). È possibile gestire in tal modo guasti permanenti alcuni guasti intermittenti pochissimi guasti transienti Esistono algoritmi per il rilevamento automatico dei guasti (AUTOFAIL)

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari- 8 - Correttezza ed affidabilità Sono quattro i meccanismi che l’architettura di un sistema operativo affidabile deve fornire: Rilevazione degli errori Delimitazione e valutazione del danno Copertura dell’errore Trattamento dell’errore e ripristino del servizio L’ordine di applicazione di quanto sopra può variare, salvo partire dalla rilevazione degli errori

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari- 9 - Correttezza ed affidabilità Due diverse metodologie di sviluppo: Bottom-up: si progetta un sistema composto da sottosistemi autonomi, di per sé tolleranti ai guasti, cui aggiungere funzionalità di tolleranza ai guasti globali Top-down: si progetta un sistema composto da sottosistemi già esistenti che presentano una minima (al limite nulla) tolleranza ai guasti

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari Tanto più efficace è la rilevazione degli errori, tanto più un sistema sarà affidabile L’approccio migliore per la rilevazione degli errori è il seguente, basato sulla corrispondenza del comportamento di un sistema ai suoi dati di targa Nella realtà è impossibile un controllo così rigoroso. Si controlla solo l’accettabilità dei valori d’uscita Correttezza ed affidabilità Rilevazione degli errori S Verifica S’ Input Output

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari Correttezza ed affidabilità Delimitazione e valutazione del danno Intercorre sempre del tempo tra l’occorrenza del guasto e la sua rilevazione Pessimisticamente è bene ritenere che il danno si sia propagato a tutto il sistema Bisogna quindi aspettare che si manifestino altri eventuali errori in cascata, non ancora rilevati, prima di qualsiasi intervento di copertura

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari Correttezza ed affidabilità Copertura dell’errore Bisogna riportare il sistema in uno stato non erroneo All’indietro (checkpoint): il sistema torna ad uno stato precedente privo di errori In avanti: si costruisce uno stato esente da errori a partire da informazioni già esistenti (usualmente ridondanti) Due casi particolari di copertura: Correzione dell’errore: il sottosist. dà risultati attendibili anche in caso di guasto permanente Mascheratura attraverso ridondanza, senza azioni di copertura. Ad esempio, voting

La tolleranza ai guasti - concetti generali© 2001 William Fornaciari Correttezza ed affidabilità Trattamento errore e ripristino servizio Assicurarsi che un guasto occorso non si ripresenti La rilevazione dell’errore non necessariamente è utile all’identificazione del guasto (diversi guasti possono manifestarsi con lo stesso errore) Trovato il sottosistema guasto ho 3 alternative: Sostituire il sottosistema guasto con uno di riserva Riconfigurare il sistema affinché funzioni senza il sottosistema guasto Ignorare il guasto se ritenuto transitorio