Product Design, Manufacturing & Innovation Resources

Casa » Schema di blocco di recupero

Schema di blocco di recupero

1975-06-01

Brian Randell

(Immagine generata a solo scopo illustrativo)

The recovery block scheme is a software fault-tolerance technique based on design diversity and backward error recovery. It structures a program as a series of blocks, each with a primary module, an acceptance test, and one or more alternate modules. If the primary module’s output fails the acceptance test, the system state is restored, and an alternate module is executed.

Il concetto di blocco di ripristino, introdotto da Brian Randell, è un approccio strutturato per ottenere la tolleranza ai guasti del software. Si basa sul principio di fornire moduli software ridondanti, noti come alternative, per una data operazione, abbinati a un meccanismo per verificare la correttezza del risultato dell'operazione. I componenti chiave sono: il test di accettazione (AT), l'alternativa primaria (P) e una sequenza di alternative secondarie (Q1, Q2, ...). Prima di eseguire l'alternativa primaria, il sistema salva un checkpoint del suo stato corrente. Al termine di P, viene eseguito il test di accettazione sull'output. L'AT è un elemento logico cruciale che verifica che il risultato sia accettabile; non deve dimostrare la correttezza assoluta, ma piuttosto che il risultato sia ragionevole e coerente.

Se il risultato supera l'AT, il checkpoint viene scartato e il programma prosegue. Tuttavia, se l'AT fallisce, o se l'alternativa primaria stessa non riesce a essere eseguita (ad esempio, a causa di un errore di runtime), il sistema esegue un rollback. Ripristina lo stato dal checkpoint salvato ed esegue quindi l'alternativa successiva nella sequenza (Q1). L'output di Q1 viene quindi sottoposto allo stesso test di accettazione. Questo processo continua finché un'alternativa non produce un risultato che supera il test, o finché tutte le alternative non sono state esaurite, momento in cui viene dichiarato un errore a livello di sistema.

L'efficacia dei blocchi di ripristino dipende dalla diversità delle alternative. I moduli primario e secondario dovrebbero essere progettati e implementati in modo indipendente, idealmente da team diversi che utilizzano algoritmi o linguaggi di programmazione diversi. Ciò riduce al minimo la possibilità che un difetto di progettazione comune (un bug) esista in tutte le alternative, il che le porterebbe tutte a fallire il test di accettazione allo stesso modo. Il test di accettazione stesso è un singolo punto di errore e deve essere più semplice e affidabile dei moduli che sta testando. Rispetto alla programmazione N-version, un'altra tecnica di tolleranza agli errori del software, i blocchi di ripristino possono essere più efficienti in quanto eseguono un solo modulo alla volta, ma introducono latenza a causa del potenziale rollback e della riesecuzione.

Analisi dell'albero dei guasti (FTA), Miglioramento dei processi, Garanzia di qualità, Controllo di qualità, Ingegneria dell'affidabilità, Gestione del rischio, Sicurezza, Ingegneria del software, Test del software

UNESCO Nomenclature: 1203

- Informatica

Tipo

Software/Algoritmo

Interruzione

Incrementale

Utilizzo

Nicchia/Specializzato

Precursori

Concetti di gestione delle eccezioni nei linguaggi di programmazione
Meccanismi di transazione e rollback del database
Primi lavori sulla verifica e la correttezza del programma
Principi generali di ridondanza dall'ingegneria hardware

Applicazioni

software critici per la sicurezza nei sistemi di segnalamento ferroviario
sistemi di protezione dei reattori nucleari
applicazioni aerospaziali in cui il guasto del software è catastrofico
sistemi operativi sperimentali tolleranti agli errori

Brevetti:

Idee e potenziali innovazioni

A causa dell'eliminazione del traffico generato dai bot, che attualmente supera i 40.000 al giorno, questo contenuto è riservato ai membri della community.
> Accedi O > Registrati L'accesso a questo contenuto, così come a tutti gli altri contenuti e strumenti riservati, è (100% gratuito).

Argomenti correlati: blocchi di ripristino, tolleranza ai guasti del software, diversità di progettazione, test di accettazione, ripristino degli errori a ritroso, checkpointing, Brian Randell, software critico per la sicurezza, moduli ridondanti, programmazione a N versioni.

Contesto storico

Ingegnere informatico che codifica classi astratte in un ambiente IDE moderno.

Astrazione (programmazione OOP)

L'astrazione nella programmazione orientata agli oggetti (OOP) consiste nel nascondere dettagli implementativi complessi e mostrare solo le caratteristiche essenziali dell'oggetto. Si concentra su ciò che un oggetto fa anziché su come lo fa. Questo obiettivo si ottiene attraverso classi e interfacce astratte, che definiscono un modello per altre classi senza fornire un'implementazione completa, semplificando così i sistemi complessi.

Ingegneri che utilizzano i sette strumenti di base della qualità in un workshop per il miglioramento dei processi.

Seven Basic Tools of Quality

The Seven Basic Tools of Quality are a set of graphical techniques identified by Kaoru Ishikawa for troubleshooting quality-related issues. These tools are: Cause-and-effect diagram (fishbone), Check sheet, Control chart, Histogram, Pareto chart, Scatter diagram, and Stratification (often presented as a flowchart). They are considered 'basic' because they are simple to use and require little formal statistical training.

Ufficio di ingegneria del software che illustra le fasi del processo del modello Waterfall.

The Waterfall Model (software)

The Waterfall Model is a sequential, non-iterative software development process, where progress flows steadily downwards (like a waterfall) through distinct phases: conception, initiation, analysis, design, construction, testing, deployment and maintenance. Each phase must be fully completed before moving to the next. It is often contrasted with iterative models to highlight their flexibility.

Schema di blocco di recupero

Un gruppo di ingegneri discute di verifica e validazione nello sviluppo del software.

Verifica e convalida

La verifica e la convalida (V&V) sono processi distinti. La verifica assicura che un prodotto soddisfi i requisiti specificati ("Lo state costruendo bene?"). La convalida assicura che il prodotto soddisfi le esigenze reali dell'utente e l'uso previsto ("State costruendo la cosa giusta?"). Si tratta di attività complementari nell'ambito della gestione della qualità, spesso eseguite in sequenza o in parallelo per garantire sia la correttezza che l'utilità.

Strumento analitico di precisione in un laboratorio per la misurazione del limite di ripetibilità.

Limite di ripetibilità (statistiche)

Il limite di ripetibilità, [latex]r[/latex], è un valore critico derivato dalla deviazione standard della ripetibilità ([latex]s_r[/latex]). Rappresenta la massima differenza assoluta attesa tra due singoli risultati del test, ottenuti in condizioni di ripetibilità, con una probabilità di 95%. Viene comunemente calcolato come [latex]r = 2,8 ´times s_r[/latex]. Se la differenza supera [latex]r[/latex], i risultati sono considerati sospetti.

Programmatore che lavora alla struttura di un compilatore a tre stadi in un ufficio di sviluppo software.

La struttura del compilatore a tre stadi

Un compilatore moderno è tipicamente strutturato in tre fasi: front-end, middle-end e back-end. Il front-end analizza il codice sorgente, ne verifica la correttezza e crea una rappresentazione intermedia (IR). Il middle-end esegue ottimizzazioni su questa IR. Il back-end traduce quindi la IR ottimizzata in codice macchina di destinazione per una specifica architettura di CPU.

1970

1970-01-01

1975-06-01

1980

1970

1973

1980

1982-07-01

Riunione di valutazione del rischio con ingegneri che analizzano i numeri di priorità del rischio in un ufficio professionale.

Numero di priorità del rischio (RPN)

Il numero di priorità del rischio (RPN) è una misura quantitativa utilizzata nell'FMEA per dare priorità ai rischi. È calcolato come il prodotto di tre fattori classificati: Gravità (S), Occorrenza (O) e Rilevamento (D). La formula è [latex]RPN = S per O per D[/latex]. Ogni fattore è tipicamente classificato su una scala da 1 a 10, consentendo ai team di concentrarsi prima sui rischi con i punteggi più alti.

Postazione di lavoro con interfaccia MATLAB che mostra la sintassi orientata agli array nell'analisi numerica.

Sintassi orientata agli array di MATLAB

MATLAB è un linguaggio basato su matrici in cui il tipo di dato fondamentale è l'array, che non richiede dimensionamento. Questo consente di esprimere in modo conciso le operazioni su matrici e vettori. Ad esempio, la moltiplicazione di due matrici `A` e `B` è semplicemente `C = A * B`, e la moltiplicazione elemento per elemento è `C = A .* B`, astraendo le complesse strutture di loop presenti in altri linguaggi.

Ingegneri che collaborano a sistemi in tempo reale hard e soft in un ufficio moderno.

Sistemi hard e soft in tempo reale

I sistemi real-time sono classificati come "hard" o "soft" in base alle conseguenze del mancato rispetto di una scadenza. In un sistema real-time hard, il mancato rispetto di una scadenza comporta un guasto totale del sistema, come nel caso di un sistema di frenata antibloccaggio. In un sistema real-time soft, il mancato rispetto di una scadenza comporta un degrado delle prestazioni ma non un guasto catastrofico, come nel caso dello streaming audio-video in diretta.

Postazione di lavoro in una sala di controllo che analizza lo scheduling monotonico per i sistemi in tempo reale.

Pianificazione monotonica della velocità (RMS)

Il Rate-Monotonic Scheduling (RMS) è un algoritmo di schedulazione a priorità statica per attività periodiche in un sistema real-time. Assegna le priorità in base alla frequenza delle attività: più breve è il periodo di un'attività (maggiore è la sua frequenza), maggiore è la sua priorità. RMS è un algoritmo a priorità statica ottimale, il che significa che se un qualsiasi algoritmo a priorità statica può schedulazione di un set di attività, anche RMS può farlo. La schedulazione può essere verificata utilizzando un test basato sull'utilizzo.

Spazio di lavoro sulla fluidodinamica computazionale che presenta la simulazione con il metodo dei volumi finiti per l'ingegneria aerospaziale.

Metodo dei volumi finiti (FVM)

Il Metodo dei Volumi Finiti (FVM) è una tecnica numerica dominante nella CFD per la risoluzione di equazioni differenziali parziali. Discretizza il dominio in una mesh di volumi di controllo e applica le equazioni di governo nella loro forma integrale a ciascun volume. Convertendo gli integrali di volume in integrali di superficie utilizzando il teorema della divergenza, si concentra sul calcolo del flusso di proprietà conservate attraverso le facce delle celle.

Verifica formale

La verifica formale è l'uso di metodi matematici per dimostrare o confutare la correttezza del progetto di un sistema rispetto a una specifica formale. A differenza dei test, che possono mostrare la presenza di bug solo per input specifici, la verifica formale può dimostrare la loro assenza per tutti gli input possibili. Si tratta di creare un modello formale del sistema e di utilizzare tecniche come il model checking o il theorem proving.

Programmatore informatico che dimostra lo scoping lessicale nel linguaggio di programmazione R.

Ambito lessicale in R

R utilizza lo scoping lessicale, un concetto ereditato dal linguaggio Scheme. Ciò significa che i valori delle variabili libere in una funzione vengono risolti trovandoli nell'ambiente in cui la funzione è stata definita, non in quello in cui viene chiamata. Questo rende il comportamento della funzione più prevedibile e indipendente dal contesto di chiamata, una caratteristica fondamentale per la programmazione funzionale.

Centro dati che illustra la tolleranza ai guasti bizantina nei sistemi informatici distribuiti.

Tolleranza ai guasti bizantini (BFT)

La BFT (acronimo di Byzantine Fault Tolerance) è una proprietà di un sistema che gli consente di continuare a funzionare correttamente e di raggiungere il consenso anche se alcuni dei suoi componenti si guastano in modi arbitrari e imprevedibili, compreso un comportamento doloso (guasti bizantini). Si tratta di una garanzia molto più forte rispetto alla tolleranza di semplici crash. È necessario un minimo di [latex]3f+1[/latex] di componenti totali per tollerare [latex]f[/latex] di componenti difettosi e maligni.

(se la data è sconosciuta o non rilevante, ad esempio "meccanica dei fluidi", viene fornita una stima approssimativa della sua notevole comparsa)

Schema di blocco di recupero

Tipo

Interruzione

Utilizzo

Precursori

Applicazioni

Brevetti:

Idee e potenziali innovazioni

Contesto storico

Invenzioni, innovazioni e principi tecnici correlati

Zona di Fresnel

Tripla ridondanza modulare (TMR)

Tolleranza ai guasti bizantini (BFT)

TRIZ 40 Principi inventivi e matrice delle contraddizioni

Risultato finale ideale (IFR)

Sistemi hard e soft in tempo reale