Product Design, Manufacturing & Innovation Resources

Hogar » Esquema de Bloques de Recuperación

Esquema de Bloques de Recuperación

1975-06-01

Brian Randell

(Imagen generada únicamente con fines ilustrativos)

The recovery block scheme is a software fault-tolerance technique based on design diversity and backward error recovery. It structures a program as a series of blocks, each with a primary module, an acceptance test, and one or more alternate modules. If the primary module’s output fails the acceptance test, the system state is restored, and an alternate module is executed.

El concepto de bloque de recuperación, introducido por Brian Randell, es un enfoque estructurado para lograr la tolerancia a fallos del software. Se basa en el principio de proporcionar módulos de software redundantes, conocidos como alternativas, para una operación determinada, junto con un mecanismo para verificar la corrección del resultado de la operación. Los componentes clave son: la prueba de aceptación (AT), la alternativa primaria (P) y una secuencia de alternativas secundarias (Q1, Q2, ...). Antes de ejecutar la alternativa primaria, el sistema guarda un punto de control de su estado actual. Una vez completada P, se ejecuta la prueba de aceptación sobre la salida. La AT es una pieza lógica crucial que verifica que el resultado sea aceptable; no necesita demostrar una corrección absoluta, sino que el resultado sea razonable y consistente.

Si el resultado supera la prueba de aceptación, el punto de control se descarta y el programa continúa. Sin embargo, si la prueba de aceptación falla, o si la alternativa principal no se ejecuta (por ejemplo, debido a un error de tiempo de ejecución), el sistema realiza una reversión. Restaura el estado desde el punto de control guardado y ejecuta la siguiente alternativa de la secuencia (Q1). La salida de Q1 se somete entonces a la misma prueba de aceptación. Este proceso continúa hasta que una alternativa produce un resultado que supera la prueba, o se agotan todas las alternativas, momento en el que se declara un fallo a nivel de sistema.

La eficacia de los bloques de recuperación depende de la diversidad de las alternativas. Los módulos principal y secundario deben diseñarse e implementarse de forma independiente, idealmente por equipos diferentes que utilicen algoritmos o lenguajes de programación diferentes. Esto minimiza la posibilidad de que exista un fallo de diseño común (un error) en todas las alternativas, lo que provocaría que todas fallaran la prueba de aceptación por igual. La prueba de aceptación en sí misma constituye un punto único de fallo y debe ser más sencilla y fiable que los módulos que prueba. En comparación con la programación de N versiones, otra técnica de tolerancia a fallos de software, los bloques de recuperación pueden ser más eficientes, ya que solo ejecutan un módulo a la vez, pero introducen latencia debido a la posibilidad de reversión y reejecución.

Análisis del árbol de fallas (FTA), Mejora de procesos, Seguro de calidad, Control de calidad, Ingeniería de confiabilidad, Gestión de riesgos, Seguridad, Ingeniería de software, Pruebas de software

UNESCO Nomenclature: 1203

- Informática

Tipo

Software/Algoritmo

Ruptura

Incremental

Uso

Nicho/Especialización

Precursores

Conceptos de manejo de excepciones en lenguajes de programación
Mecanismos de transacciones y reversiones de bases de datos
Trabajos iniciales sobre la verificación y corrección del programa
Principios generales de redundancia de la ingeniería de hardware

Aplicaciones

software crítico para la seguridad en sistemas de señalización ferroviaria
sistemas de protección de reactores nucleares
Aplicaciones aeroespaciales donde una falla de software es catastrófica
sistemas operativos experimentales tolerantes a fallos

Patentes:

Ideas para posibles innovaciones

Debido al bloqueo del tráfico generado por bots, que actualmente supera los 40.000 al día, este contenido está reservado para los miembros de la comunidad.
> Iniciar sesión < o > Registrarse < (100% gratis) para acceder a esto, al igual que a todo el demás contenido y herramientas restringidos.

Relacionado con: bloques de recuperación, tolerancia a fallos de software, diversidad de diseño, prueba de aceptación, recuperación de errores hacia atrás, puntos de control, Brian Randell, software crítico para la seguridad, módulos redundantes, programación de versiones N.

Contexto histórico

Ingeniero de software que codifica clases abstractas en un entorno IDE moderno.

Abstracción (programación orientada a objetos)

La abstracción en programación orientada a objetos (POO) consiste en ocultar detalles complejos de implementación y mostrar únicamente las características esenciales del objeto. Se centra en lo que hace un objeto, no en cómo lo hace. Esto se logra mediante clases e interfaces abstractas, que definen un modelo para otras clases sin proporcionar una implementación completa, simplificando así los sistemas complejos.

Siete herramientas básicas de la calidad

Las Siete Herramientas Básicas de la Calidad son un conjunto de técnicas gráficas identificadas por Kaoru Ishikawa para la resolución de problemas relacionados con la calidad. Estas herramientas son: diagrama de causa y efecto (espina de pescado), hoja de verificación, gráfico de control, histograma, diagrama de Pareto, diagrama de dispersión y estratificación (a menudo presentada como diagrama de flujo). Se consideran básicas porque son fáciles de usar y requieren poca formación estadística formal.

Oficina de ingeniería de software que muestra las fases del proceso del modelo en cascada.

El modelo de cascada (software)

El modelo en cascada es un proceso de desarrollo de software secuencial y no iterativo, donde el progreso fluye de forma continua (como una cascada) a través de distintas fases: concepción, inicio, análisis, diseño, construcción, pruebas, implementación y mantenimiento. Cada fase debe completarse por completo antes de pasar a la siguiente. A menudo se compara con los modelos iterativos para destacar su flexibilidad.

Esquema de Bloques de Recuperación

Un equipo de ingenieros debate sobre la verificación y validación en el desarrollo de software.

Verificación frente a validación

La verificación y la validación son procesos distintos. La verificación garantiza que un producto cumple los requisitos especificados ("¿Lo estás construyendo bien?"). La validación garantiza que el producto satisface las necesidades reales del usuario y el uso previsto ("¿Está construyendo lo correcto?"). Son actividades complementarias dentro de la gestión de la calidad, a menudo realizadas secuencialmente o en paralelo para garantizar tanto la corrección como la utilidad.

Instrumento analítico de precisión en un laboratorio para medir el límite de repetibilidad.

Límite de repetibilidad (estadísticas)

El límite de repetibilidad, [latex]r[/latex], es un valor crítico derivado de la desviación típica de la repetibilidad ([latex]s_r[/latex]). Representa la máxima diferencia absoluta esperada entre dos resultados de un mismo ensayo, obtenidos en condiciones de repetibilidad, con una probabilidad de 95%. Suele calcularse como [latex]r = 2,8 veces s_r[/latex]. Si la diferencia supera [latex]r[/latex], los resultados se consideran sospechosos.

Programador que trabaja en la estructura de un compilador de tres etapas en una oficina de desarrollo de software.

La estructura del compilador de tres etapas

Un compilador moderno suele estructurarse en tres etapas: front-end, middle-end y back-end. El front-end analiza el código fuente, verifica su corrección y crea una representación intermedia (RI). El middle-end optimiza esta RI. A continuación, el back-end traduce la RI optimizada a código máquina objetivo para una arquitectura de CPU específica.

1970

1970-01-01

1975-06-01

1980

1970

1973

1980

1982-07-01

Reunión de evaluación de riesgos con ingenieros que analizan los Números de Prioridad de Riesgo en un despacho profesional.

Número de prioridad de riesgo (RPN)

El Número de Prioridad de Riesgo (NPR) es una medida cuantitativa utilizada en el AMFE para priorizar los riesgos. Se calcula como el producto de tres factores clasificados: Gravedad (S), Ocurrencia (O) y Detección (D). La fórmula es [latex]RPN = S por O por D[/latex]. Cada factor se suele clasificar en una escala del 1 al 10, lo que permite a los equipos centrarse primero en los riesgos con mayor puntuación.

Estación de trabajo informática con interfaz MATLAB que muestra la sintaxis orientada a matrices en el análisis numérico.

Sintaxis orientada a matrices de MATLAB

MATLAB es un lenguaje matricial donde el tipo de dato fundamental es el array, sin necesidad de dimensionamiento. Esto permite la expresión concisa de operaciones con matrices y vectores. Por ejemplo, multiplicar dos matrices «A» y «B» es simplemente «C = A * B», y la multiplicación elemento por elemento es «C = A .* B», lo que elimina las complejas estructuras de bucles presentes en otros lenguajes.

Ingenieros colaborando en sistemas de tiempo real en una oficina moderna.

Sistemas de tiempo real duros y blandos

Real-time systems are classified as "hard" or "soft" based on the consequence of missing a deadline. In a hard real-time system, missing a deadline is a total system failure, such as in an anti-lock braking system. In a soft real-time system, missing a deadline leads to degraded performance but not catastrophic failure, such as in live audio-video streaming.

Puesto informático en una sala de control que analiza la programación monótona de sistemas en tiempo real.

Programación monotónica de velocidad (RMS)

La Programación Monotónica de Tasa (RMS) es un algoritmo de programación de prioridad estática para tareas periódicas en un sistema de tiempo real. Asigna prioridades según la frecuencia de las tareas: cuanto menor sea el período de una tarea (mayor su tasa), mayor será su prioridad. RMS es un algoritmo de prioridad estática óptimo; es decir, si cualquier algoritmo de prioridad estática puede programar un conjunto de tareas, RMS también puede. La programabilidad se puede comprobar mediante una prueba basada en la utilización.

Espacio de trabajo de dinámica de fluidos computacional que muestra la simulación por el método de volúmenes finitos para la ingeniería aeroespacial.

Método de volumen finito (FVM)

El Método de Volumen Finito (MFF) es una técnica numérica dominante en CFD para la resolución de ecuaciones diferenciales parciales. Discretiza el dominio en una malla de volúmenes de control y aplica las ecuaciones que lo rigen en su forma integral a cada volumen. Al convertir las integrales de volumen en integrales de superficie mediante el teorema de divergencia, se centra en el cálculo del flujo de propiedades conservadas a través de las caras de la celda.

Verificación formal

La verificación formal es el uso de métodos matemáticos para probar o refutar la corrección del diseño de un sistema con respecto a una especificación formal. A diferencia de las pruebas, que sólo pueden demostrar la presencia de errores para entradas específicas, la verificación formal puede demostrar su ausencia para todas las entradas posibles. Consiste en crear un modelo formal del sistema y utilizar técnicas como la comprobación de modelos o la demostración de teoremas.

Programador informático demostrando el alcance léxico en el lenguaje de programación R.

Alcance léxico en R

R utiliza el alcance léxico, un concepto heredado del lenguaje Scheme. Esto significa que los valores de las variables libres de una función se resuelven buscándolos en el entorno donde se definió la función, no en el entorno donde se llama. Esto hace que el comportamiento de la función sea más predecible e independiente del contexto de llamada, una característica clave para la programación funcional.

Centro de datos que ilustra la tolerancia bizantina a fallos en sistemas informáticos distribuidos.

Tolerancia a fallas bizantinas (BFT)

BFT (acrónimo de Byzantine Fault Tolerance) es una propiedad de un sistema que le permite seguir funcionando correctamente y alcanzar el consenso aunque algunos de sus componentes fallen de forma arbitraria e impredecible, incluido el comportamiento malicioso (fallos bizantinos). Se trata de una garantía mucho mayor que la de tolerar simples fallos por colisión. Se requiere un mínimo de [latex]3f+1[/latex] componentes totales para tolerar [latex]f[/latex] componentes defectuosos y maliciosos.

(Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)