4.2) Sistemas operativos tolerantes a fallas
Desde el principio, el iAPX 432 incluía soporte para la tolerancia a fallas. Todos los chips 432 se podían configurar en pares para el Chequeo de Redundancia Funcional (Functional Redundancy Checking, FRC), en la cual un componente, el amo (master), funcionado normalmente, y un segundo, el chequeador (checker), realizaron las mismas operaciones internas en paralelo y verificaron sus resultados contra los del amo (master).El FRC preveía la detección de falla, pero la tolerancia de avería completa requería un mecanismo de recuperación. Los sistemas basados en la Arquitectura de Interconexión apoyaron la recuperación automática de falla al combinar pares de módulos FRC para la Redundancia Modular Cuádruple (QMR). En una configuración QMR, en un momento dado, un módulo de FRC era un primario y el otro era una sombra. Los dos módulos funcionaban en lockstep, pero los papeles se alternan para detectar fallas latentes. El módulo de sombra no manejaba el bus. Si una falla se detectaba en cualquiera de los módulos de FRC, ese módulo era desactivado mientras que el módulo sin fallas podía continuar la operación. El software era notificado, y podía elegir dejar el sistema continuar funcionando (sin la tolerancia a fallas para ese módulo), aparear el módulo con un repuesto, o dejar el módulo fuera de línea (desplazando su carga de trabajo a otros procesadores en el sistema con una elegante degradación de desempeño).