Point de défaillance unique

point d'un système informatique dont une panne entraîne l'arrêt complet

Un point de défaillance unique (single point of failure ou SPOF en anglais) est un point d'un système informatique dont le reste du système est dépendant et dont une panne entraîne l'arrêt complet du système.

Le point de défaillance unique a comme principale caractéristique de ne pas être protégé (redondant). Il est donc un risque pour la disponibilité du système. Dans la définition « single point of failure », le mot anglais single souligne le caractère unique et donc fragile du « composant ».

La notion de point de défaillance unique est fortement liée à celle de service, dans la mesure où un problème sur le point concerné entraîne une interruption de service.

La présence d'un point de défaillance unique dans un système augmentant la probabilité d'apparition d'un déni de service, elle entraîne un risque sur la qualité de service.

Dans un cadre de haute disponibilité, il est impossible de laisser des points individuels de défaillance dans un système.

Exemples

modifier

Architecture physique

modifier
 
Il y a ici deux points individuels de défaillance, le routeur et le serveur d'application qui sont tous les deux seuls et pourraient bloquer le service de production pour les 3 postes.

Potentiellement, tous les éléments d'une architecture physique peuvent devenir des points individuels de défaillance. Les éléments principaux sont :

Selon les conditions où se situe l'hébergement de services à distance, on peut également l'appliquer au centre de données où est hébergée l'architecture :

Architecture logicielle

modifier

Il en va de même pour nombre d'éléments de l'architecture logicielle, dans le cadre d'une Architecture Orientée Service (SOA). Parmi les éléments les plus sensibles, et par conséquent les plus sujets à attaques, on doit citer :

Le risque engendré par la défaillance d'un de ces éléments doit être réduit par l'application du principe de redondance.

Détection

modifier

Les points individuels de défaillance sont fortement liés à la notion de service. Un SPOF peut donc ne pas être détecté du point de vue d'un service défini (comme le fonctionnement d'un intranet), mais être évident du point de vue d'un autre service (comme un service d'hébergement de sites web).

Il est par conséquent nécessaire de faire une cartographie détaillée et exhaustive d'un système pour pouvoir détecter les points individuels de défaillance.

Élimination

modifier

La principale technique d'élimination d'un point individuel de défaillance, quel que soit le système dont il fait partie, consiste à ajouter une redondance du point de défaillance.

Articles connexes

modifier