Dossier Stockage (volet 6) : Plan de reprise d’activité, mieux vaut prévenir que guérir

Cloud

À l’heure d’Internet, il est indispensable pour la plupart des sociétés
d’offrir à leur clientèle une continuité de service, même si la société a subi
un sinistre informatique important.

Pour assurer une telle continuité de service, il est indispensable de mettre en place un plan de reprise après sinistre qui permettra de redémarrer l’activité après le crash du système informatique et de disposer de données indispensables aux demandes des clients.

Deux autres éléments font toutefois partie de la continuité de service, éléments qui sont parfois confondus avec la reprise après sinistre.

Il s’agit tout d’abord de la continuation d’activité laquelle, au-delà de l’aspect logiciel, implique la mise en oeuvre de procédures concernant le personnel, les ressources, les clients et fournisseurs (sans même parler de la communication de crise que devra instaurer l’entreprise pour ne pas de ternir son image durant cette épreuve et surtout pour, de ce fait, pas perdre de clients).

Ensuite, une bonne planification de ces contingences, correspondant à l’impact du désastre par rapport aux clients et/ou fournisseurs, est, elle aussi, impérative.

Disaster Recovery : savoir prévoir et intervenir

Il faut bien avouer que la croissance des données constatée année après année ne facilite pas les choses, d’autant plus que les infrastructures de stockage deviennent de plus en plus complexes.

En effet, les entreprises ont la fâcheuse habitude, au fil du temps, de collectionner tous types de matériels et de systèmes qu’il est alors nécessaire de faire cohabiter. Cette tour de Babel fait fort heureusement l’objet d’un mouvement de consolidation, ce qui pose un autre problème : celui de la fragilité ou de la robustesse du système consolidé.

Par ailleurs, la multiplication des sites informatiques au sein d’un même groupe, amène à se poser la question d’une sauvegarde centralisée et/ou d’une multiplication des sauvegardes locales. C’est donc à une hiérarchisation des solutions (et surtout des implantations) de sauvegarde-archivage qu’il faut aboutir, sous peine de connaître des aléas lorsque l’on voudra restaurer le ou les systèmes suite à une panne ou à un accident plus grave.

Quoi qu’il en soit, pour assurer cette reprise d’activité en la gérant au mieux, il faut tout d’abord définir le type de sinistre à prendre en compte. Généralement, on classe ceux-ci en trois catégories :

  • Les incidents — il s’agit d’une panne de courant, de coupures intermittentes, ou d’un accident affectant l’alimentation électrique, ces petits désastres sont très répandus et peuvent provoquer de sérieux dégâts si l’entreprise ne prend pas garde. La solution la plus simple pour pallier ce problème n’est pas d’intervenir après coup, mais bel et bien de prévenir ces désagréments en installant une alimentation de secours sur les serveurs et les baies de stockage.
  • Les accidents et désastres naturels mineurs — incendies, inondations, ils nécessitent une planification plus importante. De ce fait, il est nécessaire de mettre en place un service extérieur (site de secours mobile ou site distant) pour assurer un redémarrage en mode dégradé, lequel permettra toutefois de répondre en majeure partie aux demandes les plus courantes de la clientèle. En pareil cas, la duplication des données sur le site de secours ne nécessite pas forcément une sauvegarde synchrone, mais autorise une perte légère (selon les cas, jusqu’à quatre heures maximum) des données traitées par l’entreprise.
  • Les grandes catastrophes — elles nécessitent la mise en place d’un site de secours distant offrant toutes les fonctionnalités du site principal. Ce site secondaire verra ses données totalement synchronisées avec celles du site principal. Il s’agit ici de solutions particulièrement coûteuses ne pouvant convenir qu’à des entités nécessitant un service 24/7 (assurances, grands comptes, banques, organisations gouvernementales, ONG?).

Quel que soit le type d’accident, toute récupération se décompose alors en trois phases : la planification, les solutions technologiques, le test des procédures. Nous nous contenterons d’envisager ici les deux premiers points, les procédures variant par trop d’un métier à l’autre.