Mark Campbell Unitrends

4 points clés pour éviter les défaillances en cas de reprise après sinistre

Cet avis d’expert, éminemment pratique, vous donne des clés sur la meilleure stratégie à adopter pour s’éviter le risque de défaillances dans le cas de reprise après sinistre.

Par le Dr. Mark Campbell, directeur général stratégie et technologies chez Unitrends

Mark Campbell UnitrendsUne recherche américaine récente a montré que 93 % de l’ensemble des entreprises qui ont perdu leur datacenter pendant une période de 10 jours ont fait faillite en moins d’un an. En s’appuyant sur quelques best practices, et en mettant en œuvre une stratégie efficace de reprise après sinistre qui protègera les données de l’entreprise – et donc les emplois – il est pourtant possible d’éliminer ce risque

Comment expliquer les échecs de la reprise après sinistre ?

Si l’on examine les échecs des stratégies de reprise après sinistre, 4 principales causes se distinguent.

Raison n°1 : une technologie de sauvegarde défaillante.

Les sauvegardes et la réplication constituent les piliers d’un plan moderne de reprise après sinistre. Il est essentiel de s’assurer que les technologies fonctionnent parfaitement, en particulier que les sauvegardes sont automatiques et fiables, que l’intégrité des données est garantie grâce à une validation en ligne et hors ligne, que l’audit est automatisé grâce à la virtualisation du basculement et que les sauvegardes sont correctement répliquées vers un site secondaire. En d’autres termes, une entreprise doit s’assurer que ses données sont réellement sauvegardées et répliquées vers un emplacement hors site. Ce processus fournit un niveau de redondance supplémentaire, assurant que les informations restent accessibles sur le site secondaire en cas de panne du datacenter principal, afin que les opérations de l’entreprise puissent se poursuivre sans en être affectées.

Il est également capital de ne jamais négliger les systèmes : La sauvegarde des données n’est efficace que si l’entreprise dispose des systèmes et des infrastructures permettant d’y accéder. Disposer de techniques comme la restauration « bare metal » sur des équipements hétérogènes et la « reprise instantanée » virtualisée permettra ainsi de garantir que les données et les systèmes soient rapidement opérationnels après un sinistre.

Raison n°2 : négliger la planification.

Si les technologies de sauvegarde sont la pierre angulaire sur laquelle bâtir une stratégie de reprise après sinistre, la planification constitue un des piliers qui l’accompagne. Les plans de reprise après sinistre solides se concentrent sur trois domaines principaux :

•             Les collaborateurs : Identifier le personnel opérationnel essentiel et lui fournir les moyens de travailler à distance, ou depuis un site secondaire en cas de sinistre. Cela implique de lui donner un accès direct aux systèmes de récupération, aux données et à l’ensemble des ressources dont il a besoin pour garantir la continuité de service. Il est également important de configurer une forme de communication alternative pour parer à l’éventualité d’une panne de l’infrastructure de communication principale de l’entreprise.

•             L’infrastructure : Identifier l’infrastructure opérationnelle clé et s’assurer qu’elle est protégée. Il est véritablement très important de se rappeler que la raison pour laquelle une entreprise souhaite que son infrastructure informatique survive à son sinistre, c’est pour que ses actifs les plus précieux, à savoir son personnel, puissent utiliser ses systèmes et ses données après le sinistre.

•             Les processus : Identifier les processus opérationnel essentiels – créer un document détaillant étape par étape qui fait quoi en cas de problème – et s’assurer que les collaborateurs sont conscients de leur rôle, mais qu’ils sont également préparés. L’adhésion de l’ensemble des acteurs concernés au sein de l’entreprise est une pièce extrêmement importante du puzzle : il faut prendre en compte tous les processus critiques pour le fonctionnement quotidien de l’entreprise, pas seulement les processus informatiques.

Raison n°3 : Oublier de tester, tester et tester à nouveau. 

Ne pas effectuer régulièrement des tests de reprise après sinistre est un problème majeur pour les administrateurs en raison de l’évolution constante de l’infrastructure informatique. Il existe souvent une différence difficile à déceler liée, mais pas totalement reflétée par l’hétérogénéité. Pour y remédier, des tests minutieux et itératifs de reprise après sinistre doivent être effectués selon un calendrier régulier et peuvent être adoptés comme une pratique d’entreprise standard supplémentaire.

La création d’un plan de reprise après sinistre performant ne consiste pas simplement à produire des processus et des détails apparemment sans fin. Elle exige également une certaine créativité nécessaire pour sortir des sentiers battus et ainsi envisager tout un éventail de sinistres et leurs conséquences en matière de reprise après sinistre. En d’autres termes, mieux vaut considérer sérieusement les scénarios les plus improbables en plus de ceux que vous estimez les plus probables, car on ne sait jamais ce qui peut se passer.

Raison n°4 : Supposer l’homogénéité.

Pour optimiser le retour sur investissement, il est important de maintenir une souplesse permettant au service informatique de rester réactif et agile aussi bien face à l’évolution des besoins des utilisateurs que celle des technologies et des acteurs du marché.

Les défaillances au niveau des reprises après sinistre se produisent parce que les responsables informatiques ne prennent en charge qu’une seule technologie dans leur planification, par exemple les technologies de stockage comme le SAN ou le NAS, mais ignorent le stockage direct. Ils gèrent la virtualisation, mais oublient les serveurs physiques, ou bien encore prennent en charge les dispositifs physiques, mais ne prennent pas en compte le besoin de restauration entre plusieurs modèles et générations de serveurs. En mettant en œuvre un plan de reprise après sinistre et les technologies associées qui restent ouvertes à l’hétérogénéité et s’adaptent aux environnements informatiques agiles, les entreprises s’assurent de meilleurs résultats lorsqu’elles en auront le plus besoin.

Conclusion

La mise en œuvre d’une stratégie de reprise après sinistre performante ne doit pas nécessairement être difficile ou consommer une multitude de ressources informatiques. Une technologie de sauvegarde fonctionnelle, des plans de reprise après sinistre détaillés, des tests en continu et l’hétérogénéité sont les piliers essentiels qui permettent d’empêcher les échecs de la reprise après sinistre, et vous garantissent le succès de votre stratégie restauration après sinistre.

 

A propos de l’auteur

Le Dr. Mark Campbell est directeur général stratégie et technologies chez Unitrends. Avant de rejoindre Unitrends, Mark a cofondé MindAmp Corporation, une société de conseil en développement logiciel et développement d’activité pour les entreprises technologiques. Il a également été Vice President en charge de la gestion de systèmes chez Legent Corporation, ainsi que Vice President en charge des systèmes d’entreprise chez AT&T et NCR Corporation.