Catastrophes naturelles: les bonnes pratiques de reprises après sinistre

par Nir Ilani, Directeur, Marketing Produits, Application Delivery – Radware

“Espérer le meilleur – s’attendre au pire”

Bien que le rythme des éruptions volcaniques en Islande soit de une tous les cinq ans, nous avons tous été témoins le 13 avril dernier  des effets importants de l’éruption non seulement en Islande mais partout en Europe – et au final à l’échelle mondiale.  Tout au long du mois d’avril, le panache de gaz volcanique et de cendre de silice de 11 mètres de haut, émanant du volcan Eyjafjallajokull, s’est dispersé à travers l’Europe, réduisant à néant les possibilités de voyage sur l’ensemble du continent. L’espace aérien britannique a été complètement fermé pendant plusieurs jours, et 2/3 des vols européens ont été annulés, de même que 180 vols transatlantiques. Des retards et des annulations ont touché les aéroports de Toronto à Tokyo, avec un coût estimé pour l’ensemble de l’industrie du transport aérien à $200 millions par jour.

Si le transport aérien est une victime évidente de l’éruption volcanique, il y a beaucoup à apprendre d’un point de vue réseau et applications de ce type de catastrophes, et en particulier quant aux précautions à prendre pour éviter que les centre de données ne soient sévèrement impactés.

Une solution de reprise après sinistre s’impose

L’impact d’une telle catastrophe est immédiat. Ainsi, l’éruption du volcan islandais a empêché la population de se rendre à son travail ou de rentrer chez elle, générant de forts embouteillages et causant la fermeture de commerces et bureaux.  Les services et applications en ligne, tout comme leurs cousins les ‘brick & mortar’ sont devenus indisponibles par manque de personnel opérant sur les applications et les systèmes associés ou du fait d’autres problèmes physiques ou techniques inhérents à la catastrophe. 

C’est dans ce type de situations que l’on parle généralement de  catastrophes sur les data center, le data center et l’ensemble des applications, services et infrastructures se trouvant interrompus et donc non opérationnels.
Prévenir de tels problèmes au sein des data centers est possible. Il est ainsi recommandé de concevoir et d’implémenter une solution de reprise après sinistre, en anticipant plutôt que d’attendre que la catastrophe se produise.  Cela requiert la mise en place d’un data center de secours, doté des mêmes applications et capable de fournir les services identiques soumis aux mêmes engagements de services (SLA).  Déployer un tel projet implique d’être en mesure de couvrir l’ensemble des aspects opérationnels du data center incluant le stockage, le réseau, les serveurs, l’alimentation électrique, la climatisation et autres, ce qui est loin d’être une tâche simple. Il faut pouvoir prendre en considération les besoins de capacité et estimer la charge au moment de la catastrophe. Le déploiement d’une solution de load balancing au sein des deux data centers permettra de garantir que l’ensemble du trafic et des échanges utilisateurs seront redirigés de manière transparente vers le second data center, fournissant ainsi aux utilisateurs les applications et les services en continu, sans subir les effets de la catastrophe.

Les choses se compliquent: les effets collatéraux

Les catastrophes n’affectent pas seulement leur périmètre physique. Comme cela a été le cas lors de l’éruption du volcan islandais, ses gaz et cendres de silice ont eu des répercussions profondes.  Quand un aéroport d’une ville européenne ferme, le détournement de l’ensemble de son trafic vers d’autres aéroports s’impose, provoquant une augmentation notable des transactions et des traitements des systèmes informatiques des aéroports voisins. Ainsi, la fermeture de douzaines d’aéroports en Europe a généré un important pic de trafic, non seulement sur les systèmes des aéroports mais aussi sur d’autres services de transports comme les sites web de transport ferroviaire ou de compagnies aériennes non européennes ou encore d’autres services d’information en ligne en lien avec la catastrophe. Un très grand nombre d’usagers ont cherché à se connecter sur ses sites Web, sollicitant de manière inattendue les serveurs et les infrastructures des data centers, avec parfois un taux de connexion 50 fois supérieur à la normale.

Pour faire face à ces pointes de trafic, les infrastructures réseaux doivent être capables de répondre à une forte augmentation de capacité. Cela sous entend que l’infrastructure doit non seulement être hautement performante pour pouvoir absorber l’augmentation du trafic réseau mais également capable d’évoluer selon la demande.  Une infrastructure à la demande offre la flexibilité d’ajouter plus de capacité de bande passante et de services sans avoir à remplacer des matériels ou subir une baisse de service. En utilisant cette approche à la demande, non seulement on réduit le TCO et on augmente le ROI mais on assure également une réponse de manière optimale aux besoins de performance et de capacité en constante évolution, et ce même dans les périodes les plus critiques comme peuvent l’être les catastrophes naturelles.