En juin 2022, l’Uptime Institute a publié sa dernière analyse des pannes, un rapport annuel qui examine la fréquence et la gravité des pannes des centres de données. Le rapport conclut que les conséquences financières et les perturbations globales des pannes augmentent régulièrement.
Le coût et la fréquence des pannes ont augmenté
Le rapport révèle qu’une organisation sur cinq a connu une panne « grave » ou « grave », entraînant des pertes financières importantes, une atteinte à sa réputation, des violations de conformité et, dans certains cas graves, des pertes de vie, au cours des trois dernières années. Ces données sont également évidentes dans l’enquête 2022 sur la résilience des centres de données d’Uptime, qui a révélé que 80 % des gestionnaires et opérateurs de centres de données ont connu une sorte de panne au cours des trois dernières années.
Il a également montré que plus de 60 % des pannes entraînaient des pertes totales d’au moins 100 000 $, soit une hausse substantielle par rapport à 39 % en 2019. La part des pannes coûtant plus d’un million de dollars est passée de 11 % à 15 % au cours de la même période.
43 % des pannes des centres de données sont causées par des pannes de courant
Surtout, les pannes liées à l’électricité représentaient 43 % des pannes classées comme importantes (entraînant des temps d’arrêt et des pertes financières). Le rapport indique également que la principale cause d’incidents électriques est la panne de l’alimentation sans interruption (UPS).
Paul Brickman, directeur commercial chez Crestchic Loadbanks, qui propose des solutions de test pour les solutions d’alimentation de secours utilisées dans les centres de données, a commenté : « Nous constatons sans aucun doute une demande croissante d’équipements de test de charge sur le marché des centres de données. Cela est dû en partie à la croissance du marché, mais une part importante provient des opérateurs de centres de données qui sont de plus en plus conscients des dangers liés au fait de ne pas tester leurs systèmes d’alimentation de secours. Alors que la résilience des réseaux nationaux et locaux continue de faire face à des facteurs de transition énergétique, notamment les baisses de tension et l’instabilité des fréquences, ne pas tester signifie flirter avec une panne complète du système. Pour les infrastructures critiques telles que les centres de données, où les temps d’arrêt sont à la fois extrêmement coûteux et inquiétants, le risque n’en vaut tout simplement pas la peine.
L’importance de tester les générateurs de secours
En tant qu’entreprise, notre perception, en travaillant dans l’industrie, est que la plupart des centres de données disposent de stratégies robustes pour faire face aux pannes de courant. Les générateurs et les systèmes d’alimentation sans interruption (UPS) sont universellement acceptés comme éléments d’infrastructure commerciale critique.
Des problèmes surviennent lorsqu’il n’y a pas de calendrier de tests régulier. Une mise sous tension occasionnelle du générateur ou un test pendant une période minimale sont souvent considérés comme suffisants. En réalité, tous les générateurs de secours doivent être testés régulièrement pour des conditions d’urgence réelles à l’aide d’un banc de charge résistif-réactif de 0,8pf.
En plus de garantir que le générateur fonctionne efficacement dans des conditions opérationnelles réelles, les tests montreront également comment un système fera face à une chute de tension dans son régulateur. Ceci est vital pour les centres de données, où plusieurs générateurs peuvent fonctionner en parallèle. Dans ce type d’application, un problème sur un générateur pourrait avoir un effet néfaste sur les autres. Au-delà des performances de fonctionnement du générateur, un test de charge sécurisé du système garantira que toutes les commandes de commutation fonctionnent lorsqu’elles sont appelées, telles que les commutateurs de transfert automatiques et la protection des circuits locaux. Tester régulièrement ces systèmes garantit des performances optimales en cas d’urgence réelle.
Les pannes sont une priorité absolue pour les clients, les investisseurs et les régulateurs
Dans un communiqué de presse, Andy Lawrence, membre fondateur et directeur exécutif d’Uptime Institute Intelligence, aurait déclaré : « Les opérateurs d’infrastructures numériques ont encore du mal à répondre aux normes élevées que les clients attendent et aux accords de niveau de service qu’exigent – malgré l’amélioration des technologies et la solide position du secteur. investissement dans la résilience et la prévention des temps d’arrêt. Poursuivant en ajoutant : « Les pannes restent une préoccupation majeure pour les clients, les investisseurs et les régulateurs. »
Correctement planifiées et mises en œuvre, les stratégies de maintenance préventive peuvent minimiser la probabilité de pannes et de pannes imprévues, éliminant ainsi le risque potentiel de problèmes commerciaux, de réputation et juridiques coûteux.