Microsoft incidents

Coronavirus : la demande de Microsoft Azure en hausse de 775%

La crise du Covid 19 entraîne une hausse du télétravail et de l’activité des services de santé qui sollicitent la plateforme de cloud computing Microsoft Azure.

A tel point qu’entre le 24 et le 26 mars, le centre de gestion des incidents de Microsoft n’a pas pu faire face aux 6 136 demandes d’aide de ses clients.

Certains ont vécu jusqu’à 9 heures d’attente pour que leur problème soit résolu.

Un embouteillage d’incidents

Du 24 au 26 mars 2020, Microsoft a mis en moyenne 5 heures pour répondre aux demandes de dépannage de ses clients. Il faut savoir qu’en temps normal, le délai de réponse avancé par Microsoft est de seulement 10 minutes.

Pas si étonnant puisque depuis le début de la crise du coronavirus, la demande en cloud computing a explosé.

Dans les régions en confinement la demande d’Azure a vécu une hausse titanesque de 775% rapporte la firme sur son blog corporatif.

Conséquence naturelle : les utilisateurs ont été bien plus nombreux à signaler des incidents.

Plus particulièrement le 24 mars et pendant les deux jours suivants, 6 136 clients ont subi un énorme ralentissement de Microsoft Azure.

Le problème technique puise son origine dans les machines virtuelles anormalement sur sollicitées dont la capacité maximale a visiblement été atteinte.

Les plus chanceux des utilisateurs lésés ont déploré des retards de 21 minutes. En cause : le service Pipelines DevOps qui était affecté du fait de la publication de nouvelles versions sur Windows et Linux.

Mais d’après Chad Kimes, directeur de l’ingénierie chez Azure, le plus long retard s’élevait tout de même à 9 heures.

Chad Kimes s’est excusé publiquement pour la frustration causée auprès des utilisateurs après avoir reconnu que « cet incident a été problématique ».

Microsoft reconnaît devoir améliorer ses processus

La firme américaine prévoit d’améliorer ses processus pour que les incidents de retard de pipeline comme celui du 24 mars soient pris en main aussi rapidement que les autres incidents par le centre de gestion.

Le directeur de l’ingénierie chez Azure Chad Kimesprécise : « Lorsque les incidents impliquent des défaillances côté demande client ou des impacts sur les performances, nous disposons d’un outil automatisé qui lance un incident et communique avec un responsable dans ce que nous appelons un PIM (gestionnaire d’incident primaire). 

Les retards de pipeline sont détectés par différents outils, et le PIM n’est actuellement pas fait pour ce type d’incidents. Par conséquent, alors que le responsable s’efforçait de comprendre les problèmes techniques et de chercher des solutions pour les atténuer, le PIM était encore en sommeil. Ce n’est que lorsque le PIM a été alerté que l’incident a finalement été reconnu. »

Pour faire face à l’ampleur des goulets d’étranglement, Microsoft est également en train d’apporter des modifications architecturales.

Microsoft peut-il répondre à toutes les demandes de cloud computing ?

La situation de pandémie est inédite. Résultat, la demande en cloud computingliée à l’aménagement du télétravail et aux services de santé auprès de Microsoft Azure est en plein boom.

Xavier Perret, directeur de l’entité Azure France explique : « La priorité absolue devant être accordée aux services de secours, de santé, de gestion des urgences, mais aussi aux infrastructures essentielles et critiques pour le bon fonctionnement de l’économie, notamment dans le domaine bancaire, alimentaire ou gouvernemental. Sans oublier le télétravail »

Soyez rassuré : si votre activité n’est pas prioritaire, vous pouvez malgré tout demander de la capacité supplémentaire.

En effet, Xavier Perret complète : « Les clients peuvent à tout moment solliciter les commerciaux avec lesquels ils sont en contact pour exprimer leurs besoins en ressources additionnelles. »

A réception de votre demande, celle-ci est transmise le jour même à la cellule de crise de Microsoft France qui met immédiatement en œuvre les capacités nécessaires pour les infrastructures considérées prioritaires.

Microsoft se veut rassurant : les capacités des data centers seraient suffisantes

La saturation du cloud computing concerne toutes les plateformes, et pas seulement Microsoft.

Mais l’enjeu de la capacité des data centers est d’autant plus important que 90% des entreprises du Fortune 500 sont des clients Microsoft Azure.

Si Microsoft rencontre de nouvelles contraintes de capacité dans ses data centers américains, comment être sûr qu’il ne sacrifiera pas l’économie européenne pour préserver l’économie américaine ?

Le directeur France se veut rassurant : « Globalement, Microsoft Azure a la masse critique pour accompagner la croissance du cloud et répondre aux défis qui se présentent en ce moment. Nous disposons évidemment de capacités disponibles dans d’autres data centers sur d’autres géographies, qui peuvent être mobilisées pour les clients français. »