Migration de centres de données à chaud, “On a réussi!”

Sortir de versions qui ne sont plus supportées, faire une extension de centre de données, remplacer un centre de données, mettre en place des plans de reprise d’activité, les cas d’utilisation qui demandent des mouvements de charges de travail entre différents centres de données sont nombreux. Et il n’a jamais été aussi simple et rapide de passer de la côte Ouest à la côte Est ou d’Amsterdam à Limbourg. En quelques clics, les charges de travail se retrouvent envoyées via les tunnels sécurisés de HCX entre différents centre de données.

Pour donner quelques chiffres, il a fallu 5 semaines à un client pour bouger 300TB de VMs, incluant la planification, l’installation, la réplication et le transfert. En un jour, ce client est monté à 23TB de données transférées, soit 1TB/heure entre deux centres de données en Allemagne. Un autre client a bougé de son centre de données plus de 200TB, répartis sur 750 VMs, sans temps d’arrêt.

Il y a encore un an, personne n’aurait jamais imaginé ces mouvements à chaud. Le concept même de déplacement des charges de travail entre deux centres de données était un fantasme, le faire à chaud était simplement chimérique.

Le déplacement des charges de travail repose sur la technologie VMware, HCX, à destination de la plateforme Cloud Privé. Cette technologie, en plus de gérer le déplacement sécurisé des charges de travail, permet une transition transparente en assurant une connexion réseau entre le centre de données source et le centre de données de destination via un L2 étendu, un « réseau étendu ». La machine virtuelle qui est envoyée dans Cloud Privé à chaud ne perd donc aucune connectivité avec les autres machines avec lesquelles elle fonctionne en conditions nominales.

HCX  utilise 3 appliances, une pour gérer le transfert des machines virtuelles d’un centre de données à l’autre, la Cloud Gateway (CGW), une qui fonctionne de pair avec la CGW, le WAN Accelerator, et une qui sert au réseau étendu (L2C). Ces appliances sont déployées automatiquement côté Cloud Privé, et nécessitent une  quatrième appliance côté « sur site » pour piloter le déploiement et la configuration de ces trois éléments indispensables.

Note : La CGW apparaît aussi dans l’inventaire comme un hôte enregistré.

Migration

Pour résumer, deux  tunnels minimum vont se monter entre le centre de données source et le centre de données de destination, le Cloud Privé OVH. Un tunnel entre les CGW pour le transfert des VMs, et un tunnel entre les L2C qui va créer le réseau étendu dans le cas d’un besoin d’extension d’un sous-réseau. Il va de soi qu’il est possible de déployer plusieurs L2C, en fonction du nombre de réseaux à étendre.

Une fois l’architecture sur site déployée, on peut voir un tableau de bord qui va résumer les possibilités de migration, et disposer d’un historique.

Migration

Il y a plusieurs façons de bouger les machines virtuelles, une migration « à chaud », une migration dite « tiède » et une migration « à froid ».

La migration à chaud est de loin la plus impressionnante. En quelques clics, une machine virtuelle se retrouve dans le centre de données de destination sans perdre son état, sa connectivité et son contexte. Le procédé est assimilable au vMotion, bien connu des utilisateurs VMware, cette méthode porte le nom vMotion Migration. Le principe est que le stockage de la VM est envoyé sur le centre de données de destination, une fois que le stockage de la VM est complètement synchronisé, c’est au tour de la mémoire et du processeur de se faire synchroniser et au centre de données de destination de prendre le relai. La limitation de cette méthode est la séquentialisation du procédé qui peut impacter les charges de travail répartis sur plusieurs VMs et nécessitent une latence faible entre les VMs. Lorsque la VM aura migré, la latence entre les centres de données va se faire ressentir :

Migration

C’est donc avec la migration en masse que nous allons adresser cette problématique, en rajoutant en plus, des fonctionnalités d’aide à la migration contrôlée. L’objectif de cette migration est de synchroniser une ou un ensemble de VMs avec le centre de données de destination pendant qu’elles sont encore sur le centre de données source, et de maintenir cette synchronisation dans le temps. Le transfert de la totalité des VMs aura lieu sur une période choisie par l’administrateur à l’origine de cette migration, sur un créneau horaire le plus favorable au transfert, qui passera par une extinction de la VM sur le centre de données source et un démarrage de la VM sur le centre de données de destination. En plus de maîtriser le créneau de transfert, il est possible de personnaliser la VM (mise à jour des VMware Tools, mise à niveau du matériel virtuel, etc). Comme l’ensemble des VMs bouge en même temps, plus de questions à se poser sur la latence dans le réseau étendu.

Migration

La dernière méthode de transfert est disruptive pour les machines de production, et donc plutôt destinée à la migration des gabarits, des archives, des sauvegardes. Elle se fait à froid, VM éteinte, et va donc simplement synchroniser les données et transférer automatiquement quand toutes les données sont arrivées sur le centre de données de destination.

Nous avons une expérience de plus de 3 ans sur de la migration sécurisée de charges de travail, d’abord sur les centres de données de vCloud Air, puis sur les centres de données propres à OVH. Durant cette période nous avons migré des exaoctets de données dans le monde entier.

HCX est un outil qui a été conçu pour répondre à plusieurs problématiques liées à la migration, aussi bien sur le maintien en opérationnel des machines virtuelles pendant leur transfert, sur le besoin de transférer des groupes des VMs ainsi que la connexion réseau entre les différents centres de données, et il faut y associer un travail d’architecture. En effet, une migration se prépare en amont, avec un dimensionnement suffisant du centre de données  de destination, qu’on peut adapter dans le temps sur Cloud Privé OVH. Il faut aussi travailler sur une estimation du temps de transfert et sur la stratégie de transfert associée aux différents charges de travail du centre de données source. Pour le reste, ce n’est que l’histoire de quelques clics dans HCX.