Aller au contenu

Scaling de clusters

Deployme.cloud permet d’ajuster le nombre de workers de vos clusters à chaud, sans interruption de service.

  1. Ouvrez le détail de votre cluster
  2. Cliquez sur “Scaler”
  3. Augmentez le nombre de workers
  4. Confirmez — les nouveaux nodes sont provisionnés en 2-3 minutes
Fenêtre de terminal
deployme cluster scale production --workers 10
Fenêtre de terminal
curl -X PATCH \
-H "Authorization: Bearer TOKEN" \
-H "Content-Type: application/json" \
-d '{"workers": 10}' \
https://api.deployme.cloud/v1/clusters/cls_abc123
resource "deployme_cluster" "production" {
name = "production"
control_planes = 3
workers = 10 # Modifier cette valeur
node_size = "large"
}
Fenêtre de terminal
terraform plan
terraform apply

Le scale down suit le même processus. Les workers retirés sont drainés automatiquement :

  1. Les pods sont évacués vers les workers restants
  2. Le node est marqué comme NotSchedulable
  3. Une fois vide, le node est supprimé
Fenêtre de terminal
deployme cluster scale production --workers 3

Pour modifier la taille des nodes (CPU/RAM), il est nécessaire de créer un nouveau cluster avec la nouvelle taille. Le rolling update de taille de nodes sera disponible dans une version future.

  • Monitoring : surveillez l’utilisation CPU/RAM avant de scaler
  • Requests/Limits : définissez toujours des resources.requests sur vos pods pour un scheduling efficace
  • Anti-affinité : utilisez les podAntiAffinity pour répartir les réplicas sur différents nodes
  • PDB : configurez des PodDisruptionBudgets pour garantir la disponibilité pendant le scale down