Scaling de clusters

Deployme.cloud permet d’ajuster le nombre de workers de vos clusters à chaud, sans interruption de service.

Scale up (ajouter des workers)

Via le Manager

Ouvrez le détail de votre cluster
Cliquez sur “Scaler”
Augmentez le nombre de workers
Confirmez — les nouveaux nodes sont provisionnés en 2-3 minutes

Via la CLI

deployme cluster scale production --workers 10

Via l’API

curl -X PATCH \
  -H "Authorization: Bearer TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"workers": 10}' \
  https://api.deployme.cloud/v1/clusters/cls_abc123

Via Terraform

resource "deployme_cluster" "production" {
  name           = "production"
  control_planes = 3
  workers        = 10  # Modifier cette valeur
  node_size      = "large"
}

terraform plan
terraform apply

Scale down (retirer des workers)

Le scale down suit le même processus. Les workers retirés sont drainés automatiquement :

Les pods sont évacués vers les workers restants
Le node est marqué comme NotSchedulable
Une fois vide, le node est supprimé

deployme cluster scale production --workers 3

Changer la taille des nodes

Pour modifier la taille des nodes (CPU/RAM), il est nécessaire de créer un nouveau cluster avec la nouvelle taille. Le rolling update de taille de nodes sera disponible dans une version future.

Bonnes pratiques

Monitoring : surveillez l’utilisation CPU/RAM avant de scaler
Requests/Limits : définissez toujours des resources.requests sur vos pods pour un scheduling efficace
Anti-affinité : utilisez les podAntiAffinity pour répartir les réplicas sur différents nodes
PDB : configurez des PodDisruptionBudgets pour garantir la disponibilité pendant le scale down