Troubleshooting

Solutions aux problèmes les plus fréquents.

Cluster bloqué en “Provisioning”

Symptôme : le cluster reste en statut provisioning depuis plus de 10 minutes.

Solutions :

Vérifiez le statut de la plateforme
Attendez encore quelques minutes — certains provisioning peuvent prendre jusqu’à 10 minutes en cas de charge
Si le problème persiste, supprimez le cluster et recréez-le
Contactez le support si le problème se reproduit

kubectl : connexion refusée

Symptôme : kubectl get nodes retourne connection refused ou timeout.

Solutions :

# Vérifiez que le kubeconfig est bien configuré
echo $KUBECONFIG

# Vérifiez que le fichier existe et est valide
cat $KUBECONFIG | head -5

# Testez la connectivité
kubectl cluster-info

# Re-téléchargez le kubeconfig si nécessaire
deployme cluster kubeconfig mon-cluster > kubeconfig.yaml
export KUBECONFIG=$(pwd)/kubeconfig.yaml

Nodes en statut “NotReady”

Symptôme : kubectl get nodes montre un ou plusieurs nodes en NotReady.

Solutions :

# Vérifiez les conditions du node
kubectl describe node <node-name>

# Vérifiez les événements
kubectl get events --sort-by='.lastTimestamp'

Causes fréquentes :

Mise à jour en cours : les nodes sont mis à jour séquentiellement, un node peut être temporairement NotReady
Ressources saturées : le node manque de CPU ou de mémoire
Problème réseau : le node ne peut pas communiquer avec le control plane

Pods en “Pending”

Symptôme : des pods restent en statut Pending.

# Vérifiez pourquoi le pod est en Pending
kubectl describe pod <pod-name>

Causes fréquentes :

Ressources insuffisantes : les requests dépassent les ressources disponibles → scalez les workers
PersistentVolumeClaim : pas de PV disponible pour le PVC demandé
Affinité/Tolérations : contraintes de scheduling non satisfaites

# Vérifiez les ressources disponibles
kubectl top nodes
kubectl describe nodes | grep -A 5 "Allocated resources"

Agent on-premise : connexion impossible

Symptôme : l’agent ne se connecte pas au control plane.

Solutions :

Vérifiez la connectivité sortante :
Fenêtre de terminal
```
curl -v https://api.deployme.cloud/health
```
Vérifiez la configuration de l’agent :
Fenêtre de terminal
```
cat /etc/deployme/agent.yaml
```
Vérifiez les logs de l’agent :
Fenêtre de terminal
```
journalctl -u deployme-agent -f
```
Vérifiez que le token agent est valide dans le Manager

Erreurs API courantes

Code	Message	Solution
401	Unauthorized	Token invalide ou expiré → régénérez-le
403	Forbidden	Permissions insuffisantes → vérifiez les scopes
404	Not Found	Ressource inexistante → vérifiez l’ID
409	Conflict	Opération en cours → attendez et réessayez
422	Validation Error	Paramètres invalides → vérifiez le body
429	Too Many Requests	Rate limit atteint → attendez et réessayez
503	Service Unavailable	Maintenance → consultez status.deployme.cloud

Besoin d’aide supplémentaire ?

Consultez la FAQ
Rejoignez le Discord
Contactez le support selon votre plan