Troubleshooting
Troubleshooting
Section intitulée « Troubleshooting »Solutions aux problèmes les plus fréquents.
Cluster bloqué en “Provisioning”
Section intitulée « Cluster bloqué en “Provisioning” »Symptôme : le cluster reste en statut provisioning depuis plus de 10 minutes.
Solutions :
- Vérifiez le statut de la plateforme
- Attendez encore quelques minutes — certains provisioning peuvent prendre jusqu’à 10 minutes en cas de charge
- Si le problème persiste, supprimez le cluster et recréez-le
- Contactez le support si le problème se reproduit
kubectl : connexion refusée
Section intitulée « kubectl : connexion refusée »Symptôme : kubectl get nodes retourne connection refused ou timeout.
Solutions :
# Vérifiez que le kubeconfig est bien configuréecho $KUBECONFIG
# Vérifiez que le fichier existe et est validecat $KUBECONFIG | head -5
# Testez la connectivitékubectl cluster-info
# Re-téléchargez le kubeconfig si nécessairedeployme cluster kubeconfig mon-cluster > kubeconfig.yamlexport KUBECONFIG=$(pwd)/kubeconfig.yamlNodes en statut “NotReady”
Section intitulée « Nodes en statut “NotReady” »Symptôme : kubectl get nodes montre un ou plusieurs nodes en NotReady.
Solutions :
# Vérifiez les conditions du nodekubectl describe node <node-name>
# Vérifiez les événementskubectl get events --sort-by='.lastTimestamp'Causes fréquentes :
- Mise à jour en cours : les nodes sont mis à jour séquentiellement, un node peut être temporairement
NotReady - Ressources saturées : le node manque de CPU ou de mémoire
- Problème réseau : le node ne peut pas communiquer avec le control plane
Pods en “Pending”
Section intitulée « Pods en “Pending” »Symptôme : des pods restent en statut Pending.
# Vérifiez pourquoi le pod est en Pendingkubectl describe pod <pod-name>Causes fréquentes :
- Ressources insuffisantes : les
requestsdépassent les ressources disponibles → scalez les workers - PersistentVolumeClaim : pas de PV disponible pour le PVC demandé
- Affinité/Tolérations : contraintes de scheduling non satisfaites
# Vérifiez les ressources disponibleskubectl top nodeskubectl describe nodes | grep -A 5 "Allocated resources"Agent on-premise : connexion impossible
Section intitulée « Agent on-premise : connexion impossible »Symptôme : l’agent ne se connecte pas au control plane.
Solutions :
-
Vérifiez la connectivité sortante :
Fenêtre de terminal curl -v https://api.deployme.cloud/health -
Vérifiez la configuration de l’agent :
Fenêtre de terminal cat /etc/deployme/agent.yaml -
Vérifiez les logs de l’agent :
Fenêtre de terminal journalctl -u deployme-agent -f -
Vérifiez que le token agent est valide dans le Manager
Erreurs API courantes
Section intitulée « Erreurs API courantes »| Code | Message | Solution |
|---|---|---|
| 401 | Unauthorized | Token invalide ou expiré → régénérez-le |
| 403 | Forbidden | Permissions insuffisantes → vérifiez les scopes |
| 404 | Not Found | Ressource inexistante → vérifiez l’ID |
| 409 | Conflict | Opération en cours → attendez et réessayez |
| 422 | Validation Error | Paramètres invalides → vérifiez le body |
| 429 | Too Many Requests | Rate limit atteint → attendez et réessayez |
| 503 | Service Unavailable | Maintenance → consultez status.deployme.cloud |