Bug #19194
harakiri 30 secondes, c'est trop violent, passer à 120
0%
Description
En fait je pensais que ça renouvelait les workers vieux qui ne font plus rien depuis 30 secondes, mais pas du tout, ça lance des "kill -9" sur des process qui mettent un peu trop de temps à répondre.
Résultat sur la prod sur les deux derniers jours :
journalctl -u wcs |grep "killed by signal 9" | wc -l
492
Alors je peux comprendre que les process soient tués, mais ce harakiri me parait bien trop violent, un kill -9 au mauvais moment ça peut vraiment abimer des choses.
Je préférerais qu'on le passe à 2 minutes, voire 5, dans l'optique des requêtes d'API longues (wcs-olap), entre autre.
Fichiers
Révisions associées
Historique
Mis à jour par Thomas Noël il y a plus de 6 ans
- Fichier 0001-debian-increase-uwsgi-harakiri-delay-to-120s-19194.patch 0001-debian-increase-uwsgi-harakiri-delay-to-120s-19194.patch ajouté
- Statut changé de Nouveau à En cours
- Patch proposed changé de Non à Oui
Mis à jour par Benjamin Dauvergne il y a plus de 6 ans
Il y a des options pour renouveller les workers si c'est ça que tu veux:
-R|--max-requests reload workers after the specified amount of managed requests --min-worker-lifetime number of seconds worker must run before being reloaded (default is 60) --max-worker-lifetime reload workers after the specified amount of seconds (default is disabled)
Mis à jour par Thomas Noël il y a plus de 6 ans
Ouaip ça pourrait être dans ce même patch, mais à vrai dire, d'abord #18525 pour expérimenter plus facilement tout cela avant de généraliser
Ce patch c'est surtout pour arrêter les kill -9 trop fréquents inutilement.
Mis à jour par Thomas Noël il y a plus de 6 ans
- Fichier 0001-debian-increase-uwsgi-harakiri-delay-to-120s-19194.patch 0001-debian-increase-uwsgi-harakiri-delay-to-120s-19194.patch ajouté
- Sujet changé de harakiri 30 secondes, c'est trop violent à harakiri 30 secondes, c'est trop violent, passer à 120
Version suite à #19194
Note : avec py-tracebacker ce paramètre permet de voir ce qui se trame dans des processus trop lent (on a 2 minutes pour comprendre où ça freine ; et si ça bloque complétement on a la trace dans les logs juste avant le kill)
Mis à jour par Frédéric Péters il y a plus de 6 ans
Ack. (c'est déjà ainsi, manuellement, sur la prod du SaaS)
Mis à jour par Thomas Noël il y a plus de 6 ans
- Statut changé de En cours à Résolu (à déployer)
commit 4bc706b7529d00466bd7edf7517094903101ec29 Author: Thomas NOEL <tnoel@entrouvert.com> Date: Sat Oct 7 14:30:35 2017 +0200 debian: increase uwsgi harakiri delay to 120s (#19194)
Mis à jour par Frédéric Péters il y a plus de 5 ans
- Statut changé de Résolu (à déployer) à Solution déployée
debian: increase uwsgi harakiri delay to 120s (#19194)