Projet

Général

Profil

Bug #19194

harakiri 30 secondes, c'est trop violent, passer à 120

Ajouté par Thomas Noël il y a plus de 6 ans. Mis à jour il y a plus de 5 ans.

Statut:
Fermé
Priorité:
Normal
Assigné à:
Version cible:
-
Début:
04 octobre 2017
Echéance:
% réalisé:

0%

Temps estimé:
Patch proposed:
Oui
Planning:

Description

En fait je pensais que ça renouvelait les workers vieux qui ne font plus rien depuis 30 secondes, mais pas du tout, ça lance des "kill -9" sur des process qui mettent un peu trop de temps à répondre.

Résultat sur la prod sur les deux derniers jours :

journalctl -u wcs |grep "killed by signal 9" | wc -l
492

Alors je peux comprendre que les process soient tués, mais ce harakiri me parait bien trop violent, un kill -9 au mauvais moment ça peut vraiment abimer des choses.

Je préférerais qu'on le passe à 2 minutes, voire 5, dans l'optique des requêtes d'API longues (wcs-olap), entre autre.


Fichiers

Révisions associées

Révision 4bc706b7 (diff)
Ajouté par Thomas Noël il y a plus de 6 ans

debian: increase uwsgi harakiri delay to 120s (#19194)

Historique

#1

Mis à jour par Thomas Noël il y a plus de 6 ans

#2

Mis à jour par Benjamin Dauvergne il y a plus de 6 ans

Il y a des options pour renouveller les workers si c'est ça que tu veux:

       -R|--max-requests
              reload workers after the specified amount of managed requests

       --min-worker-lifetime
              number of seconds worker must run before being reloaded (default is 60)

       --max-worker-lifetime
              reload workers after the specified amount of seconds (default is disabled)

#3

Mis à jour par Thomas Noël il y a plus de 6 ans

Ouaip ça pourrait être dans ce même patch, mais à vrai dire, d'abord #18525 pour expérimenter plus facilement tout cela avant de généraliser

Ce patch c'est surtout pour arrêter les kill -9 trop fréquents inutilement.

#4

Mis à jour par Thomas Noël il y a plus de 6 ans

Version suite à #19194

Note : avec py-tracebacker ce paramètre permet de voir ce qui se trame dans des processus trop lent (on a 2 minutes pour comprendre où ça freine ; et si ça bloque complétement on a la trace dans les logs juste avant le kill)

#5

Mis à jour par Frédéric Péters il y a plus de 6 ans

Ack. (c'est déjà ainsi, manuellement, sur la prod du SaaS)

#6

Mis à jour par Thomas Noël il y a plus de 6 ans

  • Statut changé de En cours à Résolu (à déployer)
commit 4bc706b7529d00466bd7edf7517094903101ec29
Author: Thomas NOEL <tnoel@entrouvert.com>
Date:   Sat Oct 7 14:30:35 2017 +0200

    debian: increase uwsgi harakiri delay to 120s (#19194)

#7

Mis à jour par Frédéric Péters il y a plus de 5 ans

  • Statut changé de Résolu (à déployer) à Solution déployée

Formats disponibles : Atom PDF