Projet

Général

Profil

Anomalie #4577

Mis à jour par Christian P. Momon il y a presque 4 ans

Ce mercredi soir, constat que :
* des services web du SI April ne sont plus joignables (pad…) ;
* des sauvegardes sont en cours mais leur suspension ne résout rien ;
* calamus a une grosse charge ( > 10) ;
* dans virtmanager le graphe cpu de la vm bot montre une activité certaine (pas les autres vm) ;
* sur la vm bots, le processus redminbot est à 100 % ;
* un systemctl restart redminbot débloque instantanément tout.

État du processus redminbot avant le restart :
<pre>
top - 21:25:35 up 20 days, 16:20, 1 user, load average: 1,16, 1,16, 1,09
Tasks: 81 total, 2 running, 79 sleeping, 0 stopped, 0 zombie
%Cpu(s): 85,4 us, 14,6 sy, 0,0 ni, 0,0 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st
MiB Mem : 483,2 total, 15,8 free, 141,0 used, 326,3 buff/cache
MiB Swap: 952,0 total, 904,7 free, 47,2 used. 324,7 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

11934 redmine+ 20 0 23300 13788 5700 R 99,9 2,8 133:26.43 redminebot.py

413 root 20 0 38628 13100 5256 S 0,3 2,6 23:44.23 python3

1 root 20 0 169724 7236 4620 S 0,0 1,5 2:17.79 systemd

2 root 20 0 0 0 0 S 0,0 0,0 0:00.17 kthreadd

3 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_gp

4 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_par_gp

</pre>

Pas de trace particulière dans les logs…

Question :
* que s'est-il passé ?
* cela est-il déjà arrivé ?
* cela arrive-t-il régulièrement ?

Retour