Projet

Général

Profil

Anomalie #1330

OOM killer sur Opium

Ajouté par Quentin CHERGUI il y a presque 11 ans. Mis à jour il y a plus de 10 ans.

Statut:
Fermé
Priorité:
Élevée
Assigné à:
Catégorie:
Task
Version cible:
Début:
18/07/2013
Echéance:
% réalisé:

100%

Temps estimé:
Difficulté:
2 Facile

Description

Il y a eu des OutOfMemory sur Opium depuis le 17/07 à 17h. La cause n'en est pas connue.

NRPE était coupé, et la charge de la machine était de 6.7 quand je me suis connecté pour aller voir ce qu'il s'y passait :

 14:59:24 up 16 days, 16:51,  1 user,  load average: 6,71, 6,69, 6,48
root@opium:~# /etc/init.d/nagios-nrpe-server restart
Stopping nagios-nrpe: nagios-nrpe.
Starting nagios-nrpe: nagios-nrpe.

Après redémarrage de NRPE, on a pû voir qu'il y avait eu des OOM d'enregistrés :

root@opium:~# cat /tmp/nagios_oom_killer 
Jul 17 17:00:06 opium kernel: [1364058.055209] Out of memory: kill process apache2(1651:#10) score 199156 or a child
Jul 17 17:00:08 opium kernel: [1364059.984953] Out of memory: kill process apache2(1651:#10) score 196803 or a child
Jul 17 17:00:08 opium kernel: [1364060.003743] Out of memory: kill process apache2(1651:#10) score 136331 or a child
Jul 17 17:00:08 opium kernel: [1364060.018657] Out of memory: kill process apache2(1651:#10) score 58074 or a child
Jul 17 17:00:08 opium kernel: [1364060.038034] Out of memory: kill process apache2(1651:#10) score 58074 or a child
Jul 17 17:00:08 opium kernel: [1364060.134417] Out of memory: kill process apache2(1651:#10) score 33173 or a child
Jul 17 18:00:13 opium kernel: [1367657.841123] Out of memory: kill process apache2(1651:#10) score 103118 or a child
Jul 17 18:00:13 opium kernel: [1367657.858685] Out of memory: kill process apache2(1651:#10) score 100760 or a child
Jul 17 18:00:17 opium kernel: [1367662.193836] Out of memory: kill process BackupPC_dump(22341:#10) score 29612 or a child
Jul 17 18:00:18 opium kernel: [1367662.918329] Out of memory: kill process BackupPC_dump(22341:#10) score 28933 or a child
Jul 18 15:00:10 opium kernel: [1443108.147783] Out of memory: kill process apache2(1651:#10) score 236025 or a child
Jul 18 15:00:10 opium kernel: [1443108.322384] Out of memory: kill process apache2(1651:#10) score 233667 or a child
Jul 18 15:00:16 opium kernel: [1443113.688949] Out of memory: kill process apache2(1651:#10) score 100760 or a child
Jul 18 15:00:16 opium kernel: [1443114.147917] Out of memory: kill process BackupPC_dump(25306:#10) score 50941 or a child

Historique

#1

Mis à jour par Quentin CHERGUI il y a presque 11 ans

root@opium:~# vserver dronabinol enter
dronabinol:/# w
 15:11:39 up 16 days, 17:03,  0 users,  load average: 3,52, 4,06, 5,13
USER     TTY      FROM              LOGIN@   IDLE   JCPU   PCPU WHAT
dronabinol:/# /etc/init.d/apache2 restart
Restarting web server: apache2 ... waiting ...
dronabinol:/# /etc/init.d/backuppc restart
Restarting backuppc....
#2

Mis à jour par Loïc Dachary il y a plus de 10 ans

  • Catégorie mis à Task
  • Assigné à mis à Quentin CHERGUI
  • Version cible mis à Juillet 2013
#3

Mis à jour par Quentin CHERGUI il y a plus de 10 ans

  • Statut changé de En cours de traitement à Fermé
  • % réalisé changé de 10 à 100

Cela était apparemment dû au rsync en cours à ce moment là (trop d'inodes), qui a fait exploser la consommation de mémoire.

Formats disponibles : Atom PDF