Actions
Anomalie #1330
ferméOOM killer sur Opium
Début:
18/07/2013
Echéance:
% réalisé:
100%
Temps estimé:
Difficulté:
2 Facile
Description
Il y a eu des OutOfMemory sur Opium depuis le 17/07 à 17h. La cause n'en est pas connue.
NRPE était coupé, et la charge de la machine était de 6.7 quand je me suis connecté pour aller voir ce qu'il s'y passait :
14:59:24 up 16 days, 16:51, 1 user, load average: 6,71, 6,69, 6,48 root@opium:~# /etc/init.d/nagios-nrpe-server restart Stopping nagios-nrpe: nagios-nrpe. Starting nagios-nrpe: nagios-nrpe.
Après redémarrage de NRPE, on a pû voir qu'il y avait eu des OOM d'enregistrés :
root@opium:~# cat /tmp/nagios_oom_killer Jul 17 17:00:06 opium kernel: [1364058.055209] Out of memory: kill process apache2(1651:#10) score 199156 or a child Jul 17 17:00:08 opium kernel: [1364059.984953] Out of memory: kill process apache2(1651:#10) score 196803 or a child Jul 17 17:00:08 opium kernel: [1364060.003743] Out of memory: kill process apache2(1651:#10) score 136331 or a child Jul 17 17:00:08 opium kernel: [1364060.018657] Out of memory: kill process apache2(1651:#10) score 58074 or a child Jul 17 17:00:08 opium kernel: [1364060.038034] Out of memory: kill process apache2(1651:#10) score 58074 or a child Jul 17 17:00:08 opium kernel: [1364060.134417] Out of memory: kill process apache2(1651:#10) score 33173 or a child Jul 17 18:00:13 opium kernel: [1367657.841123] Out of memory: kill process apache2(1651:#10) score 103118 or a child Jul 17 18:00:13 opium kernel: [1367657.858685] Out of memory: kill process apache2(1651:#10) score 100760 or a child Jul 17 18:00:17 opium kernel: [1367662.193836] Out of memory: kill process BackupPC_dump(22341:#10) score 29612 or a child Jul 17 18:00:18 opium kernel: [1367662.918329] Out of memory: kill process BackupPC_dump(22341:#10) score 28933 or a child Jul 18 15:00:10 opium kernel: [1443108.147783] Out of memory: kill process apache2(1651:#10) score 236025 or a child Jul 18 15:00:10 opium kernel: [1443108.322384] Out of memory: kill process apache2(1651:#10) score 233667 or a child Jul 18 15:00:16 opium kernel: [1443113.688949] Out of memory: kill process apache2(1651:#10) score 100760 or a child Jul 18 15:00:16 opium kernel: [1443114.147917] Out of memory: kill process BackupPC_dump(25306:#10) score 50941 or a child
Actions
#1
Mis à jour par Quentin CHERGUI il y a plus de 11 ans
root@opium:~# vserver dronabinol enter dronabinol:/# w 15:11:39 up 16 days, 17:03, 0 users, load average: 3,52, 4,06, 5,13 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT dronabinol:/# /etc/init.d/apache2 restart Restarting web server: apache2 ... waiting ... dronabinol:/# /etc/init.d/backuppc restart Restarting backuppc....
Actions
#2
Mis à jour par Loïc Dachary il y a plus de 11 ans
- Catégorie mis à Task
- Assigné à mis à Quentin CHERGUI
- Version cible mis à Juillet 2013
Actions
#3
Mis à jour par Quentin CHERGUI il y a environ 11 ans
- Statut changé de En cours de traitement à Fermé
- % réalisé changé de 10 à 100
Cela était apparemment dû au rsync en cours à ce moment là (trop d'inodes), qui a fait exploser la consommation de mémoire.
Actions