Anomalie #1332
Achat d'un onduleur (Coupure des serveurs chez EE)
80%
Description
Ce matin, en arrivant, Opium et Scopolamine étaient coupés tous les deux : il faudrait voir s'il s'agit d'une coupure de courant, d'un coup de chaleur, ou d'autre chose.
Les machines ont été redémarrées.
Il a fallu 2 tentatives pour redémarrer Opium (problème habituel).
Pour Scopolamine, il a fallu couper complètement l'alimentation électrique (interrupteur de l'alim sur 0) avant qu'il ne veuille redémarrer. Étant donné qu'il s'agit d'une vieille machine, il va falloir songer à son remplacement.
S'il s'agit de coupures de courant, qui sont régulières, à voir si ça ne vaudrait pas le coup de mettre un onduleur.
Demande d'achat d'un onduleur confirmée : https://agir.april.org/issues/1332#note-4
History
Updated by Quentin CHERGUI over 10 years ago
Derniers logs d'Opium à 19h05 dimanche, et 18h55 dimanche pour Scopolamine. Il semblerait que les machines se soient coupées en même temps. Problème électrique probable donc.
Dernières lignes visibles sur Opium :
Jul 21 19:05:01 opium /USR/SBIN/CRON[22249]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1) Jul 21 19:06:08 opium named[1438]: dumping master file: /etc/bind/zones/slaves/tmp-17RZePUtO6: open: permission denied
Dernières lignes visibles sur Scopolamine :
Jul 21 18:55:32 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=88.191.227.26 LEN=76 TOS=0x00 PREC=0x00 TTL=6 4 ID=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56
Updated by Loïc Dachary over 10 years ago
- Category set to Task
- Assignee set to Quentin CHERGUI
- Target version set to Juillet 2013
L'hypothèse de la panne electrique semble en effet la plus probable. C'est assez ennuyeux si ça arrive régulièrement, en effet. Disons que la prochaine fois que ça se produit on décide de l'action a prendre, si c'est dans moins de deux mois. Ca fera un total de trois pannes electriques sur de vieilles machines, c'est pas top.
Updated by Quentin CHERGUI over 10 years ago
Nouvelle coupure cette nuit, vers 23h31.
Scopolamine a redémarré seul une fois le courant revenu (à 23h33). En revanche, Opium n'a pas redémarré tout seul à cause de ses problèmes de boot (cf https://agir.april.org/issues/1099#note-18).
Extraits logs Scopolamine :
Aug 13 23:24:58 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=80.74.64.1 LEN=76 TOS=0x00 PREC=0x00 TTL=64 I D=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56 Aug 13 23:33:17 scopolamine syslogd 1.4.1#18: restart. Aug 13 23:33:17 scopolamine kernel: klogd 1.4.1#18, log source = /proc/kmsg started. Aug 13 23:33:17 scopolamine kernel: Linux version 2.6.18-6-486 (Debian 2.6.18.dfsg.1-24) (dannf@debian.org) (gcc version 4.1.2
Extrait logs Opium :
Aug 13 23:30:49 opium kernel: [1946903.345396] IPT :IN=eth2 OUT= MAC=01:00:5e:00:00:01:58:98:35:56:c6:b8:08:00 SRC=10.0.0.138 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0xC0 TTL=1 ID=5493 DF PROTO=2 Aug 13 23:31:06 opium named[1648]: dumping master file: /etc/bind/zones/slaves/tmp-bFkWn0vg1f: open: permission denied Aug 14 11:44:16 opium kernel: imklog 4.6.4, log source = /proc/kmsg started.
Updated by Frédéric Couchet over 10 years ago
Un onduleur (UPS) pour au moins se prémunir des micro-coupures électriques est utile.
Idéalement, il faudrait un onduleur qui se connecte en USB aux machines pour leur indiquer la durée de vie restant de la batterie et leur permettre ainsi de s'éteindre proprement.
Chez Easter-Eggs ils ont des Powerware EATON 5110 utilisé avec (Network UPS Tools) en 100% libre selon eux.
Guerby indique sur irc qu'Easton que la quasi totalité de la gamme est supportée en libre et que le dev debian de NUT a été embauché par Easton. Voir la page de compatibilité matérielle de NUT et au pire contacter le développeur http://arnaud.quette.fr/
Updated by Quentin CHERGUI about 10 years ago
- Subject changed from Coupure des serveurs chez EE to Achat d'un onduleur (Coupure des serveurs chez EE)
- Status changed from Résolu to En cours de traitement
- Target version changed from Juillet 2013 to Septembre 2013
Updated by Quentin CHERGUI about 10 years ago
- Target version changed from Septembre 2013 to Backlog
Updated by François Poulain about 7 years ago
- Description updated (diff)
Si vous investissez dons un onduleur, pensez aussi à onduler les équipements réseau (box, switch) et les machines dépourvues de batteries.
Updated by François Poulain about 7 years ago
- Status changed from En cours de traitement to Fermé
Personne ne le fera alors :)