Anomalie #1332
fermé
Achat d'un onduleur (Coupure des serveurs chez EE)
Ajouté par Quentin CHERGUI il y a plus de 11 ans.
Mis à jour il y a presque 4 ans.
Description
Ce matin, en arrivant, Opium et Scopolamine étaient coupés tous les deux : il faudrait voir s'il s'agit d'une coupure de courant, d'un coup de chaleur, ou d'autre chose.
Les machines ont été redémarrées.
Il a fallu 2 tentatives pour redémarrer Opium (problème habituel).
Pour Scopolamine, il a fallu couper complètement l'alimentation électrique (interrupteur de l'alim sur 0) avant qu'il ne veuille redémarrer. Étant donné qu'il s'agit d'une vieille machine, il va falloir songer à son remplacement.
S'il s'agit de coupures de courant, qui sont régulières, à voir si ça ne vaudrait pas le coup de mettre un onduleur.
Demande d'achat d'un onduleur confirmée : https://agir.april.org/issues/1332#note-4
Derniers logs d'Opium à 19h05 dimanche, et 18h55 dimanche pour Scopolamine. Il semblerait que les machines se soient coupées en même temps. Problème électrique probable donc.
Dernières lignes visibles sur Opium :
Jul 21 19:05:01 opium /USR/SBIN/CRON[22249]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Jul 21 19:06:08 opium named[1438]: dumping master file: /etc/bind/zones/slaves/tmp-17RZePUtO6: open: permission denied
Dernières lignes visibles sur Scopolamine :
Jul 21 18:55:32 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=88.191.227.26 LEN=76 TOS=0x00 PREC=0x00 TTL=6
4 ID=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56
- Catégorie mis à Task
- Assigné à mis à Quentin CHERGUI
- Version cible mis à Juillet 2013
L'hypothèse de la panne electrique semble en effet la plus probable. C'est assez ennuyeux si ça arrive régulièrement, en effet. Disons que la prochaine fois que ça se produit on décide de l'action a prendre, si c'est dans moins de deux mois. Ca fera un total de trois pannes electriques sur de vieilles machines, c'est pas top.
Nouvelle coupure cette nuit, vers 23h31.
Scopolamine a redémarré seul une fois le courant revenu (à 23h33). En revanche, Opium n'a pas redémarré tout seul à cause de ses problèmes de boot (cf https://agir.april.org/issues/1099#note-18).
Extraits logs Scopolamine :
Aug 13 23:24:58 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=80.74.64.1 LEN=76 TOS=0x00 PREC=0x00 TTL=64 I
D=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56
Aug 13 23:33:17 scopolamine syslogd 1.4.1#18: restart.
Aug 13 23:33:17 scopolamine kernel: klogd 1.4.1#18, log source = /proc/kmsg started.
Aug 13 23:33:17 scopolamine kernel: Linux version 2.6.18-6-486 (Debian 2.6.18.dfsg.1-24) (dannf@debian.org) (gcc version 4.1.2
Extrait logs Opium :
Aug 13 23:30:49 opium kernel: [1946903.345396] IPT :IN=eth2 OUT= MAC=01:00:5e:00:00:01:58:98:35:56:c6:b8:08:00 SRC=10.0.0.138
DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0xC0 TTL=1 ID=5493 DF PROTO=2
Aug 13 23:31:06 opium named[1648]: dumping master file: /etc/bind/zones/slaves/tmp-bFkWn0vg1f: open: permission denied
Aug 14 11:44:16 opium kernel: imklog 4.6.4, log source = /proc/kmsg started.
Un onduleur (UPS) pour au moins se prémunir des micro-coupures électriques est utile.
Idéalement, il faudrait un onduleur qui se connecte en USB aux machines pour leur indiquer la durée de vie restant de la batterie et leur permettre ainsi de s'éteindre proprement.
Chez Easter-Eggs ils ont des Powerware EATON 5110 utilisé avec (Network UPS Tools) en 100% libre selon eux.
Guerby indique sur irc qu'Easton que la quasi totalité de la gamme est supportée en libre et que le dev debian de NUT a été embauché par Easton. Voir la page de compatibilité matérielle de NUT et au pire contacter le développeur http://arnaud.quette.fr/
- Sujet changé de Coupure des serveurs chez EE à Achat d'un onduleur (Coupure des serveurs chez EE)
- Statut changé de Résolu à En cours de traitement
- Version cible changé de Juillet 2013 à Septembre 2013
- Version cible changé de Septembre 2013 à Backlog
- Assigné à
Quentin CHERGUI supprimé
- Description mis à jour (diff)
Si vous investissez dons un onduleur, pensez aussi à onduler les équipements réseau (box, switch) et les machines dépourvues de batteries.
Je ne compte pas m'en occuper.
- Statut changé de En cours de traitement à Fermé
Personne ne le fera alors :)
- Assigné à mis à François Poulain
Formats disponibles : Atom
PDF