Project

General

Profile

Anomalie #1332

Achat d'un onduleur (Coupure des serveurs chez EE)

Added by Quentin CHERGUI about 6 years ago. Updated almost 3 years ago.

Status:
Fermé
Priority:
Immédiate
Assignee:
-
Category:
Task
Target version:
Start date:
07/22/2013
Due date:
% Done:

80%

Difficulté:
2 Facile

Description

Ce matin, en arrivant, Opium et Scopolamine étaient coupés tous les deux : il faudrait voir s'il s'agit d'une coupure de courant, d'un coup de chaleur, ou d'autre chose.

Les machines ont été redémarrées.

Il a fallu 2 tentatives pour redémarrer Opium (problème habituel).
Pour Scopolamine, il a fallu couper complètement l'alimentation électrique (interrupteur de l'alim sur 0) avant qu'il ne veuille redémarrer. Étant donné qu'il s'agit d'une vieille machine, il va falloir songer à son remplacement.

S'il s'agit de coupures de courant, qui sont régulières, à voir si ça ne vaudrait pas le coup de mettre un onduleur.
Demande d'achat d'un onduleur confirmée : https://agir.april.org/issues/1332#note-4

History

#1 Updated by Quentin CHERGUI about 6 years ago

Derniers logs d'Opium à 19h05 dimanche, et 18h55 dimanche pour Scopolamine. Il semblerait que les machines se soient coupées en même temps. Problème électrique probable donc.

Dernières lignes visibles sur Opium :

Jul 21 19:05:01 opium /USR/SBIN/CRON[22249]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Jul 21 19:06:08 opium named[1438]: dumping master file: /etc/bind/zones/slaves/tmp-17RZePUtO6: open: permission denied

Dernières lignes visibles sur Scopolamine :

Jul 21 18:55:32 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=88.191.227.26 LEN=76 TOS=0x00 PREC=0x00 TTL=6
4 ID=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56 

#2 Updated by Loic Dachary about 6 years ago

  • Category set to Task
  • Assignee set to Quentin CHERGUI
  • Target version set to Juillet 2013

L'hypothèse de la panne electrique semble en effet la plus probable. C'est assez ennuyeux si ça arrive régulièrement, en effet. Disons que la prochaine fois que ça se produit on décide de l'action a prendre, si c'est dans moins de deux mois. Ca fera un total de trois pannes electriques sur de vieilles machines, c'est pas top.

#3 Updated by Quentin CHERGUI about 6 years ago

Nouvelle coupure cette nuit, vers 23h31.

Scopolamine a redémarré seul une fois le courant revenu (à 23h33). En revanche, Opium n'a pas redémarré tout seul à cause de ses problèmes de boot (cf https://agir.april.org/issues/1099#note-18).

Extraits logs Scopolamine :

Aug 13 23:24:58 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=80.74.64.1 LEN=76 TOS=0x00 PREC=0x00 TTL=64 I
D=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56 
Aug 13 23:33:17 scopolamine syslogd 1.4.1#18: restart.
Aug 13 23:33:17 scopolamine kernel: klogd 1.4.1#18, log source = /proc/kmsg started.
Aug 13 23:33:17 scopolamine kernel: Linux version 2.6.18-6-486 (Debian 2.6.18.dfsg.1-24) (dannf@debian.org) (gcc version 4.1.2

Extrait logs Opium :

Aug 13 23:30:49 opium kernel: [1946903.345396] IPT :IN=eth2 OUT= MAC=01:00:5e:00:00:01:58:98:35:56:c6:b8:08:00 SRC=10.0.0.138 
DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0xC0 TTL=1 ID=5493 DF PROTO=2 
Aug 13 23:31:06 opium named[1648]: dumping master file: /etc/bind/zones/slaves/tmp-bFkWn0vg1f: open: permission denied
Aug 14 11:44:16 opium kernel: imklog 4.6.4, log source = /proc/kmsg started.

#4 Updated by Frédéric Couchet almost 6 years ago

Un onduleur (UPS) pour au moins se prémunir des micro-coupures électriques est utile.

Idéalement, il faudrait un onduleur qui se connecte en USB aux machines pour leur indiquer la durée de vie restant de la batterie et leur permettre ainsi de s'éteindre proprement.

Chez Easter-Eggs ils ont des Powerware EATON 5110 utilisé avec (Network UPS Tools) en 100% libre selon eux.

Guerby indique sur irc qu'Easton que la quasi totalité de la gamme est supportée en libre et que le dev debian de NUT a été embauché par Easton. Voir la page de compatibilité matérielle de NUT et au pire contacter le développeur http://arnaud.quette.fr/

#5 Updated by Quentin CHERGUI almost 6 years ago

  • Subject changed from Coupure des serveurs chez EE to Achat d'un onduleur (Coupure des serveurs chez EE)
  • Status changed from Résolu to En cours de traitement
  • Target version changed from Juillet 2013 to Septembre 2013

#6 Updated by Quentin CHERGUI almost 6 years ago

  • Target version changed from Septembre 2013 to Backlog

#7 Updated by Quentin CHERGUI almost 6 years ago

  • Assignee deleted (Quentin CHERGUI)

#8 Updated by François Poulain almost 3 years ago

  • Description updated (diff)

Si vous investissez dons un onduleur, pensez aussi à onduler les équipements réseau (box, switch) et les machines dépourvues de batteries.

#9 Updated by Frédéric Couchet almost 3 years ago

Je ne compte pas m'en occuper.

#10 Updated by François Poulain almost 3 years ago

  • Status changed from En cours de traitement to Fermé

Personne ne le fera alors :)

Also available in: Atom PDF