Projet

Général

Profil

Actions

Anomalie #3734

fermé

Le service drbd démarre en erreur sur maine

Ajouté par Christian P. Momon il y a plus de 5 ans. Mis à jour il y a presque 5 ans.

Statut:
Fermé
Priorité:
Urgente
Assigné à:
Catégorie:
-
Version cible:
-
Début:
07/06/2019
Echéance:
% réalisé:

0%

Temps estimé:

Description

Suite au reboot du cluster pour une dist-upgrade sur qemu, constat que le service drbd démarre en erreur sur maine.

État du service drbd après le reboot et sans les commandes de remise en marche (drbdadm primary maine ; mount /var/lib/libvirt/maine…) :

=(^-^)=root@maine:/etc/libvirt/qemu# systemctl status drbd
● drbd.service - LSB: Control DRBD resources.
   Loaded: loaded (/etc/init.d/drbd; generated; vendor preset: enabled)
   Active: failed (Result: timeout) since Fri 2019-06-07 04:28:50 CEST; 1min 26s ago
     Docs: man:systemd-sysv-generator(8)
  Process: 1121 ExecStart=/etc/init.d/drbd start (code=killed, signal=TERM)
    Tasks: 3 (limit: 4915)
   CGroup: /system.slice/drbd.service
           ├─1315 drbdadm wait-con-int
           ├─1317 drbdsetup-84 wait-connect 1
           └─1318 drbdsetup-84 wait-connect 0

juin 07 04:23:50 maine.chapril.org drbd[1121]: Starting DRBD resources:[
juin 07 04:23:50 maine.chapril.org drbd[1121]:      create res: coon maine
juin 07 04:23:50 maine.chapril.org drbd[1121]:    prepare disk: coon maine
juin 07 04:23:52 maine.chapril.org drbd[1121]:     adjust disk: coon maine
juin 07 04:23:52 maine.chapril.org drbd[1121]:      adjust net: coon maine
juin 07 04:23:52 maine.chapril.org drbd[1121]: ]
juin 07 04:28:50 maine.chapril.org systemd[1]: drbd.service: Start operation timed out. Terminating.
juin 07 04:28:50 maine.chapril.org systemd[1]: Failed to start LSB: Control DRBD resources..
juin 07 04:28:50 maine.chapril.org systemd[1]: drbd.service: Unit entered failed state.
juin 07 04:28:50 maine.chapril.org systemd[1]: drbd.service: Failed with result 'timeout'.
=(^-^)=root@maine:/etc/libvirt/qemu# drbd-overview 
 0:maine/0  WFConnection Secondary/Unknown UpToDate/DUnknown 
 1:coon/0   WFConnection Secondary/Unknown UpToDate/DUnknown 
=(^-^)=root@maine:/etc/libvirt/qemu#

Services Chapril relancés mais disques désynchronisés.

Mes essais pour réparer échouent. Je passe la main. À traiter dès que possible.

Mis à jour par Christian P. Momon il y a plus de 5 ans

Pour info :

04:42 < chatonic[3]> coon.cluster.chapril.org!ping4: => <Terminated by signal 15 (Terminated).>
04:42 < chatonic[3]> coon.cluster.chapril.org!DRBD: => DRBD WARNING: Device 0 StandAlone UpToDate
04:42 < chatonic[3]> maine.cluster.chapril.org!DRBD: => DRBD WARNING: Out of sync on device 0: 236480 sectors

Mis à jour par Quentin Gibeaux il y a plus de 5 ans

Après investigation :

rien qui écoute sur le port 7789 sur coon alors que sur maine oui.

systemctl restart drbd sur maine : ko
systemctl restart drbd sur coon : ok, ça écoute à nouveau.

Ça rsync.

Mis à jour par Christian P. Momon il y a plus de 5 ans

  • Statut changé de Nouveau à Résolu

Tout est ok \o/

Mis à jour par Christian P. Momon il y a presque 5 ans

  • Projet changé de Chapril à Infra Chapril
  • Statut changé de Résolu à Fermé
Actions

Formats disponibles : Atom PDF