Project

General

Profile

Anomalie #4607

Drdb disconnected après un reboot

Added by Christian P. Momon over 1 year ago. Updated over 1 year ago.

Status:
Fermé
Priority:
Normale
Assignee:
Christian P. Momon
Category:
-
Start date:
07/26/2020
Due date:
% Done:

0%

Estimated time:

Description

Lors du redémarrage du SI Chapril, le deuxième reboot de coon (oubli du apt-get dist-upgrade) ne s'est pas déroulé nominalement:

=(^-^)=root@coon:~# systemctl status
● coon.chapril.org
    State: degraded
     Jobs: 0 queued
   Failed: 1 units
    Since: Sat 2020-07-25 18:30:54 CEST; 5min ago

=(^-^)=root@coon:~# systemctl list-units                                                                                                                                                                                                                                                                            
  UNIT                                                                                     LOAD   ACTIVE SUB       DESCRIPTION                                                                                                                                                                                        
[…]
● drbd.service                                                                             loaded failed failed    LSB: Control DRBD resources.                                                                                                                                                                     
[…]

Plusieurs tentatives de restart du service drdb et de reboots ont donné le même résultat.

History

#1

Updated by Christian P. Momon over 1 year ago

  • Description updated (diff)

De fait, les logs et le statut du service ne sont pas très éclairants.

=(^-^)=root@coon:~# journalctl -f -u drbd.service                                                                                                                                                                                                                                                                   
-- Logs begin at Sat 2020-07-25 18:42:59 CEST. --                                                                                                                                                                                                                                                                     
juil. 25 18:43:10 coon.chapril.org systemd[1]: Starting LSB: Control DRBD resources....                                                                                                                                                                                                                               
juil. 25 18:43:10 coon.chapril.org drbd[1246]: Starting DRBD resources:[                                                                                                                                                                                                                                              
juil. 25 18:43:10 coon.chapril.org drbd[1246]:      create res: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:10 coon.chapril.org drbd[1246]:    prepare disk: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:11 coon.chapril.org drbd[1246]:     adjust disk: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:11 coon.chapril.org drbd[1246]:      adjust net: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:11 coon.chapril.org drbd[1246]: ]                                                                                                                                                                                                                                                                      
La commande drdb-overview indiquait :
  • sur la pm coon :
    • Uptodate/Uptodate la ressource main,
    • WFConnection pour la ressource coon,
  • sur la pm maine :
    • Uptodate/Uptodate pour la ressource main,
    • StandAlone/DUnknown pour la ressource coon.
#2

Updated by Christian P. Momon over 1 year ago

  • Status changed from Nouveau to Résolu
L'investigation menée avec Pitchum a permis de constater que :
  • le service drdb est géré via /etc/init.d et donc qu'il est moyennement intégré à systemd ;
  • le statut du service drdb n'est pas très représentatif ;
  • mais avec un statut failed, drdb tourne ;
  • maine n'avait tout simplement connecté la ressource drdb maine.

Suite à un drdbadm connect coon sur la pm main, tout s'est bien remis et la suite de la procédure de démarrage a pu être menée à bien.

Reste la question : pourquoi la pm maine n'a pas connecté sa ressource coon automatiquement et correctement ?

Point de vigilance pour le projet reboot SI Chapril.

#3

Updated by Christian P. Momon over 1 year ago

  • Status changed from Résolu to Fermé
#4

Updated by Christian P. Momon over 1 year ago

  • Target version changed from Backlog to Sprint 2020 été

Also available in: Atom PDF