Projet

Général

Profil

Anomalie #4607

Drdb disconnected après un reboot

Ajouté par Christian P. Momon il y a plus de 3 ans. Mis à jour il y a plus de 3 ans.

Statut:
Fermé
Priorité:
Normale
Assigné à:
Christian P. Momon
Catégorie:
-
Début:
26/07/2020
Echéance:
% réalisé:

0%

Temps estimé:

Description

Lors du redémarrage du SI Chapril, le deuxième reboot de coon (oubli du apt-get dist-upgrade) ne s'est pas déroulé nominalement:

=(^-^)=root@coon:~# systemctl status
● coon.chapril.org
    State: degraded
     Jobs: 0 queued
   Failed: 1 units
    Since: Sat 2020-07-25 18:30:54 CEST; 5min ago

=(^-^)=root@coon:~# systemctl list-units                                                                                                                                                                                                                                                                            
  UNIT                                                                                     LOAD   ACTIVE SUB       DESCRIPTION                                                                                                                                                                                        
[…]
● drbd.service                                                                             loaded failed failed    LSB: Control DRBD resources.                                                                                                                                                                     
[…]

Plusieurs tentatives de restart du service drdb et de reboots ont donné le même résultat.

Historique

#1

Mis à jour par Christian P. Momon il y a plus de 3 ans

  • Description mis à jour (diff)

De fait, les logs et le statut du service ne sont pas très éclairants.

=(^-^)=root@coon:~# journalctl -f -u drbd.service                                                                                                                                                                                                                                                                   
-- Logs begin at Sat 2020-07-25 18:42:59 CEST. --                                                                                                                                                                                                                                                                     
juil. 25 18:43:10 coon.chapril.org systemd[1]: Starting LSB: Control DRBD resources....                                                                                                                                                                                                                               
juil. 25 18:43:10 coon.chapril.org drbd[1246]: Starting DRBD resources:[                                                                                                                                                                                                                                              
juil. 25 18:43:10 coon.chapril.org drbd[1246]:      create res: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:10 coon.chapril.org drbd[1246]:    prepare disk: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:11 coon.chapril.org drbd[1246]:     adjust disk: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:11 coon.chapril.org drbd[1246]:      adjust net: coon maine                                                                                                                                                                                                                                            
juil. 25 18:43:11 coon.chapril.org drbd[1246]: ]                                                                                                                                                                                                                                                                      
La commande drdb-overview indiquait :
  • sur la pm coon :
    • Uptodate/Uptodate la ressource main,
    • WFConnection pour la ressource coon,
  • sur la pm maine :
    • Uptodate/Uptodate pour la ressource main,
    • StandAlone/DUnknown pour la ressource coon.
#2

Mis à jour par Christian P. Momon il y a plus de 3 ans

  • Statut changé de Nouveau à Résolu
L'investigation menée avec Pitchum a permis de constater que :
  • le service drdb est géré via /etc/init.d et donc qu'il est moyennement intégré à systemd ;
  • le statut du service drdb n'est pas très représentatif ;
  • mais avec un statut failed, drdb tourne ;
  • maine n'avait tout simplement connecté la ressource drdb maine.

Suite à un drdbadm connect coon sur la pm main, tout s'est bien remis et la suite de la procédure de démarrage a pu être menée à bien.

Reste la question : pourquoi la pm maine n'a pas connecté sa ressource coon automatiquement et correctement ?

Point de vigilance pour le projet reboot SI Chapril.

#3

Mis à jour par Christian P. Momon il y a plus de 3 ans

  • Statut changé de Résolu à Fermé
#4

Mis à jour par Christian P. Momon il y a plus de 3 ans

  • Version cible changé de Backlog à Sprint 2020 été

Formats disponibles : Atom PDF