Anomalie #4607
fermé
Drdb disconnected après un reboot
Ajouté par Christian P. Momon il y a plus de 4 ans.
Mis à jour il y a environ 4 ans.
Assigné à:
Christian P. Momon
Description
Lors du redémarrage du SI Chapril, le deuxième reboot de coon (oubli du apt-get dist-upgrade) ne s'est pas déroulé nominalement:
=(^-^)=root@coon:~# systemctl status
● coon.chapril.org
State: degraded
Jobs: 0 queued
Failed: 1 units
Since: Sat 2020-07-25 18:30:54 CEST; 5min ago
=(^-^)=root@coon:~# systemctl list-units
UNIT LOAD ACTIVE SUB DESCRIPTION
[…]
● drbd.service loaded failed failed LSB: Control DRBD resources.
[…]
Plusieurs tentatives de restart du service drdb et de reboots ont donné le même résultat.
- Description mis à jour (diff)
De fait, les logs et le statut du service ne sont pas très éclairants.
=(^-^)=root@coon:~# journalctl -f -u drbd.service
-- Logs begin at Sat 2020-07-25 18:42:59 CEST. --
juil. 25 18:43:10 coon.chapril.org systemd[1]: Starting LSB: Control DRBD resources....
juil. 25 18:43:10 coon.chapril.org drbd[1246]: Starting DRBD resources:[
juil. 25 18:43:10 coon.chapril.org drbd[1246]: create res: coon maine
juil. 25 18:43:10 coon.chapril.org drbd[1246]: prepare disk: coon maine
juil. 25 18:43:11 coon.chapril.org drbd[1246]: adjust disk: coon maine
juil. 25 18:43:11 coon.chapril.org drbd[1246]: adjust net: coon maine
juil. 25 18:43:11 coon.chapril.org drbd[1246]: ]
La commande drdb-overview indiquait :
- sur la pm coon :
- Uptodate/Uptodate la ressource main,
- WFConnection pour la ressource coon,
- sur la pm maine :
- Uptodate/Uptodate pour la ressource main,
- StandAlone/DUnknown pour la ressource coon.
- Statut changé de Nouveau à Résolu
L'investigation menée avec Pitchum a permis de constater que :
- le service drdb est géré via /etc/init.d et donc qu'il est moyennement intégré à systemd ;
- le statut du service drdb n'est pas très représentatif ;
- mais avec un statut failed, drdb tourne ;
- maine n'avait tout simplement connecté la ressource drdb maine.
Suite à un drdbadm connect coon sur la pm main, tout s'est bien remis et la suite de la procédure de démarrage a pu être menée à bien.
Reste la question : pourquoi la pm maine n'a pas connecté sa ressource coon automatiquement et correctement ?
Point de vigilance pour le projet reboot SI Chapril.
- Statut changé de Résolu à Fermé
- Version cible changé de Backlog à Sprint 2020 été
Formats disponibles : Atom
PDF