Actions
Anomalie #4607
ferméDrdb disconnected après un reboot
Statut:
Fermé
Priorité:
Normale
Assigné à:
Christian P. Momon
Catégorie:
-
Version cible:
Début:
26/07/2020
Echéance:
% réalisé:
0%
Temps estimé:
Description
Lors du redémarrage du SI Chapril, le deuxième reboot de coon (oubli du apt-get dist-upgrade) ne s'est pas déroulé nominalement:
=(^-^)=root@coon:~# systemctl status ● coon.chapril.org State: degraded Jobs: 0 queued Failed: 1 units Since: Sat 2020-07-25 18:30:54 CEST; 5min ago =(^-^)=root@coon:~# systemctl list-units UNIT LOAD ACTIVE SUB DESCRIPTION […] ● drbd.service loaded failed failed LSB: Control DRBD resources. […]
Plusieurs tentatives de restart du service drdb et de reboots ont donné le même résultat.
Actions
#1
Mis à jour par Christian P. Momon il y a plus de 4 ans
- Description mis à jour (diff)
De fait, les logs et le statut du service ne sont pas très éclairants.
=(^-^)=root@coon:~# journalctl -f -u drbd.service -- Logs begin at Sat 2020-07-25 18:42:59 CEST. -- juil. 25 18:43:10 coon.chapril.org systemd[1]: Starting LSB: Control DRBD resources.... juil. 25 18:43:10 coon.chapril.org drbd[1246]: Starting DRBD resources:[ juil. 25 18:43:10 coon.chapril.org drbd[1246]: create res: coon maine juil. 25 18:43:10 coon.chapril.org drbd[1246]: prepare disk: coon maine juil. 25 18:43:11 coon.chapril.org drbd[1246]: adjust disk: coon maine juil. 25 18:43:11 coon.chapril.org drbd[1246]: adjust net: coon maine juil. 25 18:43:11 coon.chapril.org drbd[1246]: ]La commande drdb-overview indiquait :
- sur la pm coon :
- Uptodate/Uptodate la ressource main,
- WFConnection pour la ressource coon,
- sur la pm maine :
- Uptodate/Uptodate pour la ressource main,
- StandAlone/DUnknown pour la ressource coon.
Actions
#2
Mis à jour par Christian P. Momon il y a plus de 4 ans
- Statut changé de Nouveau à Résolu
L'investigation menée avec Pitchum a permis de constater que :
- le service drdb est géré via /etc/init.d et donc qu'il est moyennement intégré à systemd ;
- le statut du service drdb n'est pas très représentatif ;
- mais avec un statut failed, drdb tourne ;
- maine n'avait tout simplement connecté la ressource drdb maine.
Suite à un drdbadm connect coon sur la pm main, tout s'est bien remis et la suite de la procédure de démarrage a pu être menée à bien.
Reste la question : pourquoi la pm maine n'a pas connecté sa ressource coon automatiquement et correctement ?
Point de vigilance pour le projet reboot SI Chapril.
Actions
#4
Mis à jour par Christian P. Momon il y a environ 4 ans
- Version cible changé de Backlog à Sprint 2020 été
Actions