Projet

Général

Profil

Anomalie #3928

Le site https://listes.chapril.org/ n'est plus accessible

Ajouté par Christian P. Momon il y a plus de 4 ans. Mis à jour il y a environ 3 ans.

Statut:
Fermé
Priorité:
Élevée
Assigné à:
Catégorie:
Listes de diffusion
Début:
14/10/2019
Echéance:
% réalisé:

0%

Temps estimé:

Description

Notre merveilleuse sonde Icinga nous informe que :

17:05 < chatonic[3]> sympa.cluster.chapril.org!WWSympa: => CRITICAL - Le socket n'a pas répondu dans les 10 secondes

Et effectivement, le site ne répond plus.


Demandes liées

Lié à Admins - Anomalie #1702: Problème d'arrêt d'apache2 lors du logrotate sur sympa.cluster.april.orgFermé21/04/2016

Actions

Historique

#1

Mis à jour par Christian P. Momon il y a plus de 4 ans

  • Statut changé de Nouveau à Confirmé
#2

Mis à jour par Christian P. Momon il y a plus de 4 ans

  • Assigné à mis à François Poulain

Sur Freenode#april-chapril, le 14/10/2019 :

18:06 < QGuLL> cpm_screen: ya des apache en zombie sur symap
18:06 < QGuLL> root       825  0.0  0.2   5732  2088 ?        Ss   oct.13   0:01 /usr/sbin/apache2 -k start
18:06 < QGuLL> www-data   831  0.0  0.2   7260  2556 ?        S    oct.13   0:00  \_ /usr/sbin/apache2 -k start
18:06 < QGuLL> www-data   837  0.0  0.0      0     0 ?        Z    oct.13   0:01  \_ [apache2] <defunct>
18:06 < QGuLL> www-data   838  0.0  0.0      0     0 ?        Z    oct.13   0:00  \_ [apache2] <defunct>

Redémarrer Apache suffit à décoincer le problème. Par contre, ça n'explique pas le problème…

#3

Mis à jour par Christian P. Momon il y a plus de 4 ans

  • Assigné à François Poulain supprimé
#4

Mis à jour par Christian P. Momon il y a plus de 4 ans

  • Statut changé de Confirmé à Attente d'information
  • Assigné à mis à Christian P. Momon

C'est la deuxième fois en quelques jours. En l'absence d'autres explications, difficile d'aller plus loin.

Si le problème ne se reproduit pas d'ici 7 jours alors fermer le ticket.

#5

Mis à jour par Christian P. Momon il y a plus de 4 ans

Ça n'a pas mis longtemps à recommencer :

=(^-^)=root@sympa:~# ps auxwww|grep apache2
root     16396  0.0  0.1   5732  1976 ?        Ss   oct.14   0:00 /usr/sbin/apache2 -k start
www-data 16397  0.0  0.2   7260  2808 ?        S    oct.14   0:00 /usr/sbin/apache2 -k start
www-data 16398  0.0  0.0      0     0 ?        Z    oct.14   0:01 [apache2] <defunct>
www-data 16399  0.0  0.0      0     0 ?        Z    oct.14   0:00 [apache2] <defunct>
root     24749  0.0  0.0   6224   876 pts/2    S+   00:15   0:00 grep --color=auto apache2

#6

Mis à jour par Christian P. Momon il y a plus de 4 ans

Apache n'est pas le seul à avoir des zombies :

=(^-^)=root@sympa:/var/log#  ps auxwww|grep Z
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root       580  0.0  0.0      0     0 ?        ZNs  oct.19   0:00 [sudo] <defunct>
root       918  0.0  0.0      0     0 ?        ZNs  oct.28   0:00 [sudo] <defunct>
root      1097  0.0  0.0      0     0 ?        ZNs  oct.28   0:00 [sudo] <defunct>
root      1311  0.0  0.0      0     0 ?        ZNs  oct.28   0:00 [sudo] <defunct>
root      1862  0.0  0.0      0     0 ?        ZNs  oct.28   0:00 [sudo] <defunct>
root      2250  0.0  0.0      0     0 ?        ZNs  oct.26   0:00 [sudo] <defunct>
root      2767  0.0  0.0      0     0 ?        ZNs  oct.20   0:00 [sudo] <defunct>
root      2846  0.0  0.0      0     0 ?        ZNs  oct.26   0:00 [sudo] <defunct>
www-data  3049  0.0  0.0      0     0 ?        Z    oct.28   0:00 [apache2] <defunct>
www-data  3112  0.0  0.0      0     0 ?        Z    oct.28   0:00 [apache2] <defunct>
www-data  3142  0.0  0.0      0     0 ?        Z    oct.28   0:01 [apache2] <defunct>
root      3231  0.0  0.0      0     0 ?        ZNs  oct.28   0:00 [sudo] <defunct>
root      4997  0.0  0.0      0     0 ?        ZNs  oct.15   0:00 [sudo] <defunct>
root      8475  0.0  0.0   6092   844 pts/0    S+   00:55   0:00 grep --color=auto Z
root      8998  0.0  0.0      0     0 ?        ZNs  oct.20   0:00 [sudo] <defunct>
root     11268  0.0  0.0      0     0 ?        ZNs  oct.13   0:00 [sudo] <defunct>
root     12918  0.0  0.0      0     0 ?        ZNs  oct.19   0:00 [sudo] <defunct>
root     14424  0.0  0.0      0     0 ?        ZNs  oct.20   0:00 [sudo] <defunct>
root     16130  0.0  0.0      0     0 ?        ZNs  oct.24   0:00 [sudo] <defunct>
root     17417  0.0  0.0      0     0 ?        ZNs  oct.14   0:00 [sudo] <defunct>
root     17603  0.0  0.0      0     0 ?        ZNs  oct.14   0:00 [sudo] <defunct>
root     17762  0.0  0.0      0     0 ?        ZNs  oct.14   0:00 [sudo] <defunct>
root     19785  0.0  0.0      0     0 ?        ZNs  oct.23   0:00 [sudo] <defunct>
root     19823  0.0  0.0      0     0 ?        ZNs  oct.18   0:00 [sudo] <defunct>
root     20675  0.0  0.0      0     0 ?        ZNs  oct.28   0:00 [sudo] <defunct>
root     21496  0.0  0.0      0     0 ?        ZNs  oct.26   0:00 [sudo] <defunct>
root     22291  0.0  0.0      0     0 ?        ZNs  oct.29   0:00 [sudo] <defunct>
root     22889  0.0  0.0      0     0 ?        ZNs  oct.23   0:00 [sudo] <defunct>
root     27995  0.0  0.0      0     0 ?        ZNs  oct.22   0:00 [sudo] <defunct>
root     28120  0.0  0.0      0     0 ?        ZNs  oct.27   0:00 [sudo] <defunct>
root     28374  0.0  0.0      0     0 ?        ZNs  oct.26   0:00 [sudo] <defunct>
root     28529  0.0  0.0      0     0 ?        ZNs  oct.25   0:00 [sudo] <defunct>
root     28597  0.0  0.0      0     0 ?        ZNs  oct.22   0:00 [sudo] <defunct>
root     29006  0.0  0.0      0     0 ?        ZNs  oct.22   0:00 [sudo] <defunct>
root     29781  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     29940  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     30503  0.0  0.0      0     0 ?        ZNs  oct.26   0:00 [sudo] <defunct>
root     30975  0.0  0.0      0     0 ?        ZNs  oct.26   0:00 [sudo] <defunct>
root     31336  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     31499  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     31659  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     31728  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     31781  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     32030  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
root     32196  0.0  0.0      0     0 ?        ZNs  oct.21   0:00 [sudo] <defunct>
root     32277  0.0  0.0      0     0 ?        ZNs  oct.16   0:00 [sudo] <defunct>
=(^-^)=root@sympa:/var/log#

Du coup, une idée ?

#7

Mis à jour par Laurent POUJOULAT il y a plus de 4 ans

Que raconte le syslog ?

#8

Mis à jour par Christian P. Momon il y a plus de 4 ans

  • Lié à Anomalie #1702: Problème d'arrêt d'apache2 lors du logrotate sur sympa.cluster.april.org ajouté
#9

Mis à jour par François Poulain il y a plus de 4 ans

Marre. J'ai installé nginx.

- installation de nginx et spawn-fcgi
- reprise mutatis mutandis de la conf du nginx sympa april:

=(^-^)=root@sympa:/etc/nginx# cat snippets/sympa.conf 
location = / {
    return 301 /sympa/;
}

# shoot down rss for perfs issues
location = /sympa/rss {
    return 301 /sympa/;
}

location ~ ^/sympa/.*/chaton {
    return 301 /sympa/info/chapril;
}

location /sympa {
    include fastcgi_params;
    fastcgi_pass unix:/run/sympa/wwsympa.socket;
    fastcgi_split_path_info ^(/sympa)(.*)$;
        fastcgi_param SCRIPT_FILENAME /usr/lib/cgi-bin/sympa/wwsympa.fcgi;
        fastcgi_param PATH_INFO $fastcgi_path_info;
}

location /static-sympa {
    alias /usr/share/sympa/static_content;
    access_log off;
}

location /css-sympa/chapril.org {
    alias /var/lib/sympa/css/chapril.org;
    access_log off;
}

- installation du launcher:
=(^-^)=root@sympa:/etc/sympa# cat > /etc/systemd/system/wwsympa.service
[Unit]
Description=WWSympa - Web interface for Sympa mailing list manager
After=syslog.target sympa.service
BindsTo=sympa.service

[Service]
Type=forking
PIDFile=/var/run/sympa/wwsympa.pid
ExecStart=/usr/bin/spawn-fcgi -F $FCGI_CHILDREN \
    -P /var/run/sympa/wwsympa.pid \
    -u $FCGI_USER -g $FCGI_GROUP $FCGI_OPTS -- \
    /usr/lib/cgi-bin/sympa/wwsympa.fcgi
Environment="FCGI_CHILDREN=5" 
Environment="FCGI_USER=sympa" 
Environment="FCGI_GROUP=sympa" 
Environment="FCGI_OPTS=-s /var/run/sympa/wwsympa.socket -M 0600 -U www-data" 
EnvironmentFile=-/etc/default/sympa
Restart=always

[Install]
WantedBy=multi-user.target

#10

Mis à jour par François Poulain il y a plus de 4 ans

On a un comportement curieux. Le truc passe en ipv6 mais pas en ipv4.

Comme on a proxy_pass http://sympa.cluster.chapril.org dans le bastion, des fois ça marche et des fois pas.

=> forçage en ipv6 dans le bastion.

#11

Mis à jour par Christian P. Momon il y a plus de 4 ans

  • Projet changé de Chapril à Infra Chapril
#12

Mis à jour par Christian P. Momon il y a environ 4 ans

  • Version cible mis à Backlog
#13

Mis à jour par Christian P. Momon il y a plus de 3 ans

  • Assigné à changé de Christian P. Momon à François Poulain
#14

Mis à jour par Christian P. Momon il y a plus de 3 ans

  • Catégorie mis à Listes de diffusion
#15

Mis à jour par Christian P. Momon il y a environ 3 ans

  • Statut changé de Attente d'information à Résolu

A priori, traité et plus de problème.

#16

Mis à jour par Quentin Gibeaux il y a environ 3 ans

  • Statut changé de Résolu à Fermé
#17

Mis à jour par Christian P. Momon il y a environ 3 ans

  • Version cible changé de Backlog à Sprint 2021 mars

Formats disponibles : Atom PDF