Projet

Général

Profil

Actions

Anomalie #1340

fermé

backuppc de ombos.raceme.org

Ajouté par Quentin CHERGUI il y a plus de 11 ans. Mis à jour il y a presque 4 ans.

Statut:
Fermé
Priorité:
Urgente
Assigné à:
Catégorie:
Task
Version cible:
-
Début:
07/08/2013
Echéance:
% réalisé:

100%

Temps estimé:
Difficulté:
2 Facile

Description

Il semblerait que le backuppc externe, qui tourne sur ombos.raceme.org, soit cassé.

  • La dernière sauvegarde de ns1 non échouée date du
  • La dernière sauvegarde de pavot non échouée date du

Les deux backups sont interrompues par un signal=ALRM en plein mileu.

Voir ce thread pour plus d'informations :
http://www.mail-archive.com/backuppc-users@lists.sourceforge.net/msg02670.html

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

Lancement manuel d'une backup de pavot.april.org

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

La backup (incrémentale !) de Pavot lancée hier soir est toujours en cours.
L'hypothèse que le signal=ALRM soit provoqué par un timeout est donc probable.

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

[13:22:47] <raceme> vous me direz si c'est toujours nécessaire que mon dédié (ombos.raceme.org) fasse du backuppc
[14:46:14] <kankan_01> raceme: dans l'immédiat, oui, surtout pour Pavot.
[14:47:10] <raceme> kankan_01: mais je ne sais pas si la conf actuelle est correcte car je n'ai rien suivi depuis au moins 3 ou 4 ans sur les évolutions des serveurs
[14:48:12] <kankan_01> raceme: le problèmùe le plus urgent, c'est que les backups s'éternisent et sont donc copées pour "timeout" 

La cause est bien un timeout. Une option de limitation de bande passante qui faisait s'éterniser la sauvegarde :

[14:55:36] <raceme> les erreurs de mon côté semblent indiquer du timeout ?
[14:56:17] <raceme> pour information dans la conf du rsync de mon côté il y a: --bwlimit=64
[14:56:34] <kankan_01> ah, ça explique le temps de backup
[14:56:57] <raceme> une vieille demande de dachary ou Sp4rKy (je ne sais plus) parce qu'on plombait la bp
[14:59:19] <raceme>  $Conf{ClientTimeout} = 72000;
[14:59:36] <raceme> ça fait 20h si je compte bien
[15:00:17] <kankan_01> Mhhh, dans ce cas, bizarre il me semble qu'on a dépasé les 24h
[15:00:35] <raceme> oui c'est ce que je vois... 4863 minutes ça fait 80 heures
[15:00:56] <raceme> sauf que chaque partition est sauvegardée indépendemment. Ça doit être 20h par partition
[15:01:09] <kankan_01> OK
[15:01:29] <raceme> et chose très drôle: ya pas de timestamp dans les logs :)
[15:01:46] <kankan_01> mais sans bwlimit, il y a des cahnces que ça se termine dans les temps
[15:02:03] <raceme> je commente l'option sur ns1 et pavot alors

[15:41:35] <raceme> kankan_01: je viens de trouver des logs:
[15:42:09] <raceme> 2013-08-07 19:36:19 incr backup started back to 2012-08-30 06:33:23 (backup #257) for directory /srv
[15:42:15] <raceme> 2013-08-09 08:44:26 Aborting backup up after signal ALRM
[15:42:22] <raceme> ça fait bien plus que 20h

Tentative de backup avec l'option retirée :

[15:43:43] <raceme> là il fait /usr et il ne se passe pas grand chose de visible (pas de trafic)
[15:44:38] <kankan_01> Non, là plus rien
[16:31:24] <kankan_01> raceme: 70Mbps en ce moment pour la backup :)
[16:32:17] <kankan_01> ah, retombé
[16:34:39] <raceme> kankan_01: là c'est 100

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

  • Statut changé de Confirmé à Résolu
  • % réalisé changé de 0 à 100

Depuis le retrait de l'option de limite de bande passante, les tests se font correctement. Le problème est résolu.

Mis à jour par Quentin Gibeaux il y a plus de 5 ans

  • Statut changé de Résolu à Fermé

Mis à jour par Christian P. Momon il y a presque 4 ans

  • Description mis à jour (diff)
  • Assigné à mis à Quentin CHERGUI
Actions

Formats disponibles : Atom PDF