BACKUPPC : "aborted by signal=PIPE"

Bonjour à tous,
J’ai un backuppc qui tournait depuis plusieurs mois sans aucun problème.
Depuis quelques jours toutes les sauvegardes de type “incrémentales” échouent.

[ul]Serveur de sauvegarde : Debian Wheezy
Serveur sauvegardé : Debian Wheezy
Méthode de sauvegarde Xfer : rsync
Répertoire sauvegardé : / (tout le serveur hormis dev/ sys/ et proc/ )[/ul]

La sauvegarde complète semble fonctionner à chaque fois, j’en relance une pour vous dire si elle a réussi dans mon prochain post.

Extrait des dernieres lignes du log “XferLOG.bad.z” présent dans /var/lib/backuppc/pc/monhote (j’ai mis backuppc a 15 sur le loglevel, 2.4Go de logs…) :

Read EOF: Tried again: got 0 bytes pollChild() Child is sending done Got done from child Can't write 4 bytes to socket pollChild(1) Got stats: 0 0 0 0 ('errorCnt' => 0,'ExistFileSize' => 0,'ExistFileCnt' => 0,'TotalFileCnt' => 0,'ExistFileCompSize' => 0,'TotalFileSize' => 0) pollChild(1) Child is aborting Got exit from child Done: 0 files, 0 bytes Got fatal error during xfer (aborted by signal=PIPE) Backup aborted by user signal

Fichier Journal :

2015-11-05 22:00:01 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-06 00:52:48 Aborting backup up after signal PIPE 2015-11-06 00:52:49 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-06 00:52:51 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-06 03:57:22 Aborting backup up after signal PIPE 2015-11-06 03:57:23 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-06 03:57:25 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-06 07:05:56 Aborting backup up after signal PIPE 2015-11-06 07:05:58 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-06 22:00:00 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-07 00:52:37 Aborting backup up after signal PIPE 2015-11-07 00:52:38 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-07 00:52:39 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-07 03:56:46 Aborting backup up after signal PIPE 2015-11-07 03:56:47 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-07 03:56:49 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-07 07:02:30 Aborting backup up after signal PIPE 2015-11-07 07:02:32 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-07 16:06:58 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-07 19:04:49 Aborting backup up after signal PIPE 2015-11-07 19:04:50 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-07 22:00:00 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-08 00:53:43 Aborting backup up after signal PIPE 2015-11-08 00:53:44 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-08 00:53:45 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-08 03:53:59 Aborting backup up after signal PIPE 2015-11-08 03:54:00 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-08 03:54:02 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-08 06:57:54 Aborting backup up after signal PIPE 2015-11-08 06:57:57 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-08 13:53:19 full backup started for directory / (baseline backup #48) 2015-11-08 13:58:24 Aborting backup up after signal INT 2015-11-08 13:58:25 Got fatal error during xfer (fileListReceive failed) 2015-11-08 14:03:52 incr backup started back to 2015-11-01 22:00:01 (backup #48) for directory / 2015-11-08 16:52:04 Aborting backup up after signal PIPE 2015-11-08 16:52:05 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-08 17:00:37 full backup started for directory / (baseline backup #48) 2015-11-09 08:22:55 full backup 49 complete, 6064365 files, 2056412361567 bytes, 0 xferErrs (0 bad files, 0 bad shares, 0 other) 2015-11-09 08:22:55 removing full backup 48 2015-11-09 22:00:01 incr backup started back to 2015-11-08 17:00:37 (backup #49) for directory / 2015-11-10 00:23:25 Aborting backup up after signal PIPE 2015-11-10 00:23:26 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-10 00:23:28 incr backup started back to 2015-11-08 17:00:37 (backup #49) for directory / 2015-11-10 02:46:42 Aborting backup up after signal PIPE 2015-11-10 02:46:43 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-10 02:46:44 incr backup started back to 2015-11-08 17:00:37 (backup #49) for directory / 2015-11-10 04:57:34 Aborting backup up after signal PIPE 2015-11-10 04:57:35 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-10 04:57:36 incr backup started back to 2015-11-08 17:00:37 (backup #49) for directory / 2015-11-10 07:17:52 Aborting backup up after signal PIPE 2015-11-10 07:17:53 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-10 10:39:02 incr backup started back to 2015-11-08 17:00:37 (backup #49) for directory / 2015-11-10 12:49:05 Aborting backup up after signal PIPE 2015-11-10 12:49:06 Got fatal error during xfer (aborted by signal=PIPE) 2015-11-10 15:52:33 incr backup started back to 2015-11-08 17:00:37 (backup #49) for directory / 2015-11-10 18:03:25 Aborting backup up after signal PIPE 2015-11-10 18:03:26 Got fatal error during xfer (aborted by signal=PIPE)

J’ai exploré plusieurs pistes :
-Erreur réseau : j’ai modifié le timeout mais la sauvegarde plante toujours avant la fin du delta.
-Fichier avec un nom trop long pour rsync ? J’ai des doutes car la sauvegarde complète a réussie

NOTE : les sauvegardes échouent quasiment toujours (à quelques minutes prêts) après le même temps de travail.

MERCI DE VOTRE AIDE

J’ai trouvé une réponse intéressante et potentiellement crédible ici : serverfault.com/questions/348857 … th-sigpipe
Je test demain.

Merci de vos retours sur le sujet :slightly_smiling: :slightly_smiling: :slightly_smiling:

J’ai relancé une seconde sauvegarde complète qui a réussi.

J’ai ensuite lancée une sauvegarde incrémentielle qui a réussi aussi.

A voir si demain l’incrémentielle passe bien également.

Personne n’a d’idée sur le problème sinon, des utilisateurs de backuppc dans la salle ? :smiley:

J’ai laissé traîné une session SSH (connecté à mon serveur de backup) en arrière plan pendant plusieurs heures sans y toucher.
J’ai finis par être déconnecté avec le message :

Ce message d’erreur m’a fait penser à celui que j’avais durant mes sauvegardes…

J’ai donc fais une modif sur mon serveur ssh pour éviter ce “timeout” ssh.
J’ai passé les commandes suivantes en root :

Ajout de la ligne :

Reload du serveur ssh :

Depuis 5 jours je n’ai plus d’erreur, mes sauvegardes incrémentielles se passent normalement.

Je sauvegarde une volumétrie conséquente (>2To), je pense que les sauvegardes complètes réussissaient à chaque fois car la connexion SSH est tout le temps sollicité lors d’une sauvegarde complète.
Je pense que les sauvegardes incrémentielles échouaient car le temps que rsync fasse le listing complet, la connexion SSH faisait un timeout.
C’est une hypothèse que je confirmerai dans quelques jours si tout se passe normalement.

4 jours de sauvegardes consécutives sans erreur.
Je considère que j’ai résolu le problème par la solution que j’ai donné dans le précédent post.

Je passe en résolu.

Bonjour,

Merci et bravo pour ce post altruiste…
Ca fait avancer tout le monde!

1 J'aime

Avec plaisir, c’est ma conception du libre et de l’internet! Partageons :slight_smile: