Soucis NFS avec fichiers de grandes tailles

Bonjour à tous,

Voilà mon soucis : j’ai un “serveur” sous Wheezy, 3.2.0-4-amd64 (un “vieux” HP Pavilion headless mais qui tourne sans problème) qui contient mes données le tout accessible depuis les autres ordinateurs du réseau entre autre grâce à NFS4.

Le partage marche sans aucun problème (depuis Debian ou Ubuntu), sauf dans le cas où on commence à travailler sur de gros fichiers (type sauvegardes système…). Dans ce dernier cas (et seulement dans ce dernier cas), NFS plante lamentablement au bout de 3 minutes avec le message (/var/log/messages) suivant :

Aug 12 13:41:38 marc-serveur kernel: [17436.334919] PGD 0 Aug 12 13:41:38 marc-serveur kernel: [17436.335062] CPU 0 Aug 12 13:41:38 marc-serveur kernel: [17436.335111] Modules linked in: nfsd nfs nfs_acl auth_rpcgss fscache lockd sunrpc loop dm_crypt dm_mod radeon snd_atiixp snd_ac97_codec snd_pcm snd_page_alloc ttm arc4 ath5k drm_kms_helper drm powernow_k8 ath power_supply mperf i2c_piix4 i2c_algo_bit mac80211 ac97_bus edac_mce_amd snd_timer snd soundcore cfg80211 rfkill edac_core evdev pcspkr processor i2c_core k8temp button shpchp ext4 crc16 jbd2 mbcache sg sd_mod crc_t10dif ata_generic usb_storage pata_atiixp sata_sil libata ohci_hcd ehci_hcd usbcore scsi_mod firewire_ohci fan thermal thermal_sys 8139too 8139cp mii firewire_core crc_itu_t usb_common [last unloaded: scsi_wait_scan] Aug 12 13:41:38 marc-serveur kernel: [17436.336750] Aug 12 13:41:38 marc-serveur kernel: [17436.336792] Pid: 2248, comm: nfsd Not tainted 3.2.0-4-amd64 #1 Debian 3.2.60-1+deb7u3 HP Pavilion 061 EY915AA-ABF s7520.fr/Opal Aug 12 13:41:38 marc-serveur kernel: [17436.337071] RIP: 0010:[<ffffffffa04a9311>] [<ffffffffa04a9311>] set_nfsv4_acl_one+0x15/0x7e [nfsd] Aug 12 13:41:38 marc-serveur kernel: [17436.337296] RSP: 0018:ffff8800395c3d30 EFLAGS: 00010286 Aug 12 13:41:38 marc-serveur kernel: [17436.337419] RAX: 0000000000004000 RBX: ffff88003780f300 RCX: 0000000000000024 Aug 12 13:41:38 marc-serveur kernel: [17436.337582] RDX: ffffffffa04c56fb RSI: 0000000000000000 RDI: ffff88003780f300 Aug 12 13:41:38 marc-serveur kernel: [17436.337744] RBP: ffff88003780f300 R08: 0000000000000000 R09: 0000000000000000 Aug 12 13:41:38 marc-serveur kernel: [17436.337907] R10: 0000000000000000 R11: 0000000000000000 R12: ffffffffa04c56fb Aug 12 13:41:38 marc-serveur kernel: [17436.338070] R13: 0000000000000000 R14: 0000000000000440 R15: ffff880037a77180 Aug 12 13:41:38 marc-serveur kernel: [17436.338234] FS: 00007f51eda88700(0000) GS:ffff88003bc00000(0000) knlGS:0000000000000000 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b Aug 12 13:41:38 marc-serveur kernel: [17436.338397] CR2: 0000000000000010 CR3: 0000000038e82000 CR4: 00000000000006f0 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] Process nfsd (pid: 2248, threadinfo ffff8800395c2000, task ffff880037ae4780) Aug 12 13:41:38 marc-serveur kernel: [17436.338397] 000000000000002e ffff880000000000 ffff88003780f300 ffff880037813ca8 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] 0000000000000000 0000000000000000 0000000000000440 ffffffffa04a9bf4 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] ffff88003974b780 0000000000000000 ffff880037a77040 ffff880039442000 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa04a9bf4>] ? nfsd4_set_nfs4_acl+0xb4/0xe6 [nfsd] Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa04b3637>] ? nfsd4_setattr+0xae/0xe8 [nfsd] Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa04b28d6>] ? nfsd4_proc_compound+0x251/0x41d [nfsd] Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa04a67cd>] ? nfsd_dispatch+0xd7/0x1ba [nfsd] Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa040ac3f>] ? svc_process_common+0x2c3/0x4c4 [sunrpc] Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffff8103f6e2>] ? try_to_wake_up+0x197/0x197 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa040b050>] ? svc_process+0x110/0x12c [sunrpc] Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa04a60e3>] ? nfsd+0xe3/0x127 [nfsd] Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffffa04a6000>] ? 0xffffffffa04a5fff Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffff8105f701>] ? kthread+0x76/0x7e Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffff813575b4>] ? kernel_thread_helper+0x4/0x10 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffff8105f68b>] ? kthread_worker_fn+0x139/0x139 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] [<ffffffff813575b0>] ? gs_change+0x13/0x13 Aug 12 13:41:38 marc-serveur kernel: [17436.338397] RSP <ffff8800395c3d30> Aug 12 13:41:38 marc-serveur kernel: [17436.406412] ---[ end trace bfe7d78440e6440e ]---
Relancer NFS via

fait repartir NFS pour… 3 minutes, puis paf, la même erreur ! Il est nécessaire de redémarrer le serveur pour relancer correctement NFS. J’aimerai beaucoup solutionner ce soucis, le seul qui me reste mais je n’ai pas trop d’idée par où commencer.

Tout aide serait la bienvenue, merci d’avance !

Bonjour,

dans le fichier /etc/exports du serveur nfs, tu as mis quoi comme options ?
async n’a rien donné ?

Bonjour,

Mon /etc/exports est le suivant :

Je n’ai pas essayé l’option async, mais j’y vais de ce pas !

Merci

Ça ressemble à un problème de “taille maxi requête réseau”.

Peut-être en utilisant les options [mono]rsize=8192,wsize=8192[/mono] dans la ligne de commande de [mono]mount[/mono] (ou le fichier [mono]/etc/fstab[/mono]).

Voir le [mono]man[/mono] de [mono]nfs[/mono].

Malheureusement, aucun des 2 essais (ajout de l’option async sur le export du serveur et des option rsize et wsize du client) ne s’est révélé concluant…

Je vais essayer avec un autre client (portable tournant sous un Ubuntu) pour voir si c’est du au client ou au serveur (?)

[quote=“singinglarvae”]… pour voir si c’est du au client ou au serveur …[/quote] Et après ça, Il faudra aussi regarder du côté des configurations des switches ou/et des routeurs du réseau.

EDIT: Il est peut-être possible de connecter directement le client au serveur, pour voir si le problème est le même.

Bonjour,

Et bien le problème reste le même quelque soit le client…

En lançant Back in time sous console, j’ai l’erreur suivante :

code
INFO: Lock
INFO: on process begins
INFO: [GnomePlugin.Systray.run]
INFO: [GnomePlugin.Systray.run] begin loop
INFO: Profile_id: 1
INFO: Command “find “/mnt/marc-serveur/Backups/backintime/backintime/marc-desktop/marc/1/new_snapshot” -type d -exec chmod u+wx {} ;” returns 0
INFO: Command “rm -rf “/mnt/marc-serveur/Backups/backintime/backintime/marc-desktop/marc/1/new_snapshot”” returns 0
INFO: Compare with old snapshot: 20140527-115604-380
rsync: opendir “/home/marc/.config/gsmartcontrol” failed: Permission denied (13)
rsync error: some files/attrs were not transferred (see previous errors) (code 23) at main.c(1070) [sender=3.0.9]
WARNING: Command “rsync -rtDH --links --no-p --no-g --no-o --delete --delete-excluded -i --dry-run --out-format=“BACKINTIME: %i %n%L” --chmod=Du+wx --exclude=”/mnt/marc-serveur/Backups/backintime" --exclude="/home/marc/.local/share/backintime" --include="/home/marc/" --include="/home/" --exclude=".gvfs" --exclude=".cache*" --exclude="[Cc]ache*" --exclude=".thumbnails*" --exclude="[Tt]rash*" --exclude=".backup" --exclude="~" --exclude=".dropbox" --exclude="/proc" --exclude="/sys" --exclude="/dev" --include="/home/marc/**" --exclude="*" / “/mnt/marc-serveur/Backups/backintime/backintime/marc-desktop/marc/1/20140527-115604-380/backup/”" returns 5888
INFO: Create hard-links
INFO: Command “find “/mnt/marc-serveur/Backups/backintime/backintime/marc-desktop/marc/1/20140527-115604-380/backup/” -type d -exec chmod u+wx {} ;” returns 0
app.py: Fatal IO error 11 (Ressource temporairement non disponible) on X server :0.[/code]
Je continue a creuser…