Kernel BUG?

Bonjour,

Une fois par jour, logcheck me renvoie un log bizarre :

This email is sent by logcheck. If you no longer wish to receive
such mail, you can either deinstall the logcheck package or modify
its configuration file (/etc/logcheck/logcheck.conf).

System Events
=-=-=-=-=-=-=
Dec 17 01:27:56 MyServer kernel: [1337108.259782] ------------[ cut here ]------------
Dec 17 01:27:56 MyServer kernel: [1337108.261479] kernel BUG at /build/linux-rrsxby/linux-3.2.51/fs/buffer.c:3236!
Dec 17 01:27:56 MyServer kernel: [1337108.263188] invalid opcode: 0000 [#3] SMP
Dec 17 01:27:56 MyServer kernel: [1337108.264894] CPU 0
Dec 17 01:27:56 MyServer kernel: [1337108.264913] Modules linked in: xt_multiport nfsd nfs nfs_acl auth_rpcgss fscache lockd sunrpc xt_tcpudp nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT iptable_filter ip_tables x_tables fuse loop snd_hda_codec_hdmi snd_hda_codec_realtek iTCO_wdt i915 drm_kms_helper drm psmouse i2c_algo_bit pcspkr acpi_cpufreq coretemp i2c_i801 video snd_hda_intel evdev parport_pc parport iTCO_vendor_support mperf snd_hda_codec i2c_core serio_raw processor thermal_sys button crc32c_intel ghash_clmulni_intel cryptd snd_hwdep snd_pcm snd_page_alloc snd_timer snd soundcore ext4 crc16 jbd2 mbcache sg sd_mod crc_t10dif ahci libahci ehci_hcd usbcore r8169 mii usb_common libata scsi_mod [last unloaded: scsi_wait_scan]
Dec 17 01:27:56 MyServer kernel: [1337108.277912]
Dec 17 01:27:56 MyServer kernel: [1337108.279815] Pid: 2052, comm: transmission-da Tainted: G      D      3.2.0-4-amd64 #1 Debian 3.2.51-1 To Be Filled By O.E.M. To Be Filled By O.E.M./H61M-DGS
Dec 17 01:27:56 MyServer kernel: [1337108.283857] RIP: 0010:[<ffffffff8111d618>]  [<ffffffff8111d618>] free_buffer_head+0xe/0x2b
Dec 17 01:27:56 MyServer kernel: [1337108.285980] RSP: 0018:ffff880118923898  EFLAGS: 00010287
Dec 17 01:27:56 MyServer kernel: [1337108.288095] RAX: ffff880072a9b790 RBX: ffff880072a9b748 RCX: ffff8801189239b0
Dec 17 01:27:56 MyServer kernel: [1337108.290238] RDX: ffff8801189239b0 RSI: ffff880072a9b748 RDI: ffff880072a9b748
Dec 17 01:27:56 MyServer kernel: [1337108.292370] RBP: ffff8801143233b0 R08: 0000000000000023 R09: ffff880118923c50
Dec 17 01:27:56 MyServer kernel: [1337108.294500] R10: ffff880118923c50 R11: ffff880118923c50 R12: ffffea0001e22d40
Dec 17 01:27:56 MyServer kernel: [1337108.296621] R13: ffffea0001e22d20 R14: 0000000000000001 R15: 0000000000000000
Dec 17 01:27:56 MyServer kernel: [1337108.298750] FS:  00007fdf61b48700(0000) GS:ffff88011f200000(0000) knlGS:0000000000000000
Dec 17 01:27:56 MyServer kernel: [1337108.300907] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Dec 17 01:27:56 MyServer kernel: [1337108.303065] CR2: 00007f5fb33bf378 CR3: 00000001186f5000 CR4: 00000000001406f0
Dec 17 01:27:56 MyServer kernel: [1337108.305249] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Dec 17 01:27:56 MyServer kernel: [1337108.307434] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Dec 17 01:27:56 MyServer kernel: [1337108.309604] Process transmission-da (pid: 2052, threadinfo ffff880118922000, task ffff880117b4e7f0)
Dec 17 01:27:56 MyServer kernel: [1337108.311813] Stack:
Dec 17 01:27:56 MyServer kernel: [1337108.314000]  0000000000001000 ffffffff8111d6c4 ffff880118923c50 ffff880100000001
Dec 17 01:27:56 MyServer kernel: [1337108.316271]  ffff880118923a30 ffff880072a9b748 ffffea0001e22d20 ffff880118923c50
Dec 17 01:27:56 MyServer kernel: [1337108.318550]  ffff880118923a30 ffffffff810c2f8e 00000000c9fd9158 ffffffff81658cc0
Dec 17 01:27:56 MyServer kernel: [1337108.320833] Call Trace:
Dec 17 01:27:56 MyServer kernel: [1337108.323088]  [<ffffffff8111d6c4>] ? try_to_free_buffers+0x8f/0xa1
Dec 17 01:27:56 MyServer kernel: [1337108.325390]  [<ffffffff810c2f8e>] ? shrink_page_list+0x55c/0x73f
Dec 17 01:27:56 MyServer kernel: [1337108.327632]  [<ffffffff810ca042>] ? zone_page_state_add+0x14/0x23
Dec 17 01:27:56 MyServer kernel: [1337108.329806]  [<ffffffff810ca85c>] ? __mod_zone_page_state+0x3c/0x45
Dec 17 01:27:56 MyServer kernel: [1337108.331951]  [<ffffffff810c115b>] ? update_isolated_counts+0x13b/0x15a
Dec 17 01:27:56 MyServer kernel: [1337108.334092]  [<ffffffff810c3595>] ? shrink_inactive_list+0x256/0x3f0
Dec 17 01:27:56 MyServer kernel: [1337108.336232]  [<ffffffff810411ca>] ? find_busiest_group+0x1f5/0x805
Dec 17 01:27:56 MyServer kernel: [1337108.338329]  [<ffffffff810c3dd1>] ? shrink_zone+0x3c0/0x4e6
Dec 17 01:27:56 MyServer kernel: [1337108.340442]  [<ffffffff810c42ef>] ? do_try_to_free_pages+0x1cc/0x41c
Dec 17 01:27:56 MyServer kernel: [1337108.342582]  [<ffffffff810cac98>] ? __inc_zone_state+0x41/0x49
Dec 17 01:27:56 MyServer kernel: [1337108.344680]  [<ffffffff810bb203>] ? get_page_from_freelist+0x61f/0x665
Dec 17 01:27:56 MyServer kernel: [1337108.346799]  [<ffffffff810c47aa>] ? try_to_free_pages+0xa9/0xe9
Dec 17 01:27:56 MyServer kernel: [1337108.348927]  [<ffffffff810bb736>] ? __alloc_pages_nodemask+0x4ed/0x7aa
Dec 17 01:27:56 MyServer kernel: [1337108.351075]  [<ffffffff8105fd09>] ? finish_wait+0x35/0x60
Dec 17 01:27:56 MyServer kernel: [1337108.353229]  [<ffffffff810e4f32>] ? alloc_pages_current+0xc7/0xe4
Dec 17 01:27:56 MyServer kernel: [1337108.355398]  [<ffffffff810bd535>] ? __do_page_cache_readahead+0x96/0x1c3
Dec 17 01:27:56 MyServer kernel: [1337108.357589]  [<ffffffff810bd87d>] ? force_page_cache_readahead+0x5f/0x83
Dec 17 01:27:56 MyServer kernel: [1337108.359740]  [<ffffffff810b7e6d>] ? sys_fadvise64_64+0x141/0x1e2
Dec 17 01:27:56 MyServer kernel: [1337108.361871]  [<ffffffff81354212>] ? system_call_fastpath+0x16/0x1b
Dec 17 01:27:56 MyServer kernel: [1337108.363981] Code: 50 65 ff 04 25 90 0a 01 00 48 89 44 24 08 e8 4c ff ff ff 48 8b 44 24 08 48 83 c4 18 c3 48 8d 47 48 56 48 39 47 48 48 89 fe 74 02 <0f> 0b 48 8b 3d 97 c4 6c 00 e8 d1 da fc ff 65 ff 0c 25 90 0a 01
Dec 17 01:27:56 MyServer kernel: [1337108.368523] RIP  [<ffffffff8111d618>] free_buffer_head+0xe/0x2b
Dec 17 01:27:56 MyServer kernel: [1337108.370691]  RSP <ffff880118923898>
Dec 17 01:27:56 MyServer kernel: [1337108.380989] ---[ end trace a52fbd54b592738c ]---

Quelqu’un a une idée à quoi ça correspond?

Merci beaucoup.

bonjour,
ne pas prendre comme argent comptant!

invalid opcode: 0000 [#3] SMP

ressemble à une halt dans un programme,
coté buffeurs à explorer!
le ou les disks sont OK?
le swap OK?
peut-on avoir la config de la machine “myserver”

bon appétit
A+
JB1

Côté disques, ça l’air bon :

~# df -h
Sys. fich.                                             Taille Util. Dispo Uti% Monté sur
rootfs                                                   938M  213M  678M  24% /
udev                                                      10M     0   10M   0% /dev
tmpfs                                                    368M  952K  367M   1% /run
/dev/disk/by-uuid/5fd224f9-1126-44ac-bc54-e5b861936a40   938M  213M  678M  24% /
tmpfs                                                    5,0M     0  5,0M   0% /run/lock
tmpfs                                                    3,7G     0  3,7G   0% /run/shm
/dev/sda9                                                223G   54G  158G  26% /home
/dev/sda7                                                 19G  173M   18G   1% /tmp
/dev/sda6                                                 19G  1,2G   17G   7% /usr
/dev/sda8                                                184G  2,4G  172G   2% /var
/dev/sdb1                                                294G  116G  163G  42% /mnt/backup
/dev/sdc1                                                1,9T  1,5T  409G  79% /mnt/data

Le swap aussi :

~# free -m
             total       used       free     shared    buffers     cached
Mem:          3675       2467       1208          0       1556        224
-/+ buffers/cache:        686       2988
Swap:        15257         26      15231

Au niveau config :
Processeur Intel Celeron Dual-Core G1610 2.6 GHz avec 4 Gb de RAM.
J’ai eu un problème de ram récemment (voir le fil). Avant ce problème, j’avais 8Gb de RAM. Mais l’une des barrettes semble HS.
J’ai installé Debian Stable (Wheezy).

Merci pour tes réponses.

Edit: Merci et bon appétit à toi aussi

bonjour,
la machine voit bien 4GB de mémoire, il reste de la place,

peux-tu essayer une version Debian plus ressente?
A+
JB1

Réinstaller Debian? J’ai trop besoin des services qui tournent dessus…
Je crois que je vais attendre un peu pour voir.

Merci pour ton aide.

bonsoir,
RIP contient l’adresse de l’instruction en cours
référence kdump:

RIP: 0010:[<ffffffff8111d618>]  [<ffffffff8111d618>]

ce n’est pas élégant mais l’instruction en cours est:

 RIP  [<ffffffff8111d618>] free_buffer_head+0xe/0x2b

toujours sous réserve,
la fonction ennuyeuse serait free_buffer_head
d’aprés google elle ferait ceci:

On Thu, Aug 25, 2005 at 04:37:51PM +0800, Coywolf Qi Hunt wrote:
> Hello,
> 
> This cleanups up alloc_buffer_head(), by using a single get_cpu_var().
> Boot tested.

Also cleanup free_buffer_head().

 	Coywolf

en déassemblant la fonction on devrait (sous réserve) trouvé au déplacement 0xe sur une longueur de 0x2b le halt 0000
bonne soirée
A+
JB1

j’ai du faire référence et comparaison avec kdump
merci pour l’info sur le fichier /etc/logcheck/logcheck.conf

Heu… je suis perdu là :blush:

On voit que le processus à l’origine du plantage s’appelle “transmission-da”

ça correspondrait pas au paquet “transmission-daemon” non? :stuck_out_tongue:

Effectivement mais, selon les précédents logs, ce n’est pas toujours transmission-daemon. J’ai eu imap-login et kswapd0 sur les 2 derniers jours.

Quels filesystems tu utilises ? Fais voir le retour de [mono]mount[/mono].

Que du ext4.

~# mount
sysfs on /sys type sysfs (rw,nosuid,nodev,noexec,relatime)
proc on /proc type proc (rw,nosuid,nodev,noexec,relatime)
udev on /dev type devtmpfs (rw,relatime,size=10240k,nr_inodes=469000,mode=755)
devpts on /dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
tmpfs on /run type tmpfs (rw,nosuid,noexec,relatime,size=376420k,mode=755)
/dev/disk/by-uuid/5fd224f9-1126-44ac-bc54-e5b861936a40 on / type ext4 (rw,relatime,errors=remount-ro,user_xattr,barrier=1,data
=ordered)
tmpfs on /run/lock type tmpfs (rw,nosuid,nodev,noexec,relatime,size=5120k)
tmpfs on /run/shm type tmpfs (rw,nosuid,nodev,noexec,relatime,size=3877660k)
/dev/sda9 on /home type ext4 (rw,relatime,user_xattr,barrier=1,data=ordered)
/dev/sda7 on /tmp type ext4 (rw,relatime,user_xattr,barrier=1,data=ordered)
/dev/sda6 on /usr type ext4 (rw,relatime,user_xattr,barrier=1,data=ordered)
/dev/sda8 on /var type ext4 (rw,relatime,user_xattr,barrier=1,data=ordered)
/dev/sdb1 on /mnt/backup type ext4 (rw,relatime,user_xattr,barrier=1,data=ordered)
fusectl on /sys/fs/fuse/connections type fusectl (rw,relatime)
/dev/sdc1 on /mnt/data type fuseblk (rw,nosuid,nodev,relatime,user_id=0,group_id=0,allow_other,blksize=4096)
rpc_pipefs on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw,relatime)
nfsd on /proc/fs/nfsd type nfsd (rw,relatime) 

Zut. Les bugs similaires que j’ai trouvés c’était du BTRFS ou XFS.

Tu peux aussi essayer avec un kernel plus récent (celui des backports) pour voir ce que ça donne.

bonjour,
d’accord pour tranmission-da Pid: 2052 sur un OS Debian…

dans un process des call fonction
rst-ce que vous êtes d’accord:
la fonction:
system_call_fastpath appeller la fonction
shrink_page_list qui elle même a appellé
zone_page_state_add

et ainsi de suite jusque la fonction:
system_call_fastpath

un message identique sur une autre machine Debian a déjà étè déposé:

serverfault.com/questions/320657 … -any-ideas

la réponse vous satisfait-elle?
A+
JB1
:033

J’ai finalement redémarré le serveur. Et depuis, je n’ai plus ces messages dans le log.