On va augmenter un peu la dose:
sudo rm -rf /var/cache
hum, désolé mais je vais pas la tenter celle-là (trop de dossiers à reconstituer)
root@Debian:~# ls /var/cache
apparmor apt cracklib debconf flashplugin-nonfree fonts ldconfig man pm-utils private
app-info apt-xapian-index cups dictionaries-common fontconfig fwupd lightdm PackageKit postgresql samba
root@Debian:~#
C’est du cache à reconstruire après reboot et upgrade bullseye.
C’est vous qui voyez… / voir tentatives plus progressives, mais je ne vois pas pourquoi ça coince après spécifiquement tentative d’upgrade à bullseye.
Trop de boulot et pour tout dire je ne vois pas le lien avec une erreur apt et la destruction du cache postgresql (par exemple).
Sinon j’ai eu d’autres alertes du même genre :
Erreur du busistes de paquets… 0%
sur un apt purge
et ça (qui sent pas trop bon )
root@Debian:~# mandb -t
Erreur du bus
root@Debian:~#
?? Je n’ai jamais rien eu à construire/reconstruire dans ce cache. Du cache est du cache.
Je n’insiste pas, mais dans des cas zarbis d’origine non identifiée, il faut parfois des solutions zarbies.
Y’a des paquets qui sont pas dans la distrib de base et j’ai des préférences à garder dans ma base de données
Certes, mais en général on les tente en dernier recours. En attendant je vais voir si on ne me propose pas d’autres idées. Mais merci pour tes propositions.
Je viens d’avoir ça sur un apt upgrade
E: Erreur de lecture - read (5: Erreur d'entrée/sortie)
W: Sources disagree on hashes for supposely identical version '3.66' of 'mime-support:amd64'.
W: Sources disagree on hashes for supposely identical version '3.69' of 'mailcap:amd64'.
W: Sources disagree on hashes for supposely identical version '4.0.0' of 'media-types:amd64'.
W: Sources disagree on hashes for supposely identical version '3.0.7.33374.ds4-2' of 'firebird3.0-common:amd64'.
W: Sources disagree on hashes for supposely identical version '3.0.7.33374.ds4-2' of 'firebird3.0-common-doc:amd64'.
W: Sources disagree on hashes for supposely identical version '20200910-1' of 'fonts-urw-base35:amd64'.
W: Sources disagree on hashes for supposely identical version '4.8.0-1' of 'libgtksourceview-4-common:amd64'.
W: Sources disagree on hashes for supposely identical version '3.36.1-1' of 'gnome-weather:amd64'.
W: Sources disagree on hashes for supposely identical version '3.24.24-4+deb11u2' of 'libgtk-3-common:amd64'.
W: Sources disagree on hashes for supposely identical version '4.10.0-1' of 'manpages-fr:amd64'.
W: Sources disagree on hashes for supposely identical version '2.0.0-1' of 'python3-dnspython:amd64'.
W: Sources disagree on hashes for supposely identical version '3.16.0-1' of 'python3-louis:amd64'.
Petit détail (ou pas) que j’ai oublié de préciser :
Je suis en console de récupération.
Je ne sais pas si ça joue mais dans le doute je précise ce point.
Initialement, c’est sur une mise à jour de grub que le problème a commencé. Du coup je n’ai plus accès au boot « normal »
Ça fait en effet beaucoup de ‹ petits › détails que tu oublies, un peu trop.
Super ! Donc ça veut dire que tu envisages d’autres solutions dans ce contexte ?
Je patiente…
Pas exactement le sens non. Je préfère avoir une vue d’ensemble dans un premier temps plutôt qu’après des "tiens au fait, javais oublié de dire " x 5.
Pas d’idée là. Il faut déjà trouver l’origine d’autres problèmes précédemment cumulés.
Bonjour
Ca aurait été bien de commencer par là avant d’aller parler d’un souci de cache…
Essaye déjà de réparer ton grub pour commencer:
update-grub
puis tu tentes de rebooter en mode normal
Oui j’ai essayé ça. J’ai même fait un apt install --reinstall grub-pc grub-common qui s’est bien passé.
Il a booté normalement quelques fois puis a recommencé à planter sur le boot normal.
En fait, j’ai beaucoup d’IRQ suite à I/O error mais je ne suis pas sûr que ce soit le disque qui ait des problèmes de surface.
Je dis ça parce que si je réessaie plusieurs fois un apt update ou apt install qui sort en erreur, il finit par passer (une sorte de brute-force en essayant de passer entre les IRQ).
J’en déduis que c’est peut-être un problème de bus ou soft du disque.
Je l’ai monté sur un autre PC (pas facile d’enlever un disque sur un Compad Presario SR2029).
Pour l’instant j’ai
root@kali:~# fsck -t vxfs -n /dev/sdb3
fsck from util-linux 2.31.1
e2fsck 1.44.1 (24-Mar-2018)
Warning: skipping journal recovery because doing a read-only filesystem check.
Debian: clean, 320280/4587520 files, 2810431/18318080 blocks
root@kali:~#
Sur la partition système. Donc rien d’anormal.
Quels tests non destructifs je pourrais faire pour vérifier correctement le disque ?
J’ai initié un test avec badblocs
root@kali:~# badblocks -nsv /dev/sdb
Checking for bad blocks in non-destructive read-write mode
From block 0 to 244198583
Checking for bad blocks (non-destructive read-write test)
Testing with random pattern: 673243% done, 0:33 elapsed. (0/0/0 errors)
673253% done, 0:35 elapsed. (1/0/0 errors)
0.27% done, 4:55 elapsed. (16/0/0 errors)
badblocks: Input/output error during test data write, block 6955009
6955009 done, 53:19 elapsed. (16/0/0 errors)
6955072
2.97% done, 55:30 elapsed. (19/0/61 errors)
Voilà ce que j’ai pour l’instant (j’ai tronqué le résultat qui donne les numéros de blocs pour une meilleure lisibilité)
C’est la première fois que j’utilise badblocs.
Mais qu’est-ce donc que cette erreur puisqu’il n’est pas censé écrire avec l’option -n ?
salut
quand je lis dossier de cache je pense plutot à /var/lib/dpkg/info/
quand je lis E: Erreur de lecture - read (5: Erreur d'entrée/sortie)
je pense à
fsck -f -y -v /dev/sdb
et à smart
smartctl -t long /dev/sdb
Tiens ! Une nouvelle surprise (ça va faire plaisir à @Verner)… un filesystem « exotique »… des fois, il ne faut pas chercher plus loin (j’ai eu un souci avec un volume RAID 0 réalisé en btrfs au passage au kernel 6.0…)
Du coup, ça raconte quoi quand tu fais:
df -hT
(Je réalise seulement maintenant que pour une question à priori d’espace indisponible, tu n’as pas encore présenté un état de cette indisponibilité d’espace par rapport à ton partitionnement avec un df
, ce qui permettrait d’y voir un peu plus clair)
Si, je l’ai dit dans le premier post
Que veux-tu dire par là ? C’est du Ext4.
Bon, sauf à discuter de la fiabilité de l’outil utilisé (badblocks) il semblerait que le problème soit matériel. J’ai arrêté le contrôle au bout de 9h
49188820done, 9:32:59 elapsed. (143/0/61 errors)
49188821done, 9:33:01 elapsed. (144/0/61 errors)
49188822done, 9:33:03 elapsed. (145/0/61 errors)
49188823done, 9:33:05 elapsed. (146/0/61 errors)
20.15% done, 9:33:07 elapsed. (147/0/61 errors)
Avec déjà pas mal d’erreurs. Je vais passer sur un forum dédié matériel et vous tiendrai informés de mes avancées.
tu as essayé smart?
en gui : gsmartcontrol
Oui. En revanche le gui n’est pas le plus adapté, vu que je suis en console de récupération
Voilà le premier résultat que j’avais obtenu :
root@Debian:~# smartctl -a /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-18-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar SE Serial ATA
Device Model: WDC WD2500JS-60NCB1
Serial Number: WD-WCANK7476328
Firmware Version: 10.02E02
User Capacity: 250 059 350 016 bytes [250 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA/ATAPI-7 (minor revision not indicated)
Local Time is: Wed Dec 14 01:44:27 2022 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 8280) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 96) minutes.
Conveyance self-test routine
recommended polling time: ( 6) minutes.
SCT capabilities: (0x103f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always - 73
3 Spin_Up_Time 0x0003 218 188 021 Pre-fail Always - 4058
4 Start_Stop_Count 0x0032 098 098 000 Old_age Always - 2681
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0
9 Power_On_Hours 0x0032 082 082 000 Old_age Always - 13144
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 098 098 000 Old_age Always - 2575
190 Airflow_Temperature_Cel 0x0022 052 042 045 Old_age Always In_the_past 48
194 Temperature_Celsius 0x0022 102 092 000 Old_age Always - 48
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 199 199 000 Old_age Always - 50
198 Offline_Uncorrectable 0x0010 199 199 000 Old_age Offline - 50
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 13
SMART Error Log Version: 1
ATA Error Count: 252 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 252 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 10 4f 2c 3f 40 Error: UNC at LBA = 0x003f2c4f = 4140111
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 08 88 48 2c 3f 07 08 00:27:17.679 READ FPDMA QUEUED
ef 10 02 00 00 00 00 00 00:27:17.675 SET FEATURES [Enable SATA feature]
ec 00 00 00 00 00 00 00 00:27:17.675 IDENTIFY DEVICE
ef 03 45 00 00 00 00 00 00:27:17.675 SET FEATURES [Set transfer mode]
ef 10 02 00 00 00 00 00 00:27:17.675 SET FEATURES [Enable SATA feature]
Error 251 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 80 4f 2c 3f 40 Error: UNC at LBA = 0x003f2c4f = 4140111
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 08 08 48 2c 3f 07 08 00:27:15.710 READ FPDMA QUEUED
60 08 00 40 2c 3f 07 08 00:27:15.710 READ FPDMA QUEUED
60 08 f0 38 2c 3f 07 08 00:27:15.710 READ FPDMA QUEUED
60 08 e8 30 2c 3f 07 08 00:27:15.710 READ FPDMA QUEUED
60 08 e0 28 2c 3f 07 08 00:27:15.710 READ FPDMA QUEUED
Error 250 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 4f 2c 3f 40 Error: UNC at LBA = 0x003f2c4f = 4140111
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 78 60 2b 3f 07 08 00:27:13.677 READ FPDMA QUEUED
60 00 70 60 2a 3f 07 08 00:27:13.675 READ FPDMA QUEUED
60 00 68 60 29 3f 07 08 00:27:13.673 READ FPDMA QUEUED
60 00 60 60 28 3f 07 08 00:27:13.671 READ FPDMA QUEUED
60 00 58 60 27 3f 07 08 00:27:13.668 READ FPDMA QUEUED
Error 249 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
When the command that caused the error occurred, the device was doing SMART Offline or Self-test.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 af 87 94 45 Error: UNC at LBA = 0x059487af = 93620143
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 12 ae 87 94 05 00 00:10:36.582 READ DMA
c8 00 2e 80 87 94 05 00 00:10:36.582 READ DMA
c8 00 11 6f 87 94 05 00 00:10:36.581 READ DMA
c8 00 2f 40 87 94 05 00 00:10:36.581 READ DMA
c8 00 10 30 87 94 05 00 00:10:36.581 READ DMA
Error 248 occurred at disk power-on lifetime: 13142 hours (547 days + 14 hours)
When the command that caused the error occurred, the device was doing SMART Offline or Self-test.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 af 87 94 45 Error: UNC at LBA = 0x059487af = 93620143
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 12 ae 87 94 05 00 00:00:44.465 READ DMA
c8 00 2e 80 87 94 05 00 00:00:44.465 READ DMA
c8 00 11 6f 87 94 05 00 00:00:44.464 READ DMA
c8 00 2f 40 87 94 05 00 00:00:44.464 READ DMA
c8 00 10 30 87 94 05 00 00:00:44.463 READ DMA
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.