Le fichier de cache des paquets est corrompu

On va augmenter un peu la dose:
sudo rm -rf /var/cache

hum, désolé mais je vais pas la tenter celle-là :confused: (trop de dossiers à reconstituer)

root@Debian:~# ls /var/cache
apparmor  apt               cracklib  debconf              flashplugin-nonfree  fonts  ldconfig  man         pm-utils    private
app-info  apt-xapian-index  cups      dictionaries-common  fontconfig           fwupd  lightdm   PackageKit  postgresql  samba
root@Debian:~#

C’est du cache à reconstruire après reboot et upgrade bullseye.
C’est vous qui voyez… / voir tentatives plus progressives, mais je ne vois pas pourquoi ça coince après spécifiquement tentative d’upgrade à bullseye.

Trop de boulot et pour tout dire je ne vois pas le lien avec une erreur apt et la destruction du cache postgresql (par exemple).

Sinon j’ai eu d’autres alertes du même genre :

Erreur du busistes de paquets… 0%

sur un apt purge

et ça (qui sent pas trop bon :smirk:)

root@Debian:~# mandb -t
Erreur du bus
root@Debian:~#

?? Je n’ai jamais rien eu à construire/reconstruire dans ce cache. Du cache est du cache.
Je n’insiste pas, mais dans des cas zarbis d’origine non identifiée, il faut parfois des solutions zarbies.

Y’a des paquets qui sont pas dans la distrib de base et j’ai des préférences à garder dans ma base de données

Certes, mais en général on les tente en dernier recours. En attendant je vais voir si on ne me propose pas d’autres idées. Mais merci pour tes propositions.

Je viens d’avoir ça sur un apt upgrade

E: Erreur de lecture - read (5: Erreur d'entrée/sortie)
W: Sources disagree on hashes for supposely identical version '3.66' of 'mime-support:amd64'.
W: Sources disagree on hashes for supposely identical version '3.69' of 'mailcap:amd64'.
W: Sources disagree on hashes for supposely identical version '4.0.0' of 'media-types:amd64'.
W: Sources disagree on hashes for supposely identical version '3.0.7.33374.ds4-2' of 'firebird3.0-common:amd64'.
W: Sources disagree on hashes for supposely identical version '3.0.7.33374.ds4-2' of 'firebird3.0-common-doc:amd64'.
W: Sources disagree on hashes for supposely identical version '20200910-1' of 'fonts-urw-base35:amd64'.
W: Sources disagree on hashes for supposely identical version '4.8.0-1' of 'libgtksourceview-4-common:amd64'.
W: Sources disagree on hashes for supposely identical version '3.36.1-1' of 'gnome-weather:amd64'.
W: Sources disagree on hashes for supposely identical version '3.24.24-4+deb11u2' of 'libgtk-3-common:amd64'.
W: Sources disagree on hashes for supposely identical version '4.10.0-1' of 'manpages-fr:amd64'.
W: Sources disagree on hashes for supposely identical version '2.0.0-1' of 'python3-dnspython:amd64'.
W: Sources disagree on hashes for supposely identical version '3.16.0-1' of 'python3-louis:amd64'.

Petit détail (ou pas) que j’ai oublié de préciser :
Je suis en console de récupération.

Je ne sais pas si ça joue mais dans le doute je précise ce point.
Initialement, c’est sur une mise à jour de grub que le problème a commencé. Du coup je n’ai plus accès au boot « normal »

Ça fait en effet beaucoup de ‹ petits › détails que tu oublies, un peu trop.

Super ! Donc ça veut dire que tu envisages d’autres solutions dans ce contexte ?

Je patiente…

Pas exactement le sens non. Je préfère avoir une vue d’ensemble dans un premier temps plutôt qu’après des "tiens au fait, javais oublié de dire " x 5.
Pas d’idée là. Il faut déjà trouver l’origine d’autres problèmes précédemment cumulés.

Bonjour

Ca aurait été bien de commencer par là avant d’aller parler d’un souci de cache…

Essaye déjà de réparer ton grub pour commencer:

update-grub

puis tu tentes de rebooter en mode normal

Oui j’ai essayé ça. J’ai même fait un apt install --reinstall grub-pc grub-common qui s’est bien passé.
Il a booté normalement quelques fois puis a recommencé à planter sur le boot normal.

En fait, j’ai beaucoup d’IRQ suite à I/O error mais je ne suis pas sûr que ce soit le disque qui ait des problèmes de surface.

Je dis ça parce que si je réessaie plusieurs fois un apt update ou apt install qui sort en erreur, il finit par passer (une sorte de brute-force en essayant de passer entre les IRQ).

J’en déduis que c’est peut-être un problème de bus ou soft du disque.

Je l’ai monté sur un autre PC (pas facile d’enlever un disque sur un Compad Presario SR2029).

Pour l’instant j’ai

root@kali:~# fsck -t vxfs -n /dev/sdb3
fsck from util-linux 2.31.1
e2fsck 1.44.1 (24-Mar-2018)
Warning: skipping journal recovery because doing a read-only filesystem check.
Debian: clean, 320280/4587520 files, 2810431/18318080 blocks
root@kali:~#

Sur la partition système. Donc rien d’anormal.

Quels tests non destructifs je pourrais faire pour vérifier correctement le disque ?

J’ai initié un test avec badblocs

root@kali:~# badblocks -nsv /dev/sdb
Checking for bad blocks in non-destructive read-write mode
From block 0 to 244198583
Checking for bad blocks (non-destructive read-write test)
Testing with random pattern: 673243% done, 0:33 elapsed. (0/0/0 errors)
673253% done, 0:35 elapsed. (1/0/0 errors)

  0.27% done, 4:55 elapsed. (16/0/0 errors)
badblocks: Input/output error during test data write, block 6955009
6955009 done, 53:19 elapsed. (16/0/0 errors)

6955072
  2.97% done, 55:30 elapsed. (19/0/61 errors)

Voilà ce que j’ai pour l’instant (j’ai tronqué le résultat qui donne les numéros de blocs pour une meilleure lisibilité)

C’est la première fois que j’utilise badblocs.

Mais qu’est-ce donc que cette erreur puisqu’il n’est pas censé écrire avec l’option -n ?

salut
quand je lis dossier de cache je pense plutot à /var/lib/dpkg/info/
quand je lis E: Erreur de lecture - read (5: Erreur d'entrée/sortie) je pense à
fsck -f -y -v /dev/sdb
et à smart
smartctl -t long /dev/sdb

Tiens ! Une nouvelle surprise (ça va faire plaisir à @Verner)… un filesystem « exotique »… des fois, il ne faut pas chercher plus loin (j’ai eu un souci avec un volume RAID 0 réalisé en btrfs au passage au kernel 6.0…)

Du coup, ça raconte quoi quand tu fais:

df -hT

(Je réalise seulement maintenant que pour une question à priori d’espace indisponible, tu n’as pas encore présenté un état de cette indisponibilité d’espace par rapport à ton partitionnement avec un df, ce qui permettrait d’y voir un peu plus clair)

Si, je l’ai dit dans le premier post

Que veux-tu dire par là ? C’est du Ext4.

Bon, sauf à discuter de la fiabilité de l’outil utilisé (badblocks) il semblerait que le problème soit matériel. J’ai arrêté le contrôle au bout de 9h :face_with_thermometer:

49188820done, 9:32:59 elapsed. (143/0/61 errors)
49188821done, 9:33:01 elapsed. (144/0/61 errors)
49188822done, 9:33:03 elapsed. (145/0/61 errors)
49188823done, 9:33:05 elapsed. (146/0/61 errors)
 20.15% done, 9:33:07 elapsed. (147/0/61 errors)

Avec déjà pas mal d’erreurs. Je vais passer sur un forum dédié matériel et vous tiendrai informés de mes avancées.

tu as essayé smart?
en gui : gsmartcontrol

Oui. En revanche le gui n’est pas le plus adapté, vu que je suis en console de récupération :confused:

Voilà le premier résultat que j’avais obtenu :

root@Debian:~# smartctl -a /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-18-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar SE Serial ATA
Device Model:     WDC WD2500JS-60NCB1
Serial Number:    WD-WCANK7476328
Firmware Version: 10.02E02
User Capacity:    250 059 350 016 bytes [250 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA/ATAPI-7 (minor revision not indicated)
Local Time is:    Wed Dec 14 01:44:27 2022 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                ( 8280) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
 
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  96) minutes.
Conveyance self-test routine
recommended polling time:        (   6) minutes.
SCT capabilities:              (0x103f) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   200   200   051    Pre-fail  Always       -       73
  3 Spin_Up_Time            0x0003   218   188   021    Pre-fail  Always       -       4058
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2681
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   200   200   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   082   082   000    Old_age   Always       -       13144
 10 Spin_Retry_Count        0x0013   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   051    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   000    Old_age   Always       -       2575
190 Airflow_Temperature_Cel 0x0022   052   042   045    Old_age   Always   In_the_past 48
194 Temperature_Celsius     0x0022   102   092   000    Old_age   Always       -       48
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   199   199   000    Old_age   Always       -       50
198 Offline_Uncorrectable   0x0010   199   199   000    Old_age   Offline      -       50
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0009   200   200   051    Pre-fail  Offline      -       13

SMART Error Log Version: 1
ATA Error Count: 252 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
 
Error 252 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 10 4f 2c 3f 40  Error: UNC at LBA = 0x003f2c4f = 4140111

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 88 48 2c 3f 07 08      00:27:17.679  READ FPDMA QUEUED
  ef 10 02 00 00 00 00 00      00:27:17.675  SET FEATURES [Enable SATA feature]
  ec 00 00 00 00 00 00 00      00:27:17.675  IDENTIFY DEVICE
  ef 03 45 00 00 00 00 00      00:27:17.675  SET FEATURES [Set transfer mode]
  ef 10 02 00 00 00 00 00      00:27:17.675  SET FEATURES [Enable SATA feature]

Error 251 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 80 4f 2c 3f 40  Error: UNC at LBA = 0x003f2c4f = 4140111

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 08 48 2c 3f 07 08      00:27:15.710  READ FPDMA QUEUED
  60 08 00 40 2c 3f 07 08      00:27:15.710  READ FPDMA QUEUED
  60 08 f0 38 2c 3f 07 08      00:27:15.710  READ FPDMA QUEUED
  60 08 e8 30 2c 3f 07 08      00:27:15.710  READ FPDMA QUEUED
  60 08 e0 28 2c 3f 07 08      00:27:15.710  READ FPDMA QUEUED

Error 250 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 01 4f 2c 3f 40  Error: UNC at LBA = 0x003f2c4f = 4140111

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 78 60 2b 3f 07 08      00:27:13.677  READ FPDMA QUEUED
  60 00 70 60 2a 3f 07 08      00:27:13.675  READ FPDMA QUEUED
  60 00 68 60 29 3f 07 08      00:27:13.673  READ FPDMA QUEUED
  60 00 60 60 28 3f 07 08      00:27:13.671  READ FPDMA QUEUED
  60 00 58 60 27 3f 07 08      00:27:13.668  READ FPDMA QUEUED

Error 249 occurred at disk power-on lifetime: 13143 hours (547 days + 15 hours)
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 af 87 94 45  Error: UNC at LBA = 0x059487af = 93620143

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 12 ae 87 94 05 00      00:10:36.582  READ DMA
  c8 00 2e 80 87 94 05 00      00:10:36.582  READ DMA
  c8 00 11 6f 87 94 05 00      00:10:36.581  READ DMA
  c8 00 2f 40 87 94 05 00      00:10:36.581  READ DMA
  c8 00 10 30 87 94 05 00      00:10:36.581  READ DMA

Error 248 occurred at disk power-on lifetime: 13142 hours (547 days + 14 hours)
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 af 87 94 45  Error: UNC at LBA = 0x059487af = 93620143

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 12 ae 87 94 05 00      00:00:44.465  READ DMA
  c8 00 2e 80 87 94 05 00      00:00:44.465  READ DMA
  c8 00 11 6f 87 94 05 00      00:00:44.464  READ DMA
  c8 00 2f 40 87 94 05 00      00:00:44.464  READ DMA
  c8 00 10 30 87 94 05 00      00:00:44.463  READ DMA

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
 
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.