Recherche plein texte

Bonjour à tous,

j’ai récupéré il y a peu une grande quantité de fichiers (plusieurs milliers…) issus du backup de l’ordinateur (un mac) de ma chère et tendre. Certains de ces fichiers sont précieux et je souhaiterais les retrouver avec une recherche plein texte.

Je me suis dirigé vers grep, mais les résultats ne sont pas satisfaisants, dans le sens où la commande ne trouve pas toutes les occurrences du motif (je l’ai explicitement testé avec un motif connu dans un fichier connu).
J’ai fait la recherche avec grep -lri dans des fichiers doc et pdf.

Je souhaite donc savoir si l’un(e) d’entre vous peut avoir des éléments de réponse aux questions suivantes :

  • qu’est ce qui peut bien faire de grep passe à côté de certaines occurrences ?
  • existe-t-il des méthodes fiables de recherches plein texte sur debian ?

Merci à tous.

Bonjour,

Par recherche plein texte tu entends rechercher des mots dans des fichiers texte? Si oui ça risque de coincer dans du pdf car il peut y avoir des scans, donc pas de texte mais une image.

Si c’est juste les noms des fichiers pour les identifier tu peux essayer ça ça doir marcher je pense: “ls -l /dossier/des/fichiers/*.doc > /home/$USER/listing.txt”, tu ouvres listing.txt dans un éditeur et fais une recherche dans ce fichier sur les termes que tu veux.

En espérant pouvoir t’aider et ne pas paraître trop noob :wink:

Illustration image de texte, captcha :

grep ne saurait rechercher des motifs de texte au sein d’images.

Autre piste : comparer encodage sous MacOS et linux (UTF-8, iso 8859-1 …).

Salut,

Moi, fainéant, j’aurais utilisé Midnight Commander (AKA mc) :slightly_smiling: