Regexxer planté sur fichier non utf8


#1

Bonjour,

Nouvel arrivé en provenance de xubuntu 14.04, j’utilisais regexxer avec bonheur. Installé sur ma debian 9 j’ai un message d’erreur à la simple demande de visualisation d’un fichier :

(regexxer:8881): Gtk-CRITICAL **: gtk_text_buffer_emit_insert: assertion 'g_utf8_validate (text, len, NULL)' failed

J’ai cherché sur le net, c’est parce que le fichier n’est pas UTF8. En fait on peut enregistrer un fichier en windows1252, s’il ne contient pas de caractère accentué, ça lui pose pas de pb, mais dès qu’il y a un caractère accentué. L’erreur existe également en Xubuntu18.04.1, donc pas de repli possible.
J’ai pas trouvé de soluce, de contournement. Je suis preneur de soluce, de contournement, d’alternative à regexxer attendu que c’est un GUI et que bon coté ligne de commande j’ai sous le coude :

# Trouver des fichiers selon un masque, chercher et remplacer une chaîne de caractères
find . -name "*.php" -print | xargs sed -i 's/georges@6ma.fr/michel@6ma.fr/g'

Merci d’avance
@+
Mob


#2
que j'écrirais plutôt
find . -name "*.php" -print0 | xargs -0  sed -i 's/georges@6ma.fr/michel@6ma.fr/g'

</made pinaillage>

Pourrait-on avoir le résultat de la commande file sur le fichier qui provoque cette erreur. Si effectivement la commande file indique un encodage non UTF8, vous pouvez envisager de faire une rapport de bug sur le paquet regexxeren expliquant tout cela et en suggérant de transmettre au développeur amont car ceci arrive aussi avec xubuntu.
Parmi les 83 bibliothèques utilisées et chargées par regexxer on trouve libgtksourceviewmm-3.0.so.0 du paquet libgtksourceviewmm-3.0-0v5 qui lui-même dépend de libgtksourceview-3.0-1. Vous pouvez l’indiquer dans votre rapport de bug.

Vous avez touché du doigt la problématique des logiciels GUI vis-à-vis d’une bonne vieille combinaison de commandes en ligne. Le développeur n’a déclaré que 13 dépendances, dont libgtksourceviewmm-3.0-0v5 .
Si vous faites

apt-cache depends findutils
apt-cache depends sed

vous comprendrez immédiatement pourquoi il y a moins de bug dans les outils en ligne de commande.

Cordialement,
Regards,
Mit freundlichen Grüßen,
مع تحياتي الخالصة


F. Petitjean
Ingénieur civil du Génie Maritime.

« L’arbre tombe toujours du côté où il penche. »
Proverbe français

« Un ordinateur c’est comme un frigo : on le branche et ça marche. »
Laurent Serano Directeur informatique, réunion Délégués du Personnel 2010


#3

Bonjour

$ file CHLOROA_Data_00_Importation.r 
CHLOROA_Data_00_Importation.r: ISO-8859 text

Mais comme je l’ai écrit : je fais avec gedit un fichier, je mets “coucou” dedans et je l’enregistre en windows-1252 => pas de pb. Je reprends ce fichier je mets des caractères accentués et je le sauvegarde toujours en windows-1252 => pb. Donc je pense qu’à l’ouverture il ne se pose pas la question de l’encodage, seulement à la lecture.
Merci
@+
Mob’.


#4

J’ai trouvé une rustine : FAR, http://findandreplace.sourceforge.net/
Moins bien que regexxer.

Comment faire remonter le pb au programmeurs de regexxer ou à debian ?
EDIT :
OK j’y suis
https://www.debian.org/Bugs/Reporting.fr.html