Bonjour à tous,
j’ai installé tesseract et gscan2pdf sur ma machine Debian 8 + xfce.
Tesseract marche bien, mais j’e rencontre un problème avec les fichiers texte produits par gscan2pdf : à l’ouverture j’ai le message suivant : “le document n’est pas en UTF-8 valide”.
En jouant avec les encodages (les divers ISO) je parviens à afficher quelque-chose, mais ce ne sont pratiquement que des signes cabalistiques avec un seul mot par ligne. Bref pas utilisable.
J’ai cherché dans les paramètre de gscan2pdf : rien pour choisir son encodage.
Si quelqu’un avait des pistes, voire une solution…
Merci !