Bonsoir à tous,
Après un week-end de galère je viens vous exposer mon problème. Depuis l’été dernier je gère sur un serveur la transformation automatique lors de l’upload de fichiers (.doc, .ppt, etc) en pdf. J’utilise pour cela cups-pdf avec OpenOffice.org et les tutoriaux que j’ai pu trouver sur internet, cela marche assez bien sauf pour de gros fichiers ppt.
Sur mon nouveau serveur j’ai essayé de refaire la même config, mais impossible d’imprimer des pdf dont le texte est bien “reconnu” : je veux dire par là qu’il peut être référencé, extrait par pdftotext ou bien simplement copié/collé. Lorsque j’ouvre un document pdf créé avec cups-pdf, il est lisible par un humain et je peux copier des portions de textes mais le texte collé est illisible, constitué de caractères étranges (voir document en PJ).
Un test d’impression de cups seul me donne un fichier pdf tout à fait normal. Le problème semble venir, selon mes recherches, de fontes mal “embeddés” dans le fichier pdf (réglages de ghostscript ou ps2pdf ?), ou bien de la non utilisation de fontes Postscript. J’ai essayé pas mal de filtres différents, le lancement de ghostscript avec l’argument EmbedAllFonts=true, l’installation de nouvelles polices, etc.
Je ne crois pas qu’elle soit en cause, mais j’utilise la commande suivante pour la transformation :
Mon cupsd.conf est celui de base, je peux vous fournir les fichiers de configuration de cups ou cups-pdf si besoin. Je crois qu’un des éléments principal qui me manque est comment obliger cups-pdf (et/ou ghostscript, ps2pdf and co) à utiliser des fontes Postscript ?.
Merci d’avance de votre aide, et bonne semaine !
Edit : Un autre utilisateur rencontre un problème similaire et pense à un problème d’encodage des fontes : http://ubuntuforums.org/showthread.php?t=1356681
Edit 2 : Voici le résultat de la commande pdffonts sur le fichier mal encodé puis correctement encodé (ancien serveur) :
> pdffonts /root/PDF/test-bad.pdf
name type emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
CDAYLH+Arial-BoldMTFID46HGSet1 TrueType yes yes no 8 0
LNZGOT+ArialMTFID15HGSet1 TrueType yes yes no 10 0
QUYNIS+TimesNewRomanPSMTFID61HGSet1 TrueType yes yes no 17 0
> pdffonts /root/PDF/test-good.pdf
name type emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
CDAYLH+NimbusSanL-Bold Type 1C yes yes no 8 0
LNZGOT+NimbusSanL-Regu Type 1C yes yes no 10 0
QUYNIS+NimbusRomNo9L-Regu Type 1C yes yes no 17 0
test-37.pdf (49.4 KB)
test-36.pdf (77.5 KB)