La réponse actuellement acceptée fait le travail mais donne une sortie plus grande en taille. y souffre d'une perte de qualité.
La méthode dans la réponse donnée aquí permet d'obtenir une sortie dont la taille est comparable à celle de l'entrée et qui ne souffre d'aucune perte de qualité.
TLDR - Utilisation pdfimages
: pdfimages -j input.pdf output
Je cite la réponse du lien :
Ce que vous entendez par "perte de qualité" n'est pas clair. Cela peut signifier beaucoup de choses différentes. Pourriez-vous poster quelques échantillons pour illustrer votre propos ? Vous pourriez peut-être découper la même section dans la version de mauvaise qualité et dans la version de bonne qualité (en PNG pour éviter toute perte de qualité supplémentaire). (au format PNG pour éviter toute perte de qualité supplémentaire).
Vous devez peut-être utiliser -density
pour effectuer la conversion à un niveau plus élevé dpi :
convert -density 300 file.pdf page_%04d.jpg
(Vous pouvez ajouter -units PixelsPerInch
o -units PixelsPerCentimeter
si nécessaire. Ma copie est réglée par défaut sur ppi).
Mise à jour : Comme vous l'avez souligné, gscan2pdf
(de la manière dont vous l'utilisez) n'est qu'un habillage de la fonction pdfimages
(de poppler ). pdfimages
ne fait pas la même chose que convert
fait quand on lui donne un PDF comme entrée.
convert
prend le PDF, le restitue à une certaine résolution, et utilise le bitmap résultant comme image source.
pdfimages
recherche dans le PDF les images bitmap incorporées et exporte chacune d'entre elles vers un fichier. Il ignore simplement tout texte ou toute commande de dessin de dessin vectoriel dans le PDF.
Par conséquent, si ce que vous avez est un PDF qui est juste un emballage autour d'une série de bitmaps, pdfimages
fera un bien meilleur travail d'extraction de parce que vous obtiendrez les données brutes dans leur taille d'origine. Vous voulez probablement aussi utiliser le -j
option pour pdfimages
car un PDF peut contenir des données JPEG brutes. Par défaut, pdfimages
convertit tout au format PNM, et la conversion JPEG > PPM > JPEG est un processus avec pertes. perte.
Alors, essayez
pdfimages -j file.pdf page
Il se peut que vous deviez ou non faire suivre cela d'un convert
à .jpg
étape (en fonction du format bitmap utilisé par le PDF).
J'ai essayé cette commande sur un PDF que j'avais réalisé moi-même à partir d'une séquence d'images JPEG. Les JPEGs extraits étaient identiques, octet par octet, aux les images sources. On ne peut pas obtenir une meilleure qualité que cela.
0 votes
Apparemment, c'est également possible avec Inkscape : stackoverflow.com/a/15484727/32453
2 votes
Je n'ai pas 10 représentants pour poster une réponse, alors voici une autre solution, utilisez MuPDF.
mutool convert -o file.png file.pdf
2 votes
Sur bash :
pdftocairo file.pdf -png
0 votes
PDFBox le fait aussi très bien. pdfbox.apache.org
0 votes
Vous pouvez utiliser convertirpdftojpg.net qui est un convertisseur sûr et rapide de PDF en JPG