1 votes

réduire la taille du fichier PDF d'images numérisées

J'ai téléchargé ce fichier PDF à partir d'un site web. Il fait 350 Ko et comporte 20 pages. Toutes les pages sont des images scannées. J'ai extrait les images à l'aide d'Adobe Acrobat Pro, dont la taille collective est de 1,32 Mo (affichage > outils > traitement des documents > exportation de toutes les images). Je les ai converties en un seul fichier PDF (1,28 Mo). Comment puis-je combiner ces images dans un fichier PDF de taille réduite ?

Dois-je réduire la taille des images numérisées à l'aide d'un logiciel ? Comment puis-je le faire pour obtenir la qualité de ce fichier PDF de 350 Ko ?

En fait, je numérise régulièrement certains de mes documents pour les convertir en PDF et je veux qu'ils soient aussi petits que possible.

Ce que j'ai essayé :

  • dans Adobe Acrobat Pro : fichier > enregistrer sous un autre format > PDF réduit
  • dans Adobe Acrobat Pro : fichier > impression > case à cocher "imprimer en niveaux de gris" cochée

mise à jour : liens supprimés pour cause de violation du droit d'auteur !

1voto

Peregrino69 Points 2641

Ce que vous avez fait est utile comme exercice. Sinon, exporter des images d'un PDF comme celui-ci et créer un nouveau PDF à partir de celles-ci n'a aucun sens.

L'utilisation de l'espace du document original est :

Description        Bytes      Percentage
Images             351,829    97.60 %
Content Streams    2,742      0.76 %
Document Overhead  5,916      1.64 %
Total              360,478    100 %

L'espace utilisé par votre document est :

Description        Bytes      Percentage
Images             1,329,944  98.87 %
Bookmarks          21         0.00 %
Content Streams    1,675      0.12 %
Structure info     60         0.00 %
Document Overhead  13,389     1.00 %
Total              1,345,089  100 % 

Le document original n'est pas créé avec Acro, mais iText ce qui explique l'absence d'informations sur la structure.

Sous Traitement des documents, vous disposez d'un outil distinct "Optimiser le PDF numérisé". J'ai suivi votre flux de travail et exécuté l'optimiseur sur mon PDF nouvellement créé, et la taille du fichier résultant est de 328KB. Cependant, la qualité est nettement inférieure à celle du document original.

C'est normal, car j'ai tout fait avec les paramètres par défaut. Cela signifie que l'exportation de l'image a déjà été faite en jpg qui, de toute façon, est plus grand qu'un PDF. Je l'ai testé en extrayant chaque page dans un seul PDF - par exemple, l'image jpg exportée de la page 1 fait 22KB alors qu'exportée en PDF elle ne fait que 9KB. En optimisant davantage les images dans le nouveau document, la qualité de l'image se dégrade encore plus. C'est tout simplement inévitable avec les formats d'image bitmap tels que jpg.

L'utilisation de la taille ci-dessus montre qu'Acrobat a clairement exporté les images avec la meilleure qualité possible. C'est logique, car lorsque vous faites cela, vous voulez les sortir avec une perte minimale de données d'image.

Une option pourrait être l'OCR du fichier, qui convertit les images en texte, et les fichiers textuels sont beaucoup plus légers que les fichiers d'images. Acro Pro contient un outil OCR, mais je ne peux pas le tester car je n'ai pas l'arabe à disposition.

EDIT : Le pack de langue étendu ne s'applique qu'à Adobe Reader. Après quelques recherches, il semble qu'Acrobat ne supporte pas l'OCR arabe. Voir ce qui suit Discussion sur le forum Adobe .

La numérisation en PDF, puis l'optimisation, est toujours un compromis entre la taille et la qualité. Il vous suffit de tester différents paramètres (à la fois le scan original et l'optimisation) pour trouver un compromis satisfaisant.

Les instructions pour l'optimisation des PDF se trouvent dans l'aide d'Acrobat. L'aide est disponible en ligne pour les deux Acrobat X y Acrobat XI

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X