Ce que vous avez fait est utile comme exercice. Sinon, exporter des images d'un PDF comme celui-ci et créer un nouveau PDF à partir de celles-ci n'a aucun sens.
L'utilisation de l'espace du document original est :
Description Bytes Percentage
Images 351,829 97.60 %
Content Streams 2,742 0.76 %
Document Overhead 5,916 1.64 %
Total 360,478 100 %
L'espace utilisé par votre document est :
Description Bytes Percentage
Images 1,329,944 98.87 %
Bookmarks 21 0.00 %
Content Streams 1,675 0.12 %
Structure info 60 0.00 %
Document Overhead 13,389 1.00 %
Total 1,345,089 100 %
Le document original n'est pas créé avec Acro, mais iText ce qui explique l'absence d'informations sur la structure.
Sous Traitement des documents, vous disposez d'un outil distinct "Optimiser le PDF numérisé". J'ai suivi votre flux de travail et exécuté l'optimiseur sur mon PDF nouvellement créé, et la taille du fichier résultant est de 328KB. Cependant, la qualité est nettement inférieure à celle du document original.
C'est normal, car j'ai tout fait avec les paramètres par défaut. Cela signifie que l'exportation de l'image a déjà été faite en jpg qui, de toute façon, est plus grand qu'un PDF. Je l'ai testé en extrayant chaque page dans un seul PDF - par exemple, l'image jpg exportée de la page 1 fait 22KB alors qu'exportée en PDF elle ne fait que 9KB. En optimisant davantage les images dans le nouveau document, la qualité de l'image se dégrade encore plus. C'est tout simplement inévitable avec les formats d'image bitmap tels que jpg.
L'utilisation de la taille ci-dessus montre qu'Acrobat a clairement exporté les images avec la meilleure qualité possible. C'est logique, car lorsque vous faites cela, vous voulez les sortir avec une perte minimale de données d'image.
Une option pourrait être l'OCR du fichier, qui convertit les images en texte, et les fichiers textuels sont beaucoup plus légers que les fichiers d'images. Acro Pro contient un outil OCR, mais je ne peux pas le tester car je n'ai pas l'arabe à disposition.
EDIT : Le pack de langue étendu ne s'applique qu'à Adobe Reader. Après quelques recherches, il semble qu'Acrobat ne supporte pas l'OCR arabe. Voir ce qui suit Discussion sur le forum Adobe .
La numérisation en PDF, puis l'optimisation, est toujours un compromis entre la taille et la qualité. Il vous suffit de tester différents paramètres (à la fois le scan original et l'optimisation) pour trouver un compromis satisfaisant.
Les instructions pour l'optimisation des PDF se trouvent dans l'aide d'Acrobat. L'aide est disponible en ligne pour les deux Acrobat X y Acrobat XI