Une autre option est ScanTailor . Ce programme est particulièrement bien adapté au traitement de plusieurs scans à la fois.
apt-get install scantailor
Il ne fonctionne malheureusement qu'avec des fichiers images, mais il est assez simple de convertir un PDF scanné en jpg. Voici un exemple que j'ai utilisé pour convertir tout un répertoire de PDF en jpg. Si un PDF a un format n pages, il fait n fichiers jpg.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
J'avais des captures d'écran prêtes à être partagées, mais je n'ai pas assez de rep pour les poster.
ScanTailor produit des sorties au format tif, de sorte que si vous souhaitez récupérer les fichiers au format PDF, vous pouvez l'utiliser pour créer un PDF pour chaque page.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Vous pouvez ensuite utiliser cette ligne de conduite ou une application telle que PDFShuffler pour fusionner tous les fichiers en un seul PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf