Bien qu'Inkscape soit un moyen génial de le faire, pour ceux qui ne disposent pas de X11, vous pouvez également extraire des pages individuelles d'un PDF au format SVG à l'aide de la commande poppler-utils à la ligne de commande. Par exemple, pour extraire uniquement la page 30 :
$ pdftocairo -f 30 -l 30 -svg somehugemanual.pdf myextractedpage.svg
Vous pouvez ensuite utiliser votre éditeur vectoriel préféré (le mien est Inkscape) pour isoler l'image du texte.
Sinon, si vous êtes un utilisateur invétéré de la ligne de commande, vous pouvez extraire en EPS (encapsulated postscript) et utiliser sed
pour cacher tout le texte (qui se trouve être entre les lignes BT et ET pour pdftocairo). Voici comment procéder :
$ pdftocairo -f 30 -l 30 -eps manual.pdf - | sed '/^BT$/,/^ET$/ d' > myimage.eps
Et si vous voulez vraiment éviter d'utiliser X11, vous pouvez même rétrécir la boîte englobante de l'image à partir de la ligne de commande en utilisant la fonction de Ghostscript eps2eps
commandement :
$ eps2eps myimage.eps myimage-bb.eps
Je l'ai testé et cela fonctionne très bien. Cependant, personnellement, je trouve plus facile d'utiliser Inkscape.