8 votes

Comment convertir une page web en PDF ?

Il existe de nombreuses façons de convertir une page web en PDF (services en ligne, bookmarklets, solutions d'impression en PDF, etc...).

Mais aucune d'entre elles ne produit un PDF consultable. Il semble qu'elles convertissent toutes le HTML en une image gigantesque. Existe-t-il un moyen de convertir une page Web en un PDF consultable ?

7voto

AngryHacker Points 17063

J'ai trouvé wkhtmltopdf qui semble faire l'affaire. C'est une ligne de commande, donc il y a un peu de courbe d'apprentissage, mais pas trop mauvais.

Concrètement, pour convertir une page web, ouvrez une fenêtre de commande dans le répertoire où se trouve wkhtmltopdf a été installé et exécutez ce qui suit :

wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf

L'application dispose d'une quantité ridicule d'options destinées à modifier le résultat selon les besoins, mais les valeurs par défaut donnent un assez bon résultat.

6voto

atroon Points 2566

Rédacteur CutePDF utilise GhostScript pour le traitement du texte, puis ps2pdf pour créer des PDF consultables à partir de pages Web. Bien entendu, cela ne fonctionnera pas si le texte de la page est une image au départ.

3voto

user79032 Points 4002

Quel est le problème des solutions d'impression en PDF ? J'ai deux imprimantes virtuelles installées dans mon système : Créateur de PDF et Virtual Printer d'Adobe Acrobat X. Les deux fonctionnent bien. Je peux facilement rechercher du texte dans les PDF générés, à condition que mon lecteur de PDF dispose de fonctions de reconnaissance optique de caractères (ce qui est courant de nos jours).
Si vous envisagez de créer quelque chose comme un texte ou un document Word, vous ne pouvez pas. Il s'agit d'une limitation du format PDF ou de la façon dont le format PDF fonctionne. Grâce à cela, nous pouvons intégrer des polices, etc. dans ce format sans aucune dépendance pour le rendre universel.
Et, je ne pense pas wkhtmltopdf peut générer un fichier PDF dans lequel le texte peut être recherché sans utiliser la technologie OCR (car cela violerait la spécification PDF).

1voto

Jim DeLaHunt Points 255

J'utilise Adobe Acrobat 8 Professional (la version actuelle est Adobe Acrobat X ). Il dispose d'une option de menu File... Create PDF... From Web Page... qui me demande une URL, puis télécharge la page à l'URL sous forme de fichier PDF, avec du texte consultable. Il convertit également les pages liées à cette page, de manière récursive. Vous pouvez vous retrouver avec de nombreuses pages HTML dans un fichier PDF multi-pages, avec des liens inter-pages préservés.

Pour certaines pages web, Acrobat Create PDF se trompe dans le formatage. Dans ce cas, je me rabats sur le Adobe PDF 8.0 pilote d'imprimante qu'Acrobat 8 Professional a installé sur mon système. Il est très efficace pour me donner un équivalent PDF de la page web que je consulte, avec un texte interrogeable.

Adobe Acrobat 8 Professional n'est pas un logiciel gratuit. C'est un logiciel propriétaire payant. Cependant, il mérite, à mon avis, d'avoir sa place dans l'ordinateur de chaque travailleur intellectuel, au même titre que Microsoft Office. Et, vous n'avez pas précisé que vous insistiez sur une gratuit logiciel permettant de convertir une page Web en PDF consultable.

0voto

Joshua Nozzi Points 38718

Il s'agit d'un bon outil qui convertit les pages Web en PDF consultables : http://kitpdf.com/web_to_pdf/ . Essayez-le et voyez s'il répond à vos besoins.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X