50 votes

Comment copier du texte à partir d'un PDF sans perdre le formatage ?

Lorsque je copie du texte d'un fichier PDF dans un éditeur de texte, il finit par s'abîmer de diverses manières. Le formatage, comme le gras et l'italique, est perdu ; les sauts de ligne souples dans un paragraphe sont convertis en sauts de ligne durs ; les tirets qui séparent un mot sur deux lignes sont conservés même s'ils ne devraient pas l'être ; et les guillemets simples et doubles sont remplacés par des signes " ".

Idéalement, j'aimerais pouvoir copier du texte à partir d'un PDF et que le formatage soit converti en codes HTML, que les "guillemets intelligents" soient convertis en " et ', et que les sauts de ligne soient effectués correctement. Existe-t-il un moyen de faire cela ?

0voto

Stoatly Points 1

Foxit permet de basculer entre l'affichage du fichier original en tant que PDF normal ou en tant que texte en appuyant sur Ctrl + 6. (En jouant un peu avec le niveau de zoom du mode texte, il n'y a pas beaucoup de changement de position entre la lecture et la copie).

0voto

Murali Sastry Points 21

Vous pouvez copier le texte d'Adobe Reader dans MS Excel et le formater (tableau) comme vous le souhaitez, puis le copier-coller à partir d'Excel. Cette solution fonctionne très bien. Vous n'avez pas besoin d'acheter une copie professionnelle coûteuse d'Adobe.

0voto

J'essayais de sauvegarder le texte et le format d'un pdf qui était organisé en tableau. Dans Acrobat Professional, je me suis rendu compte qu'il existait une option "Enregistrer sous" qui permettait d'enregistrer un document Excel. Cela a bien fonctionné pour mes besoins. J'ai également remarqué qu'il existait une option "Enregistrer sous un document Word". Je ne l'ai cependant pas essayée.

0voto

sky-light Points 133

J'ai trouvé cela très utile ( Supprimer les sauts de ligne ):

Voici une astuce utile pour résoudre rapidement ce problème sans avoir à supprimer manuellement tous les retours à la ligne. En fait, cette astuce consiste à remplacer automatiquement tous les retours à la ligne indésirables par un seul espace, de sorte que tout le texte soit regroupé en un seul paragraphe :

1- copiez le texte que vous souhaitez dans le PDF.

2- coller dans un nouveau document Word.

3- cliquez sur "éditer" puis sur "remplacer"

4- assurez-vous d'être dans le champ "trouver quoi".

5- cliquez sur "plus" puis sur "spécial"

6- sélectionner "marque de paragraphe" (en haut de la liste)

7- cliquez dans le champ "remplacer par".

8- appuyer une fois sur la barre d'espacement

9- cliquez sur "remplacer tout"

10- cliquez sur "ok" puis fermez la boîte "rechercher et remplacer".

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X