1 votes

Lire un fichier MS Word (doc) page par page

Existe-t-il un moyen de faire en sorte que wvWare (ou éventuellement un autre outil en ligne de commande, ou une bibliothèque Python) lise un fichier doc page par page ? Je ne trouve rien dans le manuel de wvWare, ni dans Abiword, Antiword ou catdoc.

1voto

Une façon horrible de le faire serait de rechercher les ^L dans le document original et de trouver où ils se trouvent dans le texte (les documents Word non docx sont principalement du texte brut : J'utilise parfois la fonction strings pour lire le contenu).

^L est control-L, code de caractère 12 et parfois appelé "form feed". Si vous regardez un document Word brut dans emacs (ou tout autre éditeur qui affiche les codes de contrôle), vous verrez un de ces caractères à la fin de chaque page.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X