Lorsque je copie du texte d'un fichier PDF dans un éditeur de texte, il finit par s'abîmer de diverses manières. Le formatage, comme le gras et l'italique, est perdu ; les sauts de ligne souples dans un paragraphe sont convertis en sauts de ligne durs ; les tirets qui séparent un mot sur deux lignes sont conservés même s'ils ne devraient pas l'être ; et les guillemets simples et doubles sont remplacés par des signes " ".
Idéalement, j'aimerais pouvoir copier du texte à partir d'un PDF et que le formatage soit converti en codes HTML, que les "guillemets intelligents" soient convertis en " et ', et que les sauts de ligne soient effectués correctement. Existe-t-il un moyen de faire cela ?