3 votes

Existe-t-il un moyen de faire du formatage de texte riche avec des regex ?

J'essaie d'éditer un grand texte du domaine public pour le publier. L'une des choses que je dois faire est de rendre le titre de chaque paragraphe en gras . Étant donné que l'intitulé commence toujours par une parenthèse ouverte et se termine par un point, il semble qu'une expression régulière pourrait accélérer les choses si je pouvais trouver un éditeur de texte riche qui la prenne en charge. Avez-vous des idées ?

PS Je travaille sur linux maintenant, donc les logiciels linux seraient préférés.


Mise à jour : à la demande de Rob, je publie un extrait du texte. C'est de l'hébreu, mais je peux mettre du lorum ipset si vous le souhaitez.

. () . () : [ ] ( ) : :

Notez que toutes les parenthèses ne sont pas des titres de paragraphe. Seules celles qui sont suivies d'une chaîne de caractères se terminant par un point, et non par deux points.

1voto

m4573r Points 5441

Il existe un moyen... Vous devez d'abord appliquer "gras" à certains mots de votre texte. Ensuite, vous pouvez ouvrir votre .rtf avec un éditeur non riche, comme le bloc-notes (ou emacs), et voir le "code" derrière votre document. Il est tout à fait lisible par l'homme. Si vous recherchez la chaîne que vous venez de mettre en gras, vous trouverez comment mettre en gras n'importe quelle partie de votre texte. Malheureusement, je ne peux pas vraiment vous dire ce que c'est (sauf qu'il s'agit de \b ), car j'ai remarqué que le format change selon que vous avez créé votre document avec word ou wordpad, ou tout autre éditeur je suppose, donc la seule façon d'être sûr serait que vous en donniez un échantillon (de préférence avec du texte en gras et du texte sans gras).

La création des regex de recherche et de remplacement devrait alors être facile.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X