Lire le codage des caractères avec sed

Question

Lire le codage des caractères avec sed

Demandé el 18 de Avril, 2011: Quand la question a-t-elle été
2576 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'essaie d'écrire un script bash script pour convertir tous les caractères spéciaux d'un fichier (é, ü, ã, etc) au format latex (\'e, \"u, \~a, etc). Habituellement, ce genre de choses est très facile à faire avec sed mais j'ai du mal à faire en sorte que sed reconnaisse les caractères spéciaux. Comment puis-je indiquer à la commande de lire le fichier en utilisant l'encodage iso, ou UTF-8 ?

Si ce n'est pas possible, existe-t-il un moyen de faire comprendre à sed les caractères spéciaux ?

Demandé el 18 de Avril, 2011 par simonlord

Answer 1

1 Réponses

Answer 2

2voto

enzotib Points 86709

Cela peut être aussi simple que

iconv --from-code $enc input-file |
    sed 's/é/\\'\''e/;s/ü/\\"e/;s/ã/\\~a/' |
    iconv -to-code $enc >converted-input-file

où la variable enc contiennent l'encodage du fichier d'entrée, une des chaînes obtenues à partir de iconv -l .

Répondu el 18 de Avril, 2011 par enzotib (86709 Points )

Lire le codage des caractères avec sed

Réponse

Questions en vedette

Top Tags

SistemesEz.com

Powered by:

Lire le codage des caractères avec sed

Réponse

Questions en vedette

Top Tags

Dans notre réseau

SistemesEz.com

Powered by: