Je suis sûr que c'est un problème d'encodage, mais je n'arrive pas à le résoudre.
J'ai exporté une feuille de calcul Excel en CSV UTF-8. Cela a produit un fichier CSV encodé en UTF-8-BOM. En ouvrant ce fichier dans Notepad++, la plupart des caractères étaient rendus correctement - y compris les caractères non ANSI comme ø
. Cependant, un trait d'union ( ) s'affiche en .
Je pense que le caractère est U+2010 HYPHEN
.
Si j'ouvre le fichier dans Notepad, le trait d'union s'affiche correctement. Il s'affiche également correctement si j'utilise Vim pour lire le fichier ou cat
pour l'afficher dans le terminal.
Enfin, le dump octal du fichier révèle les octets hexadécimaux e2 80 90
, qui est l'encodage UTF-8 du caractère Unicode U+2010 - HYPHEN
.
Alors pourquoi Notepad++ affiche-t-il ce caractère en ?