Si j'ai un fichier texte, je peux le trier par commande sort input.txt output.txt
. Puis-je d'une manière ou d'une autre supprimer également les lignes dupliquées du fichier texte. (Idéalement, j'aimerais une solution qui puisse être réalisée dans un fichier batch sous Windows).
Cela revient à demander comment supprimer les doublons d'un fichier texte. (La raison pour laquelle j'ai également mentionné le tri est que je suppose qu'il est plus facile de supprimer les doublons si nous savons que le fichier est trié et qu'ils ne peuvent apparaître que sur des lignes consécutives. Je pense donc qu'il est plus probable qu'il existe un moyen de supprimer les doublons en même temps que le tri. (Et pour l'usage que je veux en faire, il importe peu que l'ordre des lignes dans le fichier soit modifié, tant que les lignes répétées sont supprimées).
Par exemple, à partir d'un fichier ressemblant à celui-ci :
100
100
100
100
101
101
102
Je souhaite obtenir
100
101
102