Je dispose d'un certain nombre de journaux de recherche que je souhaite comparer à certains fichiers de dictionnaires. Une fois que j'ai traité les journaux de recherche pour filtrer certaines entrées et regrouper tous les termes de recherche dans des lignes distinctes, quel est le moyen le plus simple de déterminer le nombre de termes de recherche présents dans le fichier du dictionnaire ?
Réponse
Trop de publicités?Je vais mettre de côté la préparation de l'entrée et supposer ces entrées :
Journal de recherche - un seul terme recherché en ligne, sans répétition, quelque chose comme ça :
car
tramway
bus
train
skate
rollerblade
bike
Dictionnaire - un mot du dictionnaire en ligne, sans répétition, quelque chose comme ça :
car
tramway
bus
train
bike
aeroplane
submarine
Et si vous voulez sélectionner des lignes du journal de recherche, qui sont dans le dictionnaire, vous pouvez le faire comme ceci :
grep -f dictionary search_log
Il reviendra
car
tramway
bus
train
bike
Et si vous voulez un certain nombre de ces mots, il vous suffit de l'envoyer à wc -l
grep -f dictionary search_log | wc -l
Le résultat sera de 5.