Les éléments répétables sont stockés dans un dictionnaire et un code est assigné en tant que substitut.
IL S'AGIT D'UNE SUR-SIMPLIFICATION
aaaaaaaaaaaaaaaaaaaaaaaa 0001
bbbbbbbbbbbbbbbbbbbbbbbb 0002
alsdjl;asjdfkl;asdfjkljj 0003
au lieu de toute la ligne, il met simplement le code à sa place. Plus le dictionnaire est grand, plus il peut gérer de codes. Normalement, lorsqu'un dictionnaire devient plein, il en commence un nouveau à la volée. Lorsqu'il en commence un nouveau, il est vide et de nouveaux codes sont assignés aux motifs détectés.
Généralement, plus il est grand, mieux c'est jusqu'à un certain point. Tout le dictionnaire est conservé en mémoire, donc vous avez besoin de plus de RAM que la taille du dictionnaire.
La taille du dictionnaire dépend de la compressibilité de vos données, du nombre de fichiers, de leur taille et de la taille totale.
Généralement, 32 Mo sont largement suffisants, mais si vous compressez de nombreux fichiers de plusieurs gigaoctets, alors un nombre beaucoup plus élevé peut être utilisé. Les dictionnaires plus grands rendent souvent le processus plus lent, mais le résultat est un fichier plus petit.