J'ai un processus qui doit faire beaucoup d'écritures sur le disque mais pas de lecture. Je peux soit écrire beaucoup de petits fichiers (~1 000 000 000 de fichiers, ce que je fais actuellement), soit écrire quelques gros fichiers.
Les petits fichiers font ~2Kb en moyenne mais comme j'ai une taille de bloc de 4096b, je perds environ la moitié de la capacité de mon disque.
Cependant, comme un grand nombre de threads doivent écrire en même temps, les gros fichiers ne seraient-ils pas un goulot d'étranglement puisque chaque thread devra ouvrir le fichier, écrire, puis le fermer ?
Pour résumer, ce qui est le mieux pour l'optimisation des E/S et de l'espace entre :
- Beaucoup de petits fichiers
- Quelques gros fichiers