4 votes

Comment vérifier qu'une déduplication a bien eu lieu ?

Microsoft Windows Server 2012 et les versions ultérieures offrent un service de déduplication qui analyse périodiquement les fichiers, trouve les morceaux identiques et supprime les copies excessives pour gagner de l'espace.

Pour l'utilisateur qui parcourt les fichiers, ils doivent tous se ressembler.

Mon problème est que j'ai un logiciel qui lit ces fichiers et échoue lorsqu'il lit un fichier traité par déduplication. J'ai mis en place un serveur Windows avec un service de déduplication pour développer et tester une solution à ce problème, mais je ne suis pas sûr que mes fichiers de test soient dédupliqués et que ma solution fonctionne réellement.

Les métadonnées du fichier indiquent-elles que la déduplication a eu lieu ? Ou peut-être que le service de déduplication a une base de données accessible avec les fichiers augmentés ?

J'ai déjà essayé ce qui est évident : créer un fichier, copier ce fichier dans le même dossier, puis afficher les propriétés du dossier - mais la taille du dossier correspond aux deux fichiers, alors que je m'attendais à ce qu'elle corresponde à la taille d'un seul fichier.

3voto

BaronSamedi1958 Points 12444

La déduplication est implémentée comme un pilote de filtre au-dessus de NTFS (et maintenant de ReFS) et devrait fonctionner de manière transparente. Vous pouvez toujours la désactiver pour certains jeux de fichiers particuliers si elle pose des problèmes.

Pour obtenir le statut de déduplication, utilisez la cmdlet Get-DedupeStatus. Voir :

https://docs.microsoft.com/en-us/powershell/module/deduplication/get-dedupstatus

Il y a un moyen de visualiser ce qu'il y a là. Regardez :

https://www.foldersizes.com/features/windowsdeduplicationdiskspace

Vous pouvez exclure des fichiers particuliers des travaux de déduplication. Voir :

https://docs.microsoft.com/en-us/Windows-server/storage/data-deduplication/advanced-settings

ExcludeFileType est ce que vous devriez regarder.

ExcludeFileType Types de fichiers exclus de l'optimisation Tableau des extensions de fichiers Certains types de fichiers, en particulier les fichiers multimédias ou les fichiers déjà compressés, ne bénéficient pas beaucoup de l'optimisation. Ce paramètre vous permet de configurer les types qui sont exclus.

2voto

MDMarra Points 99815

Le fonctionnement interne du service de déduplication est stocké dans les informations sur le volume système de chaque volume, mais je crois comprendre qu'il n'y a rien de vraiment lisible par l'homme là-dedans pour savoir ce qui a été dédupliqué et ce qui ne l'a pas été. Cela se passe au niveau du bloc, pas au niveau du fichier.

J'ai déjà essayé ce qui est évident : créer un fichier, copier ce fichier dans le même dossier, puis afficher les propriétés du dossier - mais la taille du dossier correspond aux deux fichiers, alors que je m'attendais à ce qu'elle corresponde à la taille d'un seul fichier.

La déduplication se fait selon un calendrier. Si vous copiez un fichier et vérifiez immédiatement ses propriétés, il n'aura pas encore été dédupliqué. Vous pouvez utiliser Start-DedupJob pour forcer une optimisation de déduplication sur un volume spécifique pour votre scénario de test.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X