3 votes

Images / balises en double - tri et suppression

J'ai des dossiers remplis d'images d'appareils photo que j'ai copiés et sauvegardés entre mon ordinateur portable, mon ordinateur et mon ou mes disques durs externes.

Je veux les organiser et les trier, et supprimer les doublons, donc j'ai utilisé un utilitaire Canon pour les trier dans des dossiers basés sur la date et l'heure de la prise de vue (informations EXIF), et un utilitaire appelé Ant Renamer de PortableApps pour renommer certains d'entre eux en date et heure au format .jpg.

Malheureusement, j'ai marqué certaines des images avec le nom de l'appareil photo ou l'endroit où je les ai prises, mais je l'ai fait après les avoir importées sur l'ordinateur et copiées sur un disque dur. J'ai donc une copie de l'image avec les balises, et une autre sans.

J'utilise Duplicate File Finder v1.1.0.3 de Rashid Hoda mais malheureusement, il indique que certains sont différents à cause des balises. Ant renamer ne renomme pas les images dans le même dossier s'il y en a une avec la même date/heure - c'est pourquoi j'ai gardé l'original dans le nom du fichier.

Je suppose que je pourrais supposer que toutes les photos prises au même moment sont des doublons parce qu'elles proviennent de deux appareils photo et que j'ai PRINCIPALEMENT conservé la date et l'heure réglées sur mon appareil.

Mais, j'aimerais être plus sûr.

Les suggestions de scripts / utilitaires / ou même les idées que je peux prendre en compte sont très appréciées.

2voto

Stig Brautaset Points 121

Il y a un utilitaire appelé identify qui est fourni avec le paquetage ImageMagick. Il fournit une somme de contrôle (MD5, je crois me souvenir) de l'image de la données d'image (sans les balises) de l'image. Cela peut être utilisé pour trouver les doublons. J'aborde ce sujet en profondeur dans mon article sur les déduplication des bibliothèques iPhoto -- mais les concepts sont également applicables à d'autres situations.

Je ne connais pas d'outil qui fasse cela automatiquement, mais le post dont j'ai donné le lien ci-dessus montre la plupart de ce dont vous avez besoin. Tout ce qui est nécessaire est d'appeler identify -verbose et extraire sa somme de contrôle, plutôt que d'utiliser l'appel à la fonction md5sum que j'utilise dans mon script dans le post. Si vous avez besoin d'aide avec ça, c'est probablement un post pour StackOverflow :-)

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X