1 votes

Quelle technologie permet le "stripping" d'un DOC, PDF, XLS, etc des fonctionnalités non liées aux données

Pour des raisons de sécurité, je dois réduire un document à un format commun, en supprimant ainsi toutes les Macros, métadonnées, nettoyage des images intégrées, et réduire les risques que la pièce jointe pourrait poser. Même si les liens ci-dessus concernent les vulnérabilités des images, je m'intéresse aussi aux problèmes de document.

Je suis intéressé par un EXE ou qui fait cela, même GPL* est bien. J'ai juste besoin de permettre l'utilisation commerciale de l'application.

1voto

music2myear Points 38573

Ces conversions varieront selon le type de fichier. Une image stockera les métadonnées différemment qu'un document, qui stockera les métadonnées différemment qu'une vidéo. Même différents types de fichiers de choses similaires (par exemple, BMP et JPG) stockent leurs métadonnées différemment.

En tant que tel, vous aurez besoin d'applications uniques pour chacun de ceux-ci.

Pour les images, vous devriez pouvoir utiliser IrfanView, ce qui sera pratique car il peut traiter par lots des grands nombres de fichiers facilement.

Pour les documents, MS Office a certaines capacités ou processus, tels que définis par MS, pour minimiser les métadonnées incluses dans les documents. Malheureusement, la documentation MS traite principalement des anciennes versions.

Pour les versions 2003, il existe un outil MS pour supprimer les métadonnées: http://support.microsoft.com/default.aspx?kbid=834427

Pour les versions antérieures à 2003, MS a des documents sur la façon de supprimer ces informations: http://office.microsoft.com/en-us/excel-help/find-and-remove-metadata-hidden-information-in-your-legal-documents-HA001077646.aspx

Pour les nouvelles versions de office, le Payne Consulting Group a un nettoyeur (j'ai travaillé dans un grand cabinet d'avocats qui l'utilisait pour Office 2010) mais j'imagine que c'est horriblement cher. Il y a aussi iScrub et un autre nettoyeur documenté dans un article de Tech Republic: http://www.techrepublic.com/article/keep-microsoft-office-documents-clean-with-iscrub/5035132

J'ai trouvé un article MS sur l'inspection et le nettoyage des documents sans utiliser d'autres outils. C'est manuel, mais il est déjà inclus dans les produits MS, et la solution fonctionne dans la version 2010: http://office.microsoft.com/en-us/word-help/remove-hidden-data-and-personal-information-by-inspecting-documents-HA010354329.aspx

1voto

Il existe des produits commerciaux qui font cela, exactement dans le but que vous recherchez, dans un environnement professionnel. Le produit que j'ai vu permet une variété de paramètres pour le niveau de nettoyage, etc. Celui dont je suis conscient s'appelle "Workshare Protect", mais je suis sûr qu'il en existe d'autres.

1voto

ZaB Points 2419

http://lawyerist.com/comment-enlever-rapidement-et-facilement-des-donnees-meta/

Lorsque vous apprenez à nettoyer des données de plusieurs gigaoctets rendues en demi-pixel, un utilisateur abusif les transformera en 2x2px...

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X