1 votes

Récupération de données à partir de collections de fichiers

Je travaille actuellement en tant que stagiaire d'été.

Mon premier objectif est, étant donné une collection de fichiers, de récupérer et d'identifier les types de fichiers présents dans celle-ci.

Pour télécharger des exemples de données pseudo-forensiques que j'ai utilisées : Corpora numériques

Pour récupérer des fichiers, j'ai utilisé ' Le Sleuthkit Mais cela ne semble pas fonctionner car je reçois toujours des messages d'erreur concernant le format des données utilisées.

Ce serait formidable de recevoir des suggestions/liens vers des tutoriels ou des logiciels qui aident à récupérer des données.

J'attends également avec impatience les liens permettant de télécharger des données médico-légales psuedo similaires à celle ci-dessus.

Plus précisément, je voudrais récupérer toutes les données qui sont en format texte (word, pdf, emails, html... etc) puis les unifier en un seul fichier en format texte et ensuite utiliser le traitement du langage naturel pour déterminer les lieux auxquels la personne était associée. J'ai quelques idées en ce qui concerne l'aspect traitement du langage naturel du problème mais j'ai besoin d'aide en ce qui concerne la récupération des données. Quelle est la meilleure façon d'accomplir cette tâche ?

0voto

mikolajek Points 85

Il existe de multiples programmes gratuits destinés à la récupération et au découpage des données qui sont très efficaces et fiables. Je vous recommande d'essayer :

Les outils commerciaux sont beaucoup plus faciles à utiliser mais ne génèrent pas nécessairement un aussi bon rendement que ceux-ci.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X