2 votes

Wget - Difficulté à exclure les domaines et les répertoires

J'utilise Wget sous Windows 7. Je pense que cela me limite à Wget 1.11.4.

Pour ceux qui sont intéressés par les détails, j'ai mis en ligne les informations suivantes un exemple de fichier wgetrc . Cet exemple est en fait celui que j'utilise actuellement. Ma commande Wget est la suivante :

wget 2> "I:\Current\Wget\wgeterr.log"

J'ai des problèmes avec les options qui sont censées limiter ce qui est téléchargé. Comme détaillé à la fin de wgetrc (ci-dessus), certaines formes de ces restrictions ne semblent pas fonctionner.

En particulier, je pense que j'indique correctement, avec exclude_domains, que je ne veux pas inclure twitter.com dans le téléchargement, en tant que dossier au même niveau que le site web que je télécharge (c'est-à-dire, raywoodcockbio.wordpress.com). Pourtant, j'obtiens quand même twitter.com.

La question est la suivante : comment puis-je empêcher twitter.com (ainsi que les dossiers de facebook et d'autres sites de médias sociaux) d'être inclus dans mon téléchargement ?

0voto

stderr Points 10006

Regardez le paramètre exclude_directories o -X de wget . Le site -X spécifier est une liste de répertoires exclus du téléchargement. Par exemple, si vous ne voulez pas que Wget pour télécharger des choses à partir de /foo-bar spécifiez -X /foo-bar sur la ligne de commande.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X