1 votes

Comment dire à httrack de ne pas ajouter index.html aux liens

Lorsque vous dupliquez un site avec un lien comme www.example.com/some/where/, httrack le modifie en www.example.com/some/where/index.html dans la copie locale.

Y a-t-il une option pour éviter l'ajout de index.html?

PS. Je suis pleinement conscient que index.html est nécessaire pour naviguer localement sur le site, mais le miroir va remplacer le site sur le serveur. Il s'agit d'un site basé sur une base de données qui sera remplacé par une version statique puisqu'il ne sera plus mis à jour. Cependant, je veux qu'il soit identique à un instantané du site original.

S'il n'est pas possible, je devrai utiliser sed pour supprimer les parties index.html.

1voto

J'ai fini par utiliser sed:

find . -name '*.html' -exec sed -i 's%index.html%%g' {} \;

Cela trouve tous les fichiers se terminant par .html dans le sous-répertoire actuel et exécute une commande sed sur eux qui remplace toutes les occurrences de index.html par rien, c'est-à-dire le supprime.

0voto

Lukas Liesis Points 156

Ajoutez simplement l'option -K et il ignorera les index.html dans les URL. Cependant, vous devez vous assurer que votre hôte peut résoudre les URL sans index.html

Par exemple:

httrack https://example.com/ -K

entrez ici la description de l'image

https://www.httrack.com/html/fcguide.html

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X