Je veux récupérer tous les fichiers d'un site web donné sur archive.org. Les raisons peuvent être les suivantes :
- l'auteur original n'a pas archivé son propre site web et il est maintenant hors ligne, je veux en faire un cache public
- Je suis l'auteur original d'un site web et j'ai perdu une partie de son contenu. Je veux le récupérer
- ...
Comment faire ?
Il faut tenir compte du fait que la machine wayback d'archive.org est très spéciale : les liens des pages Web ne pointent pas vers l'archive elle-même, mais vers une page Web qui pourrait ne plus exister. JavaScript est utilisé côté client pour mettre à jour les liens, mais une astuce comme un wget récursif ne fonctionnera pas.