58 votes

Comment utiliser wget/curl pour télécharger depuis un site sur lequel je suis connecté ?

Certaines parties de wikipedia apparaissent différemment lorsque vous êtes connecté. Je voudrais récupérer les pages des utilisateurs afin qu'elles apparaissent comme si j'étais connecté.

Y a-t-il un moyen d'obtenir des pages d'utilisateur comme celle-ci ?

http://en.wikipedia.org/wiki/User:A

c'est la page de connexion :

http://en.wikipedia.org/w/index.php?title=Special:UserLogin&returnto=Login&campaign=ACP3

2voto

weberjn Points 231

Jeter un coup d'œil à cliget pour Firefox.

Lorsque vous êtes sur le point de télécharger, la boîte de dialogue de téléchargement final vous offre la possibilité de copier le téléchargement en ligne de commande curl dans le presse-papiers.

1voto

Corey Whitaker Points 1155

Avez-vous essayé ?

wget --user=username --password=password http://en.wikipedia.org/wiki/User:A

1voto

kenorb Points 8840

Essayez quelque chose comme :

wget --keep-session-cookies --save-cookies cookies.txt --post-data 'user=goyamy&passwrd=mypassword' http://forum.ubuntu-it.org/

Voir aussi ce lien :

Comment télécharger cette page web avec wget ?

1voto

Omar Points 41

Pour les connexions plus complexes basées sur des sites web, vous devriez également envisager d'utiliser un script Python et un module qui imite un navigateur, comme par exemple http://wwwsearch.sourceforge.net/mechanize/ 代わりに curl o wget .

De cette façon, les cookies de session sont traités automatiquement, vous pouvez suivre les liens et remplir les formulaires de connexion, et ainsi "script" vous-même à travers le processus de connexion comme si vous utilisiez votre navigateur web.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X