1 votes

Comment récupérer le code réel d'une page Web pour un élément <div> ?

  1. J'utilise wget pour enregistrer une page web dans un fichier 'annie.html'.
% wget -qO-  http://www.swagbucks.com/watch/video/523803/annie > annie.html
  1. Dans ce fichier se trouve cette ligne :
<div id="sbPlaylistVideoContainer" class="fullSize"></div>
  1. La question est : Comment puis-je obtenir le code réel de ce <div> élément ? Si je fais un clic droit sur la vidéo dans Chrome et que je clique sur "Inspecter l'élément", je vois le code réel.

Ça ressemble à ça.

<video id="example_video_1_html5_api" class="vjs-tech" preload="none" src="blob:http%3A//www.swagbucks.com/096df37a-81fe-4c65-b082-0fe059254d6e" style=""><source src="http://progressive.totaleclips.com.edgesuite.net/137/e137013_257.mp4?eclipid=e137013&amp;bitrateid=457&amp;vendorid=1839&amp;type=.mp4" type="video/mp4"></video>

Où Chrome a-t-il trouvé ça ? Il n'existe pas dans la page Web. J'aimerais obtenir la syntaxe correcte de la commande "wget" qui permettra d'enregistrer ce code dans un fichier.

2voto

jasonlaflair Points 668

Sans analyser la page Web, il est impossible d'en être sûr, mais il est très probable que le site Web utilise JavaScript pour injecter le lecteur vidéo dans la page. La fonction "Inspecter l'élément" de Chrome affiche l'état actuel du DOM, mais pas nécessairement la véritable source de la page.

Il y a plusieurs raisons pour qu'un site Web fasse cela, notamment pour détecter les capacités de votre navigateur afin de rendre un lecteur approprié (c'est-à-dire une vidéo HTML ou un lecteur Flash) ou pour avoir la capacité de changer dynamiquement la vidéo.

0voto

LPChip Points 53736

La page web est générée dynamiquement. Parce que vous visualisez la page web avec Chrome, qui est capable d'utiliser HTML5, le serveur vous donne la balise qui est une balise html5. wget ne s'identifie pas comme chrome, et donc le serveur utilise par défaut une balise rétrocompatible.

Les deux commandes sont cependant valables.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X