J'essaie d'extraire des données d'un site web pour une recherche.
Les urls sont joliment organisées dans un format exemple.com/x, avec x comme nombre croissant et toutes les pages sont structurées de la même manière. J'ai juste besoin de récupérer certaines rubriques et quelques chiffres qui se trouvent toujours aux mêmes endroits. J'aurai ensuite besoin de mettre ces données sous forme structurée pour les analyser dans Excel.
J'ai déjà utilisé wget pour télécharger des pages, mais je n'arrive pas à trouver comment récupérer des lignes de texte spécifiques.
Excel dispose d'une fonction permettant de récupérer des données sur le Web (Data->From Web) mais, d'après ce que je vois, elle ne me permet que de télécharger des tableaux. Malheureusement, les données dont j'ai besoin ne sont pas sous forme de tableaux.