Je souhaite créer un miroir d'un site qui possède un sitemap dynamique au format XML.
Bien sûr, je veux que ce sitemap soit téléchargé et traité comme s'il s'agissait d'un fichier html.
J'ai essayé le -F
pour ce fichier, mais cela n'a pas fonctionné, indiquant qu'il n'avait pas trouvé d'URL dans le fichier.
Pour l'instant, je suppose que cela ne fonctionnera pas de cette manière (parce que wget n'est pas pour le xml), mais je voulais poser la question pour m'assurer que je n'ai pas oublié quelque chose.
Le contenu du fichier xml se présente comme suit :
<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="http://MY_SITE/wp-content/plugins/google-sitemap-generator/sitemap.xsl"?><!-- sitemap-generator-url="http://www.arnebrachhold.de" sitemap-generator-version="4.0.8" -->
<!-- generated-on="June 11, 2017 6:05 pm" -->
<sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap>
<loc>http://MY_SITE/sitemap-misc.xml</loc>
<lastmod>2017-05-31T20:49:06+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://MY_SITE/sitemap-pt-post-2017-04.xml</loc>
<lastmod>2017-04-12T16:27:52+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://MY_SITE/sitemap-pt-post-2017-02.xml</loc>
<lastmod>2017-02-10T17:50:14+00:00</lastmod>
</sitemap>
[...]
</sitemapindex>
Et chaque sous-modèle est alors comme :
<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="http://MY_SITE/wp-content/plugins/google-sitemap-generator/sitemap.xsl"?><!-- sitemap-generator-url="http://www.arnebrachhold.de" sitemap-generator-version="4.0.8" -->
<!-- generated-on="June 11, 2017 6:07 pm" -->
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url>
<loc>http://MY_SITE/32017-SOME_CONTENT/</loc>
<lastmod>2017-04-12T16:27:52+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://MY_SITE/32017-SOME_OTHER_CONTENT/</loc>
<lastmod>2017-04-12T16:24:25+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>