4 votes

Google Mini semble manquer certains documents

J'ai un site qui contient des pages dynamiques (par exemple, record.aspx?id=657). Ces pages sont ajoutées occasionnellement. Chacune de ces pages peut être trouvée en suivant différentes balises, et il y a une page (dont l'accès est restreint pour que seul le Google Mini puisse la voir) qui liste tous les enregistrements sous forme de liens.

Le mini est configuré pour faire un crawl complet chaque nuit à 3 heures du matin.

Certains des ajouts les plus récents à la base de données ne semblent pas s'afficher, alors qu'ils datent de quelques semaines maintenant, et apparaissent même dans l'index principal de Google.

Une idée de la raison pour laquelle les nouveaux enregistrements ne sont pas indexés ?

2voto

bigmattyh Points 9167

Alors, juste une idée, mais avez-vous dépassé la capacité de l'appareil ?

2voto

GregD Points 8703

Depuis la page d'accueil de l'administration de votre Google Mini :

  1. Cliquez sur "Statut et rapports" dans la colonne de gauche.
  2. Dans la liste déroulante, cliquez sur "Crawl Diagnostics".

À partir de là, vous disposez de quatre colonnes : nom d'hôte, URL explorées, erreurs de récupération et URL exclues. Les valeurs de ces colonnes sont des hyperliens vers des informations supplémentaires concernant chaque colonne. S'il y a des erreurs avec ces documents particuliers, vous trouverez votre réponse ici.

1voto

miracle2k Points 3285

Y a-t-il quelque chose à ce sujet dans les journaux du Mini ? Et si je me souviens bien, il y a un endroit où vous pouvez vérifier si le Mini peut accéder à un fichier ou non. Vérifiez également que les types de fichiers concernés ne sont pas ignorés dans la configuration.

1voto

hdanniel Points 4263

Essayez ça :

  • Vérifiez si vous ne dépassez pas la licence et la capacité de l'appareil (État et rapports > Page d'état du crawl).
  • Vérifiez les valeurs de "URLs Found That Match Crawl Patterns" et "Total Documents Being Served" . La différence entre les deux doit être faible.
  • Vérifiez les informations de crawl du domaine (Status and Reports >Crawl Diagnostics) pour voir si toutes les pages sont indexées.
  • Si vous avez accès aux fichiers journaux de votre serveur web, forcez un recrawl d'une page non indexée et voyez quelle est la réponse du serveur web (peut-être un 404 ?).
  • Après tous les tests ci-dessus, si toutes les pages sont indexées mais n'apparaissent pas dans les résultats, je vous recommande de mettre à jour le logiciel de votre Google Mini. Cela m'est arrivé il y a quelques temps, et la mise à jour a résolu le problème.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X