3 votes

Suppression des chemins d'accès / Pages de destination des résultats de recherche SharePoint

Nous avons été invités par un client à supprimer un certain nombre de pages de leur site Web public des résultats de recherche. Je suis entré dans le SSP et j'ai créé des règles de crawl pour supprimer ces pages. Tout semblait fonctionner correctement, mais nous avons un problème, les pages de destination apparaissent toujours sous forme de "www.domain.com/sitearea/", mais pas sous forme de "www.domain.com/sitearea/pages/default.aspx".

Pour chaque type de page, nous avons créé une règle pour "Exclure" le chemin "aspx" et une autre règle pour inclure le chemin "/" mais pour "Suivre les liens sur l'URL sans crawler l'URL elle-même". Nous avons essayé d'ajouter des règles pour exclure le format "/", mais cela a simplement entraîné l'exclusion de tous les résultats en dessous.

Est-ce que quelqu'un sait comment supprimer les parties "area/pages/default.aspx" et "area/" des résultats de recherche ?

Je ne suis pas sûr si c'est courant de poser 2 questions en une seule, mais c'est dans le même esprit, donc ça devrait aller. Je me demandais si quelqu'un connaissait un outil (ou s'il est possible) de permettre aux admins de site d'exclure des pages des résultats de recherche (pas via SSP/Crawl Rules). Je sais qu'ils peuvent le faire au niveau du site, mais je me demandais s'il existait quelque chose qui permettait de le faire au niveau de la page via les paramètres de page ou de site ?

1voto

Zameer Manji Points 1213

Je ne suis pas sûr de comprendre - parlons-nous d'exclure des pages des moteurs de recherche publics tels que Google, ou d'une fonction de recherche spécifique à Sharepoint interne?

Eh bien, dans les deux cas, le fichier robots.txt devrait fonctionner pour exclure les pages Web de l'indexation par les moteurs de recherche. Je ne suis pas un expert en Sharepoint, mais une recherche rapide semble montrer que la recherche Sharepoint obéit au fichier robots.txt, donc ce serait mon premier choix.

Voici le documentation principale sur le format de robots.txt. Ce document de Microsoft semble bien décrire la gestion de la recherche Sharepoint. Il dit:

SharePoint Portal Server 2003 et SharePoint Server 2007 obéissent automatiquement aux restrictions contenues dans le fichier Robots.txt

- ce que je prends encore une fois pour signifier que la recherche Sharepoint obéira à un fichier robots.txt.

Si votre site est accessible au public, vous voudrez peut-être ouvrir un compte Google Webmaster Tools. Ils ont quelques outils intéressants pour résoudre divers problèmes d'exploration, et voir comment votre fichier robots.txt fonctionnera pour votre site.

1voto

Steve Morgan Points 9296

Si vous voulez exclure toutes les pages telles que "area/pages/default.aspx" et "area/", la règle d'exclusion de l'exploration devrait avoir un astérisque à la fin, c'est-à-dire www.domain.com/sitearea/*

1voto

Andrew Points 11

Je rencontre un problème similaire, l'indexeur inclut les éléments de navigation dans la recherche, mais uniquement pour les objets STS_Web ... ou ils devraient être des objets STS_Web ... les fonctionnalités de gestion de contenu Web (WCM) de publication dans SharePoint semblent marquer les pages de bienvenue comme STS_ListItem_850 ... pas STS_Web ... l'URL dans les résultats de recherche est l'URL du site Web et non l'URL de la page (exclut Pages/Default.aspx) il indexe la page de bienvenue en tant que Web et non le Web lui-même.

0voto

JHollanti Points 842

Essayez de créer une étendue de recherche avec des règles basées sur la propriété contentclass. Tous les sites utilisent la valeur sts_site et les webs sts_web. Supprimer toute contentclass avec ces valeurs devrait empêcher la version site/ des pages d'accueil de s'afficher.

0voto

J'ai ajouté une URL dans la suppression des résultats de recherche - afin de ne pas s'afficher dans la page des résultats de recherche. Maintenant, les exigences ont changé et ces résultats doivent être affichés à nouveau.. comment les récupérer..

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X