Mais d’où vient ce résumé dans Google que je n’ai jamais rédigé?

Il nous arrive parfois de voir de l’information dans les résultats de recherche de Google pour notre site Web et de ne pas comprendre d’où elle vient. Cet article présente le problème pour le résumé et donne des pistes pour permettre de reprendre le contrôle sur l’information qui sera affichée.

Le problème

Il y a quelques mois, une de mes clientes m’envoyait un courriel me demandant d’où venait le résumé dans les résultats de recherche de Google pour la page d’accueil de son site. Ce qu’elle voyait est mis à la Figure 1. Elle était surprise de voir ce texte qu’elle n’avait pas rédigé :

Renseigne sur les circuits, le calendrier, les activités scolaires et donne de l’information stratégique en muséologie. Montréal.

Elle avait beau faire une recherche dans le contenu de la page, ce texte se trouvait nulle part. Elle était aussi certaine qu’elle n’avait jamais rédigé ce texte, alors il ne pouvait pas s’agir d’une ancienne version de la page qui aurait été indexée et qui resterait dans la base de données de Google.

Figure 1 — Résultat de la recherche pour « société des musées du québec » dans Google un beau soir d’été en 2016.

Je suis allé faire ma propre vérification pour être certain. J’ai fait la recherche dans le contenu de la page comme elle, mais j’ai aussi inspecté le code HTML. Ce contenu aurait pu se trouver dans les metadonnées qui sont souvent invisibles dans le rendu de la page. En fait, la page n’avait pas de champ meta description. Par exemple, pour le contenu de la page d’accueil de notre site de formation, nous avons :

<meta name="description" content="Nous formons 
les professionnels du Web depuis 1996. Nos 
formations (HTML5, CSS,  JavaScript, PHP,
XML) sont offertes à différents endroits 
à Montréal." />

Ceci permet de contrôler ce qui est présenté dans le résumé des résultats de recherche comme nous verrons plus loin.

Dans notre cas, le contenu présenté dans le résumé de Google ne se trouvait nulle part ailleurs dans la source HTML de la page.

L’analyse

Il faut savoir que Google génère un résumé de page pour le résultat d’une recherche. Google construit un résumé qui aura une corrélation optimale avec les termes de la requête selon son algorithme. Le contenu pour la construction de ce résumé peut provenir de trois sources1 :

  1. Le champ meta description
    <meta name="description" content="..."/>
  2. Le contenu de la page
  3. Les données en provenance du répertoire Open Directory Project (ODP) sur dmoz.org

Pour ceux qui ne connaissent pas, l’objectif du Open Directory Project est de produire un annuaire complet du Web libre de droits. Il est géré par une communauté d’éditeurs bénévoles. Nous pouvons donc nous y retrouver parce que nous l’avons explicitement demandé, mais parfois les entrées ont été mises par les éditeurs bénévoles de l’ODP externes à notre organisation.

Comme dans notre cas le contenu n’était pas dans la page HTML, il était fort probable qu’il provienne du ODP. Une recherche pour « musees.qc.ca »2 dans le répertoire du ODP sur le site dmoz.org donne ce que nous voyons à la Figure 2 et nous y retrouvons le fameux résumé que nous n’avons pas rédigé.

Figure 2 — Résultat de la recherche pour « musees.qc.ca » dans le Open Directory Project.

Les solutions

Il arrive souvent que nous ne soyons pas en mesure de changer le contenu publié sur l’ODP. Dans ce cas, comment faire pour empêcher l’affichage de ce contenu que nous ne contrôlons pas dans les résultats de recherche sur Google? La solution la plus simple est d’ajouter dans la page une instruction pour dire à Google de ne pas utiliser le contenu en provenance du ODP :

<meta name="robots" content="noodp"/>

Dans ce cas noodp dit ne ne pas prendre le résumé qui pourrait se trouver dans le Open Directory Project. C’est ce que nous avons fait et quelques semaines plus tard nous avions dans les résultats de recherche de Google pour la page d’accueil du site un résumé extrait du contenu de la page. Le résultat d’une recherche sur l’expression « société des musées du québec » faite le 9 octobre 2016 est présenté à la Figure 3.

Figure 3 — Résultat de la recherche pour « société des musées du québec » dans Google après avoir mis la commande pour ne pas utiliser le descriptif en provenance du ODP.

Noter que le champ meta description n’avait toujours pas été mis dans la page au moment de la capture d’écran, le résumé fut donc construit à partir du contenu de la page au moment de l’indexation. Le résumé dans notre cas était un extrait de la nouvelle à la une sur la page d’accueil du site de la Société des musées du Québec.

L’autre solution, plus draconienne, serait de dire à Google de ne pas mettre de résumé pour la page :

<meta name="robots" content="nosnippet"/>

Mais il faut utiliser cette solution en dernier recours car ça éliminera le résumé au complet. Ça peut aussi impacter la mise en cache de la page.

Pour plus de détails sur les balises meta comme celles présentées ici, consulter l’article Balises Meta acceptées par Google sur le site de support de Google.

Pour terminer…

L’objectif de ce court billet était de vous sensibiliser à cette problématique pour que vous sachiez réagir lorsque vous êtes confrontés à cette situation. Dans un autre ordre d’idées, noter que le titre de votre page dans les résultats de recherche peut aussi être altéré par Google et ne pas reprendre ce que vous avez mis dans l’élément title de votre page. Un billet sur le site WebRankInfo qui décortique l’usage de l’élément title explique la situation.

Pour ceux qui veulent qui veulent pousser plus loin le sujet, nous couvrons ceci en détail dans notre cours Développer un site Web optimisé pour Google.

1Noter que le résumé peut contenir du contenu provenant de plusieurs des sources, en particulier du champ meta description mais aussi du contenu de la page.
2Nous faisons la recherche sur musees.qc.ca car nous voulons trouver rapidement la fiche pour ce site sur l’ODP.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *


*