Il nous arrive parfois de voir de l’information dans les résultats de recherche de Google pour notre site Web et de ne pas comprendre d’où elle vient. Cet article présente le problème pour le résumé et donne des pistes pour permettre de reprendre le contrôle sur l’information qui sera affichée.
Le problème
Il y a quelques mois, une de mes clientes m’envoyait un courriel me demandant d’où venait le résumé dans les résultats de recherche de Google pour la page d’accueil de son site. Ce qu’elle voyait est mis à la Figure 1. Elle était surprise de voir ce texte qu’elle n’avait pas rédigé :
Renseigne sur les circuits, le calendrier, les activités scolaires et donne de l’information stratégique en muséologie. Montréal.
Elle avait beau faire une recherche dans le contenu de la page, ce texte se trouvait nulle part. Elle était aussi certaine qu’elle n’avait jamais rédigé ce texte, alors il ne pouvait pas s’agir d’une ancienne version de la page qui aurait été indexée et qui resterait dans la base de données de Google.

Je suis allé faire ma propre vérification pour être certain. J’ai fait la recherche dans le contenu de la page comme elle, mais j’ai aussi inspecté le code HTML. Ce contenu aurait pu se trouver dans les metadonnées qui sont souvent invisibles dans le rendu de la page. En fait, la page n’avait pas de champ meta
description
. Par exemple, pour le contenu de la page d’accueil de notre site de formation, nous avons :
<meta name="description" content="Nous formons les professionnels du Web depuis 1996. Nos formations (HTML5, CSS, JavaScript, PHP, XML) sont offertes à différents endroits à Montréal." />
Ceci permet de contrôler ce qui est présenté dans le résumé des résultats de recherche comme nous verrons plus loin.
Dans notre cas, le contenu présenté dans le résumé de Google ne se trouvait nulle part ailleurs dans la source HTML de la page.
L’analyse
Il faut savoir que Google génère un résumé de page pour le résultat d’une recherche. Google construit un résumé qui aura une corrélation optimale avec les termes de la requête selon son algorithme. Le contenu pour la construction de ce résumé peut provenir de trois sources1 :
- Le champ meta description
<meta name="description" content="..."/>
- Le contenu de la page
- Les données en provenance du répertoire Open Directory Project (ODP) sur dmoz.org
Pour ceux qui ne connaissent pas, l’objectif du Open Directory Project est de produire un annuaire complet du Web libre de droits. Il est géré par une communauté d’éditeurs bénévoles. Nous pouvons donc nous y retrouver parce que nous l’avons explicitement demandé, mais parfois les entrées ont été mises par les éditeurs bénévoles de l’ODP externes à notre organisation.
Comme dans notre cas le contenu n’était pas dans la page HTML, il était fort probable qu’il provienne du ODP. Une recherche pour « musees.qc.ca »2 dans le répertoire du ODP sur le site dmoz.org donne ce que nous voyons à la Figure 2 et nous y retrouvons le fameux résumé que nous n’avons pas rédigé.

Les solutions
Il arrive souvent que nous ne soyons pas en mesure de changer le contenu publié sur l’ODP. Dans ce cas, comment faire pour empêcher l’affichage de ce contenu que nous ne contrôlons pas dans les résultats de recherche sur Google? La solution la plus simple est d’ajouter dans la page une instruction pour dire à Google de ne pas utiliser le contenu en provenance du ODP :
<meta name="robots" content="noodp"/>
Dans ce cas noodp
dit ne ne pas prendre le résumé qui pourrait se trouver dans le Open Directory Project. C’est ce que nous avons fait et quelques semaines plus tard nous avions dans les résultats de recherche de Google pour la page d’accueil du site un résumé extrait du contenu de la page. Le résultat d’une recherche sur l’expression « société des musées du québec » faite le 9 octobre 2016 est présenté à la Figure 3.

Noter que le champ meta
description
n’avait toujours pas été mis dans la page au moment de la capture d’écran, le résumé fut donc construit à partir du contenu de la page au moment de l’indexation. Le résumé dans notre cas était un extrait de la nouvelle à la une sur la page d’accueil du site de la Société des musées du Québec.
L’autre solution, plus draconienne, serait de dire à Google de ne pas mettre de résumé pour la page :
<meta name="robots" content="nosnippet"/>
Mais il faut utiliser cette solution en dernier recours car ça éliminera le résumé au complet. Ça peut aussi impacter la mise en cache de la page.
Pour plus de détails sur les balises meta
comme celles présentées ici, consulter l’article Balises Meta acceptées par Google sur le site de support de Google.
Pour terminer…
L’objectif de ce court billet était de vous sensibiliser à cette problématique pour que vous sachiez réagir lorsque vous êtes confrontés à cette situation. Dans un autre ordre d’idées, noter que le titre de votre page dans les résultats de recherche peut aussi être altéré par Google et ne pas reprendre ce que vous avez mis dans l’élément title
de votre page. Un billet sur le site WebRankInfo qui décortique l’usage de l’élément title
explique la situation.
Pour ceux qui veulent qui veulent pousser plus loin le sujet, nous couvrons ceci en détail dans notre cours Développer un site Web optimisé pour Google.