Je ne peux pas conduire la 155 : Meta descriptions en 2015

Je ne peux pas conduire la 155 : Meta descriptions en 2015

Je ne peux pas conduire la 155 : Meta descriptions en 2015

Depuis des années maintenant, nous (et beaucoup d’autres) recommandons de garder vos méta-descriptions plus courtes que 155-160 caractères environ. Depuis des mois, les gens m’envoient des exemples de bribes de recherche qui enfreignent clairement cette règle, comme celle-ci (sur une recherche de « nourriture pour colibri ») :

Pour mémoire, celle-ci se chiffre à 317 caractères (en comptant les espaces). J’ai donc entrepris de découvrir si ces longues descriptions étaient des exceptions à la règle, ou si nous devions changer les règles. J’ai rassemblé les bribes de recherche sur le WebsterdataCast 10K, ce qui a donné 92 669 bribes. Toutes les données de ce poste ont été collectées le 13 avril 2015.

Les données de base

La longueur minimale des extraits était de zéro caractère. Il y a eu 69 bribes de longueur zéro, mais la plupart d’entre elles étaient la nouvelle génération de boîte de réponse, qui semble organique mais ne comporte pas de bribes. En d’autres termes, ils ont été mal identifiés comme organiques par mon code. Les autres bribes de longueur 0 étaient des boîtes de réponse locales qui semblaient organiques mais qui n’avaient pas de bribes, comme celle-ci pour « chichen itza » :

Ces bribes de longueur zéro ont été retirées des analyses ultérieures, mais étant donné qu’elles ne représentaient que 0,07 % du total des données, elles n’ont pas vraiment influencé les conclusions, dans un sens ou dans l’autre. Le plus court extrait légitime, non nul, comportait 7 caractères, à la recherche de « geek and sundry », et semble provenir directement de la méta-description du site :

La longueur maximale de l’extrait ce jour-là (c’est une situation très dynamique) était de 372 caractères. Le gagnant est apparu sur une recherche de « bienfaits du vinaigre de cidre de pomme » :

La longueur moyenne de toutes les bribes de notre série de données (sans compter les bribes de longueur zéro) était de 143,5 caractères, et la longueur médiane de 152 caractères. Bien sûr, cela peut être trompeur, car certains extraits sont plus courts que la limite et d’autres sont artificiellement tronqués par Google. Alors, creusons un peu plus.

La situation dans son ensemble

Pour avoir une meilleure idée de la situation, examinons la longueur d’affichage des 92 600 bribes (avec une longueur non nulle), réparties en seaux de 20 caractères (0-20, 21-40, etc.) :

La plupart des bribes (62,1 %) sont coupées comme prévu, directement dans le seau de 141-160 caractères. Bien sûr, certains bribes étaient plus courtes que cela et n’avaient pas besoin d’être coupées, et d’autres enfreignaient les règles. Environ 1 % (1 010) des bribes de notre série de données mesuraient 200 caractères ou plus. Ce n’est pas un chiffre énorme, mais c’est suffisant pour être pris au sérieux.

Ce seau de 141 à 160 caractères éclipse tout le reste, alors zoomons un peu sur la fourchette de coupure, et regardons simplement les bribes de 120 à 200 caractères (dans ce cas, par bacs de 5 caractères) :

En zoomant, la plupart des bribes affichent une longueur comprise entre 146 et 165 caractères environ. Il existe de nombreuses exceptions à la règle des 155-160 caractères, mais pour la plupart, elles semblent être des exceptions.

Enfin, nous allons zoomer sur les cas de non-respect des règles. Il s’agit de la répartition des bribes de 191+ caractères, regroupées dans des bacs de 10 caractères (191-200, 201-210, etc.) :

Veuillez noter que l’échelle de l’axe Y est beaucoup plus petite que dans les deux graphiques précédents, mais la répartition est assez solide, avec une bonne partie des bribes affichant plus de 300 caractères.

Sans regarder toutes les balises de méta description originales, il est très difficile de dire exactement combien de bribes ont été tron1, mais nous avons un proxy. Les bribes qui ont été tronquées se terminent par une ellipse (…), qui apparaît rarement à la fin d’une description naturelle. Dans cet ensemble de données, plus de la moitié des bribes (52,8 %) se terminent par une ellipse, de sorte que nous voyons encore beaucoup de méta descriptions tronquées.

Je dois ajouter que, contrairement aux titres, il n’est pas évident de savoir si1 extraits en fonction de la largeur des pixels ou du nombre de caractères, puisque cette coupure se fait du côté du serveur. Dans la plupart des cas, Google coupe avant la fin de la deuxième ligne, mais parfois il coupe bien avant, ce qui pourrait suggérer une limite basée sur le nombre de caractères. Ils coupent également au niveau des mots entiers, ce qui peut rendre les chiffres un peu plus difficiles à interpréter.

Le plancher de la salle de coupe

Il est également difficile de savoir exactement combien de méta descriptions Google a modifiées – certaines modifications sont mineures, d’autres majeures. Une modification mineure consiste pour Google à ajouter des informations supplémentaires à un extrait, par exemple une date au début. Voici un exemple (tiré d’une recherche sur la « varicelle ») :

Avec la date (et sans les points de suspension), cet extrait comporte 164 caractères, ce qui laisse penser que Google ne compte pas le texte ajouté dans la limite de longueur. Ce qui est intéressant, c’est que le reste provient directement de la méta-description du site, sauf que la description du site commence par « varicelle » et que Google a supprimé ce mot-clé. En tant qu’humain, je dirais que cela correspond à la méta description, mais un bot a beaucoup de mal à distinguer une modification mineure d’une réécriture complète.

Une autre réécriture mineure se produit dans les snippets qui commencent par le décompte des résultats de recherche :

Ici, nous sommes à 172 caractères (avec les espaces et moins les points de suspension), et Google a même laissé ce fragment passer à la troisième ligne. Il semble donc que les informations ajoutées au début ne comptent pas dans la limite de longueur.

Au total, 11,6 % des bribes de notre base de données contenaient une sorte de données générées par Google, ce qui fait que ce type de réécriture mineure est assez courant. Même si Google honore la plupart de vos méta-déclarations, vous pouvez voir de petites modifications.

Examinons notre grand gagnant, la description de 372 caractères. Voici ce que nous avons vu dans l’extrait :

26 janvier 2015 – Santé- Prévention du diabète : De nombreuses études ont montré une corrélation entre le vinaigre de cidre de pomme et la baisse du taux de sucre dans le sang. … – Perte de poids : La consommation de vinaigre de cidre de pomme peut vous aider à vous sentir plus rassasié, ce qui peut vous aider à manger moins. … – Diminution du cholestérol : … – Désintoxication : … – Aide digestive : … – Peau qui démange ou qui est brûlée par le soleil : … – Booster d’énergie:1 more items

Alors, qu’en est-il de la méta description ? Voici ce que nous voyons réellement dans la balise :

Connaissiez-vous toutes les utilisations du vinaigre de cidre de pomme ? De la purification à la guérison, en passant par la prévention du diabète, le vinaigre de cidre de pomme est un produit de base du garde-manger dont vous avez besoin chez vous.

C’est un peu plus que quelques modifications. Alors, qu’est-ce qui se passe ici ? Eh bien, il y a un indice sur cette même page, où nous voyons encore un autre extrait de violation des règles :

Vous vous demandez peut-être pourquoi cet extrait est plus intéressant que l’autre. Si vous pouviez voir le haut du SERP, vous sauriez pourquoi, car il ressemble à ceci :

Google extrait automatiquement des données de type liste de ces pages pour alimenter l’expansion du graphique des connaissances. Dans un cas, ces données remplacent un extrait et vont directement dans une boîte de réponse, mais elles effectuent la même traduction même pour d’autres extraits de la page.

Ainsi, chaque boîte de réponse de deuxième génération produit-elle de longs extraits ? Après 3 heures de recherches mySQL déconseillées, je peux vous dire que la réponse est un « probablement pas » retentissant. Vous pouvez avoir des boîtes de réponse de deuxième génération sans longs bribes et vous pouvez avoir de longs bribes sans boîtes de réponse de deuxième génération, mais il semble y avoir un lien entre les longs bribes et le Knowledge Graph dans certains cas.

Un lien intéressant est que Google a commencé à mettre en gras les mots clés qui semblent être des réponses à la requête (et pas seulement des synonymes de la requête). Voici un exemple tiré d’une recherche sur les « mono symptômes ». Il y a une boîte de réponse pour cette requête, mais l’extrait ci-dessous ne provient pas du site dans la boîte de réponse :

Remarquez les mots en gras – « fatigue », « mal de gorge », « fièvre », « mal de tête », « éruption cutanée ». Ce ne sont pas des synonymes de la phrase de recherche ; ce sont de véritables symptômes de la mononucléose. Ces données ne proviennent pas de la méta description, mais d’une liste à puces sur la page cible. Là encore, il semble que Google essaie d’utiliser l’extrait pour répondre à une question, et qu’il est allé bien au-delà de la simple correspondance de mots-clés.

Juste pour le plaisir, regardons-en un autre, où il n’y a pas de lien clair avec le graphique des connaissances. Voici un extrait d’une recherche sur les « fils de l’anarchie saison 4 » :

Cette page n’a pas de boîte de réponse, et les informations extraites sont, au mieux, étranges. L’extrait ne ressemble pas ou très peu à la méta-description du site. La chaîne de chiffres au début provient d’un widget de classement, et une partie du texte n’est même pas clairement disponible sur la page. Cela semble être un exemple de Google qui reconnaît IMDb comme un site de haute autorité et qui essaie désespérément de faire correspondre le texte qu’il peut à la requête, ce qui donne un extrait de Frankenstein.

Le verdict final

Si tout cela semble déroutant, c’est probablement parce que c’est le cas. Google prend beaucoup plus de libertés avec les snippets de nos jours, que ce soit pour mieux faire correspondre les requêtes, pour ajouter des détails qu’ils jugent importants ou pour aider à construire et à soutenir le Knowledge Graph.

Revenons donc à la question initiale : est-il temps de réviser la directive sur les caractères 155(ish) ? Mon intuition est la suivante : pas encore. Pour commencer, la grande majorité des bribes se situent encore dans cette fourchette de 145-165 caractères. En outre, les exceptions à la règle ne sont pas seulement des situations atypiques, mais dans la plupart des cas, ces longs bribes ne semblent pas représenter la méta-description originale. En d’autres termes, même si Google vous accorde des caractères supplémentaires, il est probable qu’ils ne correspondent pas aux caractères supplémentaires que vous avez demandés au départ.

De nombreuses personnes ont posé la question : « Comment puis-je m’assurer que Google affiche ma méta-description telle quelle ? » J’ai bien peur que la réponse soit : « Vous ne le faites pas ». Si c’est très important pour vous, je vous recommande de ne pas dépasser la limite de 155 caractères et de vous assurer que votre description correspond bien aux concepts des mots clés que vous ciblez. Je soupçonne que Google va prendre plus de libertés avec les bribes d’information au fil du temps, et nous allons devoir abandonner notre obsession d’avoir un contrôle total sur les SERP.

67
87