Mise à jour de l’algorithme « Multi-Week » de Google

Mise à jour de l’algorithme « Multi-Week » de Google

Mise à jour de l'algorithme "Multi-Week" de Google

Le 21 juin dernier, Matt Cutts a répondu à un tweet sur le spam relatif aux prêts sur salaire par une information inhabituelle (rapporté sur Search Engine Roundtable) :

La chronologie exacte était un peu floue, mais Matt semblait suggérer une mise à jour prolongée de l’algorithme, couvrant jusqu’à trois semaines. Quatre jours plus tard, nous avons suivi notre température la plus élevée jamais enregistrée sur WebsterdataCast, suivie par d’autres records :

Sept jours de la chronologie de « plusieurs semaines » ont montré des pics de température proches ou supérieurs à 90°, dont six ont dépassé la gravité de la mise à jour originale de Penguin.

Était-ce un problème de WebsterdataCast ?

Permettez-moi d’être parfaitement honnête : les classements Google sont une cible mouvante et le suivi des flux quotidiens s’est avéré difficile, au mieux. Une température donnée, un jour donné, est sujette à erreur. Cependant, il s’agissait d’un modèle soutenu de chiffres très élevés, et nous n’avons aucune preuve pour suggérer un pépin dans les données.

Certains rapports ont indiqué que d’autres outils ne montraient pas de pics similaires, mais certains de ces rapports étaient basés sur des comparaisons entre des pommes et des oranges. Par exemple, si vous regardez les données de flux de SERPmetrics et que vous isolez seulement la page 1 de Google (qui est ce que WebsterdataCast suit), vous verrez ceci :

Désolé, il est un peu difficile de voir les dates sur l’image réduite, mais les deux pics correspondent à peu près aux 28 juin et 4 juillet, avec une bosse plus petite le 25 juin. Bien qu’ils ne correspondent pas exactement, ces deux ensembles de données racontent certainement une histoire similaire.

S’agissait-il d’un test à grande échelle ?

C’est une question à laquelle il est beaucoup plus difficile de répondre. Notre ensemble de données bêta 10K a montré des modèles similaires sur plusieurs blocs C d’IP, nous n’avons donc aucune raison de croire que cela était spécifique à un ou quelques centres de données.

Mais que se passerait-il si Google apportait un jour un changement massif, puis revenait sur sa décision ? Théoriquement, nous verrions deux jours de températures élevées sur WebsterdataCast, mais si nous examinions le flux sur deux jours (au lieu de deux chiffres sur un jour), la température serait très basse. Bien que ce flux sur plusieurs jours soit intéressant en théorie, il peut être très difficile à interpréter dans la pratique. Certains classements changent naturellement, et Google peut lancer plusieurs petites mises à jour au cours d’une semaine donnée.

Si nous examinons le flux global entre le début et la fin des pics enregistrés (25 juin – 4 juillet), nous obtenons une température WebsterdataCast de 120,3°, à peine plus élevée que la température d’une journée du 27 juin. La température quotidienne moyenne pour cette période était de 92,5°. Examinons maintenant une période similaire (28 mai – 6 juin) : la température moyenne pour cette période était de 66,8°, et la température sur plusieurs jours pour toute la période était de 114,7°.

Si l’on compare les deux périodes, le flux global pour la période des températures record était à peu près identique au pic et environ 30 % plus élevé que la moyenne sur plusieurs jours, tandis que le flux global pour la période plus calme était 72 % plus élevé que la moyenne. C’est une science inexacte au mieux, et nous n’avons pas une bonne idée historique des tendances sur plusieurs jours, mais mon sentiment est que certaines des mises à jour sur plusieurs semaines impliquaient des changements que Google a testés et a ensuite annulés.

Qu’en est-il des PMD et des EMD ?

Dans mon billet sur la hausse de température du 25 juin, j’ai signalé une baisse notable sur une seule journée de l’influence des domaines à correspondance partielle (PMD). Cet article a été publié très tôt dans la mise à jour sur plusieurs semaines, alors examinons les données sur l’influence du PMD sur une période de 30 jours qui inclut tous les jours de forte température :

Bien qu’il y ait eu beaucoup de mouvement durant cette période, vous pouvez voir que les PMD ont récupéré une partie de leurs pertes initiales vers le 4 juillet. La tendance générale est à la baisse, mais la baisse du 25 juin ne semble pas avoir été permanente.

Il est intéressant de noter, même si cela n’est pas directement pertinent pour cette analyse, que la tendance à long terme de l’influence des PMD dans nos données est toujours nettement à la baisse. Voici un graphique qui remonte jusqu’au début de 2013 :

Comment les EMD ont-elles évolué ? Ils semblent présenter une tendance similaire, mais dans une fourchette beaucoup plus étroite. Si l’on prend le même axe Y que le graphique PMD ci-dessus, on obtient ceci :

Les données sur les EMD sont assez cohérentes avec le premier rapport du Dr Matt Peters sur notre étude des facteurs de classement de 2013. Gardez à l’esprit que nous mesurons deux choses différentes : les corrélations montrent le classement des PMD/EMD par rapport aux autres domaines, tandis que WebsterdataCast suit le nombre de PMD/EMD classés dans l’ensemble des données. Si le nombre total de PMD diminue, mais qu’ils se classent à peu près aussi bien, les corrélations resteront stables, mais la mesure de l' »influence des PMD » diminuera. En d’autres termes, les corrélations mesurent le classement des PMD, alors que WebsterdataCast mesure le nombre de PMD.

Quels sont les PMD perdus à long terme ?

Il y a une autre question que nous pouvons poser sur la baisse et la reprise de l’influence du PMD. Les PMD qui ont chuté ont-ils fini par revenir ou ont-ils été remplacés par d’autres PMD ? La mesure elle-même ne nous le dit pas, mais nous pouvons creuser plus profondément et voir qui a perdu à long terme.

Lors de la baisse initiale (entre les 25 et 26 juin), 62 PMD sont tombés de notre jeu de requêtes WebsterdataCast 1K public. De nouveaux PMD entrent toujours dans le mélange, donc la baisse nette est plus faible, mais 62 PMD qui étaient classés le 25 juin ne l’étaient plus le 26 juin. Comparons donc cette liste de 62 aux données du 5 juillet – après la reprise apparente. Le 5 juillet, 37 de ces PMD (60%) étaient revenus dans notre base de données. Cela suggère certainement un certain degré de récupération légitime.

Alors, quels PMD perdus n’ont pas été récupérés ? Voici la liste complète (les mots clés de la recherche sont entre parenthèses) :

californiacarshows.org (salons de l’automobile)
digital-voice-recorder-review.toptenreviews.com (enregistreur vocal)
fullyramblomatic-yahtzee.blogspot.com (yahtzee)
virginiamommymakeover.com (relooking de maman)
www.appliancepartscenter.us (pièces d’appareils)
www.appliancepartssuppliers.com (pièces d’appareils)
www.campagnolorestaurant.ca (campagnolo)
www.campagnolorestaurant.com (campagnolo)
www.capitalcarshows.com (expositions de voitures)
www.chicagoweddingcandybuffet.com (buffet de bonbons)
www.dollardrivingschool.com (auto-école)
www.elitedrivingschool.biz (auto-école)
www.etanzanite.com (tanzanite)
www.firstchoicedrivingschool.net (auto-école)
www.fitzgeraldsdrivingschool.com (auto-école)
www.monogrammedgiftshop.com (cadeaux monogrammés)
www.moscatorestaurant.com (moscato)
www.newjerseyluxuryrealestate.com (immobilier de luxe)
www.ocsportscards.com (cartes de sport)
www.phoenixbassboats.com (bateaux de pêche au bar)
www.rvsalesofbroward.com (rv sales)
www.sri-onlineauctions.com (enchères en ligne)
www.stoltzfusrvs.com (rvs)
www.vibramdiscgolf.com (vibram)

Mon but n’est pas de porter un jugement sur la qualité de ces domaines, mais simplement de fournir des données pour une analyse plus approfondie si quelqu’un est intéressé. Vous pouvez voir qu’il y a quelques exemples de multiples PMD tombant d’une seule requête, ce qui suggère une sorte d’action ciblée.

Comment se sont comportés les dix grands ?

Dans WebsterdataCast, nous suivons une métrique appelée « Big 10 » (j’ai fait mes études supérieures à l’Université de l’Iowa, donc j’aurais probablement dû réfléchir à deux fois à ce nom) – il s’agit juste d’un compte du pourcentage total des 10 premières positions de classement occupées par les 10 sites les plus importants un jour donné. Ces sites peuvent changer au jour le jour, mais ont tendance à être assez stables. Si l’on remonte au début de l’année 2013, on constate une nette tendance à la hausse (ce graphique commence le 8 janvier, en raison d’un problème de comptage que nous avons rencontré avec les résultats de YouTube au début de l’année) :

Les « Big 10 » ont gagné près de 2,5 points de pourcentage au cours du premier semestre de l’année. Une partie de ce gain sur l’ensemble de l’année représente un remaniement des sites dans le mélange (Twitter entre et sort du « Big 10 », par exemple, et le domaine racine d’eBay a eu des difficultés en début d’année), et une partie de ce gain est le symptôme d’autres changements. À mesure que Google devient plus agressif en matière de spam, les sites qui dominent déjà ont naturellement tendance à prendre plus de place.

J’ai pensé qu’il serait intéressant d’examiner ces chiffres en parallèle avec ceux de la PMD et de l’EMD depuis le début de l’année, mais le « Big 10 » ne semble pas nous en dire beaucoup sur la mise à jour sur plusieurs semaines. En tant que groupe, ils n’ont que très peu bougé entre le 25 juin et le 5 juillet (de 14,97 % à 15,17 %). Quoi que Google ait testé et déployé au cours de cette période, cela n’a pas considérablement avantagé les grandes marques dans notre ensemble de données.

Que s’est-il passé ensuite ?

Malheureusement, les tendances ne sont pas claires, et l’analyse des requêtes individuelles qui ont montré le plus de mouvement pendant la mise à jour de plusieurs semaines n’a pas révélé d’aperçu général. La volatilité durant cette période semble avoir été réelle, et je pense que si certains changements sont restés en place, d’autres ont été effectués et annulés. Google a peut-être testé à grande échelle des modifications d’algorithmes et les a affinées au fur et à mesure, mais la nature exacte de ces changements n’est pas claire pour le moment. Entre la mise à jour de plusieurs semaines et l’annonce par Google du lancement de Panda en 10 jours, il semble que nous allons assister à des mises à jour plus prolongées. Que ce soit pour atténuer l’impact des mises à jour d’une journée ou pour rendre le processus de mise à jour plus opaque, tout le monde le sait.

51
62