Google : "La plus grande fuite" après la divulgation de 2 500 documents

JAKARTA - Google a connu une fuite massive après que 2 500 documents internes soient apparus en ligne, révélant comment son algorithme décide ce que les utilisateurs regardent. Ces documents montrent que les systèmes qui définissent le classement des pages dans les résultats de recherche sont davantage concentrés sur le nombre de cliques reçus par le site que la source est fiable.

Selon l’expert en matière de recherche, Rand Fishkin, cela pourrait pousser les sites de fausses nouvelles ou les histoires trompeuses à aller au sommet de la recherche de Google, laissant les gens piégés dans l’acceptation d’informations moins fiables.

Google avait précédemment nié l’utilisation de taux de clics (CTR) pour améliorer les résultats de l’algorithme. Un analyste de l’équipe de recherche de Google a déclaré dans un message Reddit qu’il s’agissait « juste d’insomnie ».

Fishkin, qui travaille dans le domaine du Seo depuis plus d’une décennie, a publié un premier examen du document le lundi 27 mai qui lui a été envoyé par une source anonyme. Mike King, expert en matière de Seo et fondateur d’IplullRank, a écrit dans son analyse que « mentir » était le bon mot pour décrire cette situation.

L’algorithme de Google prend en compte plusieurs facteurs lorsqu’il affiche les résultats de recherche, y compris les mots utilisés dans les quêtes, la pertinence de la page, les connaissances de source et l’emplacement des utilisateurs, selon son site Web. Cependant, Fishkin rapporte que l’algorithme produit des résultats en se concentrant sur le nombre de cliques reçus par le site pour mesurer son succès, les données de Chrome, l’autorité de domaine et le nom d’auteur.

Dailymail.com n’a pas été en mesure de vérifier le document de manière indépendante, mais la société semble confirmer qu’il est valide, bien qu’elle affirme qu’il n’est plus pertinent.

« Nous vous avertirons de ne pas créer de suppositions inexactes sur la recherche basée sur des informations incomplètes, obsolètes ou hors contexte », a déclaré un porte-parole de Google.

Google aurait utilisé NavBoost - un système très axé sur les données de clique pour améliorer et améliorer les résultats - et inclurait des informations sur des courts clics sur le site par rapport aux utilisateurs qui séjournent plus longtemps sur une page. Cela pourrait avoir des conséquences négatives dans les prochaines élections présidentielles en laissant les fausses nouvelles se développer.

Google a également nié l’utilisation de cette méthode dans le passé, déclarant au Wall Street Journal en 2019: « Notre système vise à fournir des résultats pertinents provenant de sources autoritatives », ajoutant que les résultats de recherche organiques seules « ne représentent pas des informations rendues accessiblees par le biais de recherches ».

Si le document est exact et que l'algorithme de recherche dépend de CTR, cela pourrait avoir un impact négatif sur la prochaine élection présidentielle lorsque les gens se tourneront vers Google pour obtenir des informations supplémentaires sur les candidats.

Fishkin a averti que si les résultats de Google apparaissent sur des sites de propagande basés sur des cliques sur des liens, cela pourrait conduire à des tensions et de violence similaires aux fausses affirmations selon lesquelles l’élection de 2020 avait été volée auprès de l’ancien président Donald Trump qui a causé des milliers de personnes envahissant le Capitole le 6 janvier.