[article de 2012]. La personnalisation des résultats de recherches est une tendance générale du moteur de recherche Google jusqu’ici peu évoquée dans ses impacts sur la pratique de l’étude scientifique des usages du web. Le moteur de recherches Google utilise pourtant un certain nombre de variables qui influent puissamment sur le parcours de navigation des internautes sur le web : la géolocalisation de certaines recherches, l’advenue du bouton +1 et surtout l’activation depuis fin 2009, par défaut, chez tous les internautes de la planète, de « l’historique de recherche ».
La personnalisation des résultats de recherches au coeur du moteur de recherche Google
Ce dernier a pour but de fournir les résultats adaptés aux préférences des internautes, « déterminées automatiquement à partir des requêtes effectuées dans le passé et des sites consultés ». C’est à l’activation de cet historique de recherche que nous nous intéresserons dans cet article. Précisément, à son impact pour la pratique de la sociologie de l’Internet aujourd’hui.
Certains analystes estimaient déjà en 2010 à 20% les différences que l’on pouvait trouver d’un internaute à l’autre dans les résultats de recherches sur Google; d’autres en minorent encore l’importance et notre propre enquête de 2011 – portant sur l’analyse d’audience de 6 sites web du secteur commercial du web, représentant 150 000 internautes mensuels – nous montre aussi un effet mineur de cet historique de recherche. Cependant, nul doute qu’il progressera en importance… Or, si on estime à 91% en France la part d’usagers pour qui Google est, parmi les moteurs de recherche, la porte privilégiée d’accès au web, l’impact de cette personnalisation qui tend à subjectiver toujours plus la pratique et représentation du web de millions d’internautes au quotidien, fractionnant le « web universel » des années 2000 en multitudes de « web singuliers », n’est pas sociologiquement anodin.
Impact de la personnalisation des recherches google sur l’e-science
Et justement, l’une des premières catégories de population touchée par l’impact de cette simple fonctionnalité de Google est celle des chercheurs en e-sciences, et particulièrement des sociologues de l’Internet : ceux qui effectuent depuis les années 2000 sur Google une sociologie des pratiques informationnelles ou encore ceux qui veulent cartographier le web selon les logiques de l’analyse des réseaux sociaux.
Si l’on prend le cas de l’analyse des réseaux sociaux web : une loi comme celle de « l’attachement préférentiel » de BARABASI est encore pertinente pour désigner le mode de construction sociale des internautes sur la toile, mais se pose aujourd’hui le problème de sa saisie par le chercheur et de sa représentation ! En effet si les cartographies sociales du web sont très usitées chez ces chercheurs (cartographies de la blogosphère ou en sociologie des controverses), leur mécanisme d’élaboration – le crawling du web – est lui directement impacté par l’action de l’historique de recherche de Google depuis 2010 : quel est alors leur degré de pertinence ?
Quelques exemples saisissants de cette distorsion entre les cartographies actuelles du web réalisées par des chercheurs au nom de cette loi de l’analyse des réseaux sociaux et la réalité des répartitions sociales sur le web issues de la personnalisation, éclairent cette situation.
Pour ce qui concerne la sociologie des usages des moteurs de recherche (ainsi que pour les spécialistes de la mesure d’audience « user-centric ») c’est la question classique de la constitution des panels d’usagers qui se repose maintenant de manière mathématique et définitive avec l’action de cet historique : quels panels d’internautes représentatifs faire parler si deux résultats sur dix sont maintenant différents par internaute en première page de résultats sur Google ?
Au final, l’activation de l’historique de recherche, par défaut sur Google depuis 2010 pour tous les internautes, à un impact majeur dans la pratique de la sociologie de l’Internet aujourd’hui ou d’une data-sociologie , en créant une réalité plurielle des SERP (Search Engine Results Page) où se superposent : le web personnalisé du chercheur, la multitude de « web singuliers » des internautes, le web « objectif » de l’historique de recherche désactivé et le web de la « totalité des web singuliers » auquel seul Google a accès en ses data-centers. La prise en compte de ce nouvel ordre numérique issu des résultats de recherches sur Google réclame au chercheur qui s’y réfère des ajustements epistemo-méthodologiques sous peine de non-sens graves dans le futur de ses productions.
[article écrit en 2012]
Originally posted 2019-01-12 13:11:46.