Ranking Predict ou le data SEO à la pointe de la recherche

Temps de lecture estimé : 3 minute(s)

Comment s’assurer à 92 % qu’une URL sera dans le top ten des recherches Google sur un sujet donné, ce en quelques minutes ? C’est toute l’ambition de Ranking Predict, un outil de data SEO conçu en open source par OVH pour accompagner la croissance du groupe et celle de ses clients.

Le positionnement des résultats lors d’une requête Google est évidemment stratégique. 91 % des clics sur le célèbre moteur de recherche s’effectuent en effet depuis la première page de résultats. Mais comment être certain d’apparaître dans ce top ten ? Quelles règles SEO sont à appliquer pour  garantir de bons résultats avec l’algorithme aussi mystérieux qu’évolutif du géant de Mountain View ? Selon Vincent Terrasi, Head Data Officer chez OVH, « le SEO a longtemps été considéré comme de la magie. Pour chaque cas, il existe au moins 500 stratégies possibles. Tout l’enjeu est de savoir assez rapidement laquelle adopter pour s’assurer une présence sur cette fameuse première page des résultats. » De là est née l’idée de concevoir un modèle capable de prédire un positionnement dans le top ten des recherches Google à une fiabilité de 92 % : Ranking Predict.

La prédiction la plus fiable possible

Vincent Terrasi est arrivé dans la famille OVH il y a deux ans pour partager son expérience dans les domaines du SEO et de la gestion de la relation client (Customer Relationship Management ou CRM). Sa rencontre avec Rémi Bacha, un Data Scientist du Groupe, passionné de SEO en poste chez OVH depuis 2012, va alors être déterminante. « Nous essayons de répondre à l’hypercroissance d’OVH. Avec 60 sites à gérer, toutes langues et toutes marques confondues, il nous  fallait vraiment un outil qui permette d’automatiser la recherche de la meilleure stratégie pour assurer le référencement naturel le plus fort possible ». Leur double approche est à la base de la conception en interne de Ranking Predict. Plutôt que de travailler à l’intuition ou au test de chacune des 500 stratégies, l’idée est de s’appuyer sur le machine learning pour obtenir la prédiction la plus fiable possible. « Le 100 % est impossible du fait d’aléas extérieurs, comme un sujet d’actualité, l’apparition d’un concurrent ou les pénalisations de Google. Mais avec un modèle efficace en moyenne à 92 %, nous nous en rapprochons fortement », poursuit Rémi Bacha.

Établir la meilleure stratégie SEO en quelques minutes

Le moteur de recherche utilisé à plus de 90 % en France est basé sur un algorithme, Google Rankbrain, et une intelligence artificielle. Le positionnement d’un résultat dépend de variables et de nombreux facteurs, comme le secteur d’activité. Si pour un client, le plus déterminant est plutôt le temps de chargement d’une page, pour un autre, cela pourrait être le champ sémantique, etc. Ranking Predict utilise donc différents outils en plusieurs étapes pour estimer toutes ces variables et établir la meilleure stratégie possible. D’abord avec Ranxplorer, pour récupérer le top 100 des mots-clés par rapport à un sujet donné. Pour chacun d’entre eux est associée l’URL de la page concernée. Des outils, comme Visibly ou Majestic, permettent alors d’établir une liste de facteurs de positionnement. Le machine learning entre ensuite en jeu pour constituer des arbres de décision (Random Forest) et définir au final la stratégie la plus appropriée en ajustant les bonnes variables.

Open source pour grandir ensemble

« Le gain potentiel de cet outil est de trois à cinq jours par projet SEO. Avec Ranking Predict, il ne faut en effet que quelques minutes pour établir la bonne stratégie. Dans un environnement aussi concurrentiel et réactif que le référencement, c’est vraiment un atout considérable », explique Vincent Terrasi, élu Personnalité Search de l’année lors de la 2e édition des SEMY Awards pour l’élaboration de cet outil. Ranking Predict a d’ailleurs été conçu en open source pour profiter de l’intelligence collective de chacun et que tout le monde puisse s’emparer de cet outil. « Une démarche qui peut sembler plutôt originale dans le secteur, mais qui se justifie par l’envie d’OVH d’être en évolution constante et d’aider ses clients à grandir avec lui », souligne-il, avant de conclure : « nous avons la chance que le Groupe nous ait fait confiance. Depuis, l’outil a été largement copié et nous travaillons actuellement sur une deuxième version, qui prendra en compte encore plus de paramètres et qui sera accessible à davantage de monde grâce à une API ».