Grâce au machine learning, Mapado.com génère des idées de sorties qui vont vous plaire

Temps de lecture estimé : 6 minute(s)

*Attention, ce contenu a été publié il y a 2 années. Il n'est peut-être plus d'actualité.*

Trouver une activité qui sort de l’ordinaire, autour de chez soi, à l’occasion d’un déplacement professionnel ou encore à proximité de son lieu de villégiature n’est pas une chose facile. Et pour cause : les agendas locaux sont rarement exhaustifs, pas toujours accessibles sur mobile et encore moins personnalisés. Grâce aux techniques de machine learning, une startup lyonnaise a entrepris de révolutionner la fourniture d’idées de sorties. Explications avec Jerry Nieuviarts, cofondateur de Mapado.com

Grâce aux techniques de machine learning, la startup lyonnaise Mapado a entrepris de révolutionner la fourniture d’idées de sorties
Grâce aux techniques de machine learning, la startup lyonnaise Mapado a entrepris de révolutionner la fourniture d’idées de sorties

Un agenda des événements à proximité qui promet l’exhaustivité

« Ce n’est pas parce que vous avez du temps libre à occuper que vous avez du temps à perdre » : voilà résumé le crédo du site Mapado.com , cofondé par Jerry Nieuviarts en 2012, douze ans après qu’il a lancé le site Internet Clubic.com (racheté en 2008 par M6 Web) avec quatre associés.
Derrière l’idée, simple en apparence, de fournir un agenda géolocalisé des loisirs et activités culturelles et sportives — « Du concert de Ben Harper à Londres à la fête de la saucisse à Tarare, en passant par un cours d’aquabiking dans la piscine la plus proche » — se cache une grande complexité technique. « L’univers des organisateurs d’événements au sens large est très fragmenté. Nous avons identifié des dizaines de milliers de sources, qui génèrent et/ou recensent pas loin de 15 millions d’événements quand on cumule les pays francophones et anglophones que nous couvrons aujourd’hui. » Pour extraire cette folle quantité de données, Mapado a tout d’abord mis au point un outil de crawling web, soit des serveurs qui écument le web (et plus précisément le code html des sites) à la recherche d’événements à indexer. Ces serveurs sont épaulés par d’autres machines, chargées de faire ce que l’on appelle du rendering web : « Pour accéder aux informations qui ne se trouvent pas dans le code des pages visitées, mais dans des bases de données, ils miment le comportement d’un utilisateur au sein d’un navigateur web, par exemple en sélectionnant une date dans un calendrier. » Enfin, deux derniers groupes de serveurs complètent l’impressionnant dispositif. « Un cluster est utilisé pour du data mining : dédoublonner les événements et recouper les informations provenant de différentes sources pour constituer une fiche 100 % fiable, qu’il s’agisse de la localisation, des horaires ou du tarif des événements. Le second cluster est quant à lui chargé du tri et de l’enrichissement : classement des activités par catégories et par lieux, et ajout de métadonnées pour permettre des recommandations pertinentes. » Au total, ce ne sont pas moins de 20 serveurs dédiés OVH.com qui travaillent nuit et jour pour fournir les bonnes informations au bon moment aux internautes. Mais aussi aux usagers des transports en commun parisiens et niçois, puisque le groupe JCDecaux a choisi Mapado comme application exclusive de découverte des activités environnantes sur les nouvelles bornes d’abribus interactives.

Mapado apprend à connaître vos goûts et rapproche les organisateurs d’événements de leurs publics

Le business model de Mapado, dont l’application est entièrement gratuite, repose sur une offre de services à destination des professionnels. « De la même façon qu’il est difficile de trouver une activité à son goût près de chez soi, il est difficile pour les organisateurs d’un événement de savoir qui cibler pour remplir leurs salles. Or, Mapado essaye de deviner ce que les utilisateurs apprécient, consultation après consultation (1), pour leur proposer un choix en adéquation avec les activités auxquelles ils se sont précédemment intéressés. En devenant opérateur de billetterie, avec une spécialisation poussée sur le contrôle d’accès via une application mobile (Mapado Scan), nous permettons aux professionnels de mettre en avant leurs événements auprès d’un public a priori intéressé et nous récupérons une commission sur la vente des tickets. » Au total, ce sont aujourd’hui plus de 5 000 organisateurs d’événements qui utilisent la plateforme, pour l’enrichir avec leurs événements (si toutefois ceux-ci n’avaient pas été détectés automatiquement), les mettre à jour, bénéficier d’un service de multipostage gratuit sur une cinquantaine d’agendas en ligne ou profiter d’un essaimage plus large, payant cette fois. Ou encore pour recourir au système de billettique développé par Mapado, à l’instar du parc lyonnais Mini World ou de l’Association française des orchestres, qui regroupe une quarantaine de formations dont le Philarmonique de Radio France.

Jerry Nieuviarts est le cofondateur de Mapado.com.
Jerry Nieuviarts est le cofondateur de Mapado.com.

Une API pour multiplier les usages de ce gisement de données

Via une API, Mapado permet à des tiers d’exploiter son trésor de guerre, à savoir la gigantesque base de données événementielles que la startup a constituée et structurée. « Grâce à cette interface, nous fournissons par exemple à certains titres de presse quotidienne régionale des flux propres et filtrés d’événements pour remplir leurs colonnes d’agendas locaux. Nous avons également travaillé avec SNCF innovation, qui cherchait à établir un pattern pour modéliser le lien entre la fréquentation des transports et les événements organisés sur un même territoire. Beaucoup d’usages de nos données sont encore à inventer. »

Repéré en 2015 par le site de réservation en ligne Booking.com (2), Mapado compte se lancer prochainement en Amérique du Nord. La recette du succès ? Jerry Nieuviarts en dévoile peut-être l’ingrédient principal dans la bio de son compte Twitter : « One time, you are lucky, two times, you are good. » Étant donné le parcours de Jerry, jalonné de projets à succès, on est tenté d’ajouter « Three times, there is a pattern. »

Mapado s’appuie sur les serveurs OVH

Pour héberger son application web, collecter, raffiner et exploiter les millions de données nécessaires pour constituer ses agendas personnalisés, Mapado s’appuie sur des serveurs dédiés et VPS . « Notre projet est particulièrement gourmand en ressources (CPU, RAM et stockage). Nous avons plusieurs serveurs web Nginx, qui hébergent notre application développée avec le framework PHP Symfony. Mais la partie la plus intéressante se trouve côté backoffice, là où nous avons déployé une quinzaine de serveurs pour le crawling web (des VPS dotés de plusieurs adresses IP), le rendering et le data mining. Nous utilisons différents types de bases de données : MySQL (pour les comptes utilisateurs et l’application de billetterie), MongoDB (pour stocker les événements et leurs métadonnées) et Elasticsearch (pour servir la recherche d’événement par lieu, date ou mot-clé). » Ce qui a motivé le choix des serveurs OVH ? « Le ratio performances/coût, mais également les outils et services associés aux serveurs, à commencer par l’ API OVH que nous utilisons de façon intensive pour administrer les machines de façon efficace. »

(1) Mapado ne recourt pas à l’utilisation de cookies (tiers) pour personnaliser ses recommandations d’activité. Cette personnalisation démarre « à froid », et s’appuie uniquement sur les activités consultées par les visiteurs logués.

(2) Les trois start-up françaises repérées par Booking.com , L’Usine Digitale, par Lélia de Matharel le 29 mai 2015.

Copywriter at OVH.