Gracias al aprendizaje automático, Mapado.com genera propuestas de actividades para todos los gustos

No resulta fácil encontrar una actividad que rompa la rutina cerca de casa o del lugar que hemos escogido para pasar las vacaciones, o simplemente durante un viaje de negocios. Las agendas locales rara vez son exhaustivas y menos aún personalizadas, y no siempre se puede acceder a ellas desde un móvil. Gracias a las técnicas de aprendizaje automático, una startup francesa revoluciona la propuesta de actividades para los usuarios. Jerry Nieuviarts, cofundador de Mapado.com, nos comenta al respecto.

Una agenda de eventos próximos que promete ser exhaustiva

«Que tenga tiempo libre no significa que tenga tiempo que perder»: así se resume el eslogan del sitio web de Mapado.com, cofundada por Jerry Nieuviarts en 2012, doce años después de lanzar clubic.com (adquirida en 2008 por M6 Web) en colaboración conjunta con cuatro asociados.

Tras la idea, en apariencia simple, de proporcionar una agenda geolocalizada de actividades recreativas, culturales y deportivas —«desde el concierto de Ben Harper en Londres hasta la fiesta de la salchicha en Tarare, incluyendo un curso de aquabike en la piscina más cercana»— se oculta una gran complejidad técnica. «El universo de los organizadores de eventos está muy fragmentado. Hemos identificado decenas de miles de fuentes, que generan o recogen cerca de 15 millones de eventos si sumamos los países de habla francesa e inglesa que ya abarcamos». Para extraer esta inmensa cantidad de datos, Mapado ha desarrollado una herramienta de web crawling, o sea, servidores que rastrean la red (específicamente el código HTML de los sitios web) buscando eventos para indexarlos. Estos servidores están respaldados por otras máquinas encargadas de hacer lo que llamamos rendering web: «Para acceder a la información que no se encuentra en el código de las páginas visitadas, sino en bases de datos, simulan el comportamiento de un usuario en un navegador de internet, por ejemplo seleccionando una fecha en un calendario». Para terminar, dos últimos grupos de servidores completan el impresionante dispositivo. «Utilizamos un cluster para minería de datos: eliminar los duplicados de eventos y cotejar la información procedente de distintas fuentes para formar una ficha 100 % fiable en cuanto a la localización, los horarios o el precio de los eventos. Un segundo cluster, a su vez, se encarga de la clasificación y el enriquecimiento: clasificación de las actividades por categoría y por lugar, e incorporación de metadatos para efectuar las recomendaciones». En total, hay no menos de 20 servidores dedicados de OVH trabajando día y noche para brindar a los usuarios la información correcta en el momento adecuado.

Mapado aprende a conocer las preferencias de los usuarios y pone en contacto a los organizadores de eventos con su público

El modelo de negocio de Mapado, cuya aplicación es totalmente gratuita, se basa en una oferta de servicios diseñada para profesionales. «Para los usuarios resulta difícil encontrar una actividad atractiva cerca de casa, y otro tanto para los organizadores de eventos, que no saben cómo llenar las salas. En este sentido, Mapado intenta adivinar, a través de numerosas consultas (1), lo que les gusta a los usuarios, con el fin de ofrecerles una selección que se ajuste a las propuestas por las que se han interesado anteriormente. Mediante la distribución de entradas y la especialización en el control de accesos a través de una aplicación móvil (Mapado Scan), permitimos a los profesionales que destaquen sus eventos ante un público previamente interesado, y cobramos una comisión por la venta de entradas». En la actualidad, más de 5 mil organizadores de eventos utilizan la plataforma para enriquecer las propuestas que no han sido detectados automáticamente, actualizarlas, disfrutar de un servicio gratuito de publicación múltiple en medio centenar de agendas online, o de un proyecto derivado más amplio, de pago. O inclusopara recurrir al sistema de venta de entradas desarrollado por Mapado, como han hecho el parque de Mini World de Lyon o la asociación francesa de orquestas, que agrupa a cuarenta formaciones, incluida la Filarmónica de Radio France.

Jerry Nieuviarts, confundador de Mapado.

Una API para multiplicar los usos de esta mina de datos

Mediante una API, Mapado ofrece a terceros la posibilidad de explotar su tesoro de guerra, es decir, la inmensa base de datos de eventos que la startup ha recopilado y estructurado. «Gracias a esta interfaz, proporcionamos por ejemplo a algunos diarios regionales, flujos limpios y filtrados de eventos para llenar sus columnas de agendas locales. De igual manera, hemos trabajado con SNCF Innovation, que quería establecer un patrón para el vínculo entre la afluencia de transporte y los eventos organizados en un mismo territorio. Y aún se pueden concebir otros usos con nuestros datos».

Detectado en 2015 por el sitio de reservaciones online Booking.com (2), Mapado visualiza su próximo lanzamiento en Norteamérica. ¿La clave del éxito? Jerry Nieuviarts revela que quizás sea su ingrediente principal en la biografía de su perfil de Twitter: «Una vez es suerte, dos veces, talento». Del recorrido de Jerry, colmado de proyectos exitosos, solo podemos añadir «Tres veces, hay un patrón».

Mapado se basa en los servidores de OVH

Para alojar su aplicación web, recopilar, refinar y explotar los millones de datos necesarios para constituir sus agendas personalizadas, Mapado se basa en servidores dedicados y VPS. «Nuestro proyecto consume una gran cantidad de recursos (procesador, RAM y almacenamiento). Disponemos de numerosos servidores web Nginx, que alojan nuestra aplicación desarrollada con el framework PHP Symfony. Pero la parte más interesante es la del backoffice, donde hemos desplegado quince servidores para el rastreo de red (VPS con varias direcciones IP), el renderizado y la minería de datos. Utilizamos distintos tipos de bases de datos: MySQL (para las cuentas de usuario y la aplicación de venta de entradas), MongoDB (para almacenar los eventos y sus metadatos) y Elasticsearch (para entregar la búsqueda de eventos por lugar, fecha o palabra clave)». ¿Por qué los servidores de OVH? «La relación rendimiento-precio, pero también las herramientas y servicios asociados a los servidores, empezando por la API de OVH que explotamos al máximo para administrar las máquinas de forma eficaz».

(1) Mapado no recurre al uso de cookies (de terceros) para personalizar sus propuestas de actividades. La adaptación se efectúa «en frío» y se basa únicamente en las actividades consultadas por los visitantes registrados.

(2) Las tres start-ups francesas detectadas por Booking.com, La fábrica digital, por Lélia de Matharel el 29 de mayo de 2015, en francés.

Artículo siguiente

Una ojeada a la actualidad de OVH
Mi cuenta de clienteContact SalesWebmail OVHcloud Blog

¡Bienvenido/a a OVHcloud!

Identifíquese para contratar una solución, gestionar sus productos y servicios, y consultar sus pedidos

Conectar