Face à sa croissance rapide, l’équipe dirigeante a compris l’importance de l’analyse de données pour améliorer l’expérience client. La société s’est dotée d’un outil de Business Intelligence taillé pour le développement exponentiel des informations (trajets, lieux, kilométrages, tarifs, notations, profils, ancienneté, etc) . « L’objectif était d’intégrer de la BI sur les données de production reposant sur une base de données MySQL. Auparavant, l’extraction de données comportait des risques de pertes d’informations avec les mises à jour sur des tables devenues trop grosses ». Le choix s’est porté sur un cluster Hadoop Cloudera.
Techniquement, le cluster repose sur 4 machines tournant sur Debian 6 avec 64 Go de RAM et 4 To de stockage. Une capacité jugée suffisante pour encaisser les estimations de croissance annuelle de la société. La première étape a été de l’alimenter avec la récupération des données des abonnés depuis 2005. Une opération qui s’est déroulée sans difficultés, selon la team Big Data de Blablacar.
Dataiku pour la data visualisation
L’objectif de la data visualisation est de donner aux métiers des éléments visuels compréhensibles et collant à leurs besoins. Un but similaire pour les requêtes : « avant nous avions des requêtes Excel/Excel, aujourd’hui les requêtes sont automatisées avec des rapports quotidiens pour les équipes marketing. Nous pouvons aussi faire des requêtes plus fines et plus granulaires pour les métiers ». Cette automatisation des tâches a été confiée à l’offre Data Science de Dataiku, une plateforme d’analyse de données et de construction d’applications prédictives. Un POC (un prototype, NDLR) a été réalisé en mai dernier puis implémenté rapidement. Elle a été séduite par la plateforme où « des recherches peuvent être créées à partir d’un simple script Python ».
Les bénéfices de cette stratégie sont donc au rendez-vous avec une plus grande rapidité et fluidité dans les requêtes et les rapports pour les métiers. Les campagnes marketing sont plus ciblées et plus réactives, notamment sur les réseaux sociaux comme Facebook où Blablacar est très présent. Elles prennent surtout en considération la montée en puissance de la start-up avec des marchés aussi importants que l’Inde ou la Russie. Les jeux de données vont s’enrichir au fur et à mesure du développement des services. « Nous avons une solution hyper scalable », affirme la société. Les relations avec les métiers ont changé, il n’y a plus de prises de décisions sans les data.