Challenge Cdiscount : le big data à la rescousse de la catégorisation des produits

Big dataData-stockageMarketing
Challenge Cdiscount-datascience.net-synthese
2 62

En mai, la marketplace Cdiscount (groupe Cnova) avait lancé un concours spécial « catégorisations & produits » pour data scientists. On a assisté à la remise des prix.

Cdiscount (groupe Cnova) vient de récompenser les lauréats d’un concours orienté big data organisé via la plateforme Datascience.net .

Le challenge avait démarré en mai et il s’est étalé sur trois mois.

Avec un thème qui tient à cœur l’e-marchand qui dispose de 13 millions d’articles dans son catalogue répartis dans plus de 6000 catégories : la catégorisation automatique des produits à partir de leur description et de leur image.

Au final, 838 participants et 3533 contributions ont été recensés dans le cadre de ce Challenge. Et le meilleur score obtenu flirtait avec les 70% de réussite (68,32739%) à partir du jeu de données fourni par Cdiscount aux participants.

Bravo à Romain Ayres (Master intelligence artificielle, UMPC et Data scientist chez Octo) qui est parvenu à se hisser en haut du podium de ce « Challenge Cdiscount-datascience.net » et qui remporte au passage une prime de 9000 euros (et une tablette Cdisplay).

Les lauréats ont été distingués hier soir à l’occasion d’une cérémonie organisée hier soir à l’espace numérique parisien NUMA.

Elle est bien loin l’époque pionnière de Cdiscount qui vendait uniquement des CD/DVD sur Internet…

Emmanuel Grenier, co-CEO de Cnova, a remercié chaudement les participants à ce challenge sur un sujet qui lui tient à cœur : les données au sens large dans une méga-base de références, leur catégorisation qui prend en compte les spécificités des produits (taille, couleur…), leur qualité et leur rigueur d’exploitation pour en tirer le meilleur bénéfice.

Le sujet se complique encore plus quand Cdiscount intègre son propre catalogue avec celui de ses vendeurs en marketplace.

« Nous effectuons 100 millions de mises à jour au quotidien. Le système est assez darwinien », constate Emmanuel Grenier.

Les problématiques big data ne manquent pas pour un poids lourd du e-commerce en France comme Cdiscount.com (2,3 milliards d’euros de volume d’affaires en 2014, 16 millions de clients) : « Comment bien classer un produit dans un moteur pour qu’il reponte bien à la demande des clients ? », « Comment rendre le moteur intelligent », « comment cibler avec l’e-mailing », « Comment travailler avec Google », la « personnalisation des offres » et « le cross-sell ».

Le big data : un sujet traité par Cdiscount depuis trois ans

Louis Albert, Directeur Marketing de Cdiscount.com, résume le cœur du challenge : « On recense 3 millions de requêtes par mois sur notre moteur interne. Avec 13 millions de produits disponibles, comment faire le matching ? »

On arrive tout de suite à la barrière des algorithmes capables de soutenir le volume des produits, tout en maintenant le degré de pertinence des résultats.

Par exemple : comment affiner la pertinence de la requête générique « ordinateur portable » qui fournit d’emblée 2600 réponses et comment distinguer les meilleures offres pour le consommateur.

Chez Cdiscount, le big data est véritablement pris en main en interne depuis trois ans.

Au nom de l’enseigne marchande, le Chief Data Scientist Matthieu Cornec (qui a pris à l’occasion la casquette de président du Challenge Datascience de Cdiscount) dispose d’une équipe de 20 data scientists doués en mathématiques et/ou en informatique.

L’approche globale du big data se résume en trois ingrédients : les outils, les compétences et la mesure de la performance des résultats obtenus (A/B testing).

Il est encore trop tôt pour savoir si ce challenge permettra d’avancer dans l’optimisation opérationnelle de la catégorisation des produits sur Cdiscount.

Des méthodes et des approches prometteuses ont émergé avec ce concours de data scientists disposant de plus ou moins d’expériences.

Mais il reste encore beaucoup de chemin à faire pour que les avancées perçues se transforment en hausse de chiffre d’affaires perceptible chez Cdiscount.com.

Car c’est bien l’objectif ultime du site marchand au-delà de la performance technologique accomplie.

Challenge Cdiscount-datascience.net
Félicitation au vainqueur du Challenge Cdiscount-datascience.net : Romain Ayres

Lire la biographie de l´auteur  Masquer la biographie de l´auteur