Interview croisée : Qwant et Nvidia initient les start-up au deep learning

CloudDatacentersEntrepriseManagementStart-up
intelligence-artificielle-nvidia-qwant

Eric Léandri, Président de Qwant (moteur), et Serge Lemonde, responsable du programme start-up & IA pour Nvidia en Europe, abordent leur collaboration technologique qui intègre un volet open innovation.

Qwant et Nvidia s’associent autour de l’intelligence artificielle. Le moteur de recherche d’origine français, qui se distingue de Google en refusant de tracer ses utilisateurs afin de garantir la vie privée, s’associe au spécialiste américain des GPU (cartes graphiques) dans un domaine d’extension : le deep learning (« réseaux neuronaux »).

Nvidia vient de livrer à Qwant un modèle de supercalculateur nouvelle génération DGX-1 qui permet de décupler les capacités de calcul pour des applications nécessitant l’analyse accélérée en intelligence artificielle (IA).

Chaque unité délivre des performances égales à 250 serveurs conventionnels. Elle intègre de base du matériel et des logiciels dédiés au deep learning, précise Nvidia dans sa communication.

Qwant l’a adopté pour ses besoins de sécurisation de recherche sur le Web (filtrage des contenus).

Dans les locaux parisiens de Qwant (qui a levé 18,5 millions d’euros en début d’année), nous avons rencontré Eric Léandri, Président de la société qui propose une alternative à Google dans le search (2,6 milliards de requêtes en 2016), et Serge Lemonde, DL Startups Business Director de NVIDIA pour l’Europe.

(Interview croisée réalisée le 24 avril 2017)

ITespresso.fr : Comment les chemins de Nvidia et de Qwant se sont croisés ?

Serge Lemonde : La jonction s’est fait à travers le programme Inception de Nvidia dédié aux start-up. Lancé il y a un peu moins d’un an, il porte sur l’intelligence artificielle et plus spécifiquement sur le deep learning (« réseau neuronal »).

Nous fournissons aux start-up du support technique, des tarifs préférentiels sur certains produits, etc.  Nvidia peut même aller jusqu’à investir dans les start-up. 600 start-up européennes ont intégré ce programme [2000 dans le monde, ndlr].

Nous avions déjà discuté avec Qwant de problématiques big data et de GPU classiques. Les domaines se sont ensuite étendus à l’intelligence artificielle. Nous démarrons avec Qwant le déploiement d’un supercalculateur Nvidia DGX-1 pour prototyper un réseau neuronal.

C’est une première pour un moteur de recherche en France qui exploite l’intelligence artificielle. 

Eric Landri : Jusqu’ici, nous utilisions chez Qwant des GPU classiques en provenance de Nvidia pour nos serveurs classiques. Nous faisions du deep learning grâce à cela. Mais pour changer d’échelle et accélérer nos traitements, nous avions des problèmes avec les bus PCI express et ensuite l’Ethernet pour aller récupérer les données éparpillées sur les différents serveurs.

Côté Nvidia, ils ont bien travaillé : ils ont mis une série de huit P100 [accélérateur GPU pour data center] à l’intérieur de ce super-serveur DGX-1 associés à la technologie d’interconnexion NVLink qui permet de faire passer l’information entre les accélérateurs GPU sans goulot d’étranglement.

En jouant avec ce produit vraiment top de Nvidia et en le testant sur la configuration d’infrastructure de réseau de Qwant, les performances sont impressionnantes.

La facture d’implémentation dans une infrastructure peut monter rapidement : une unité DGX-1 coûte 180 000 euros. Mais, en rajoutant quelques pétaflops et un front-end, vous arrivez rapidement à une note de 500 000 euros.

En cas de pépin, nos data scientists et chercheurs en réseaux neuronaux peuvent contacter Nvidia pour régler les éventuels problèmes.

Chez Qwant, on ne parle pas d’un pilote mais d’une vraie implémentation DGX-1 qui nous sert pour la détection du spam et les images violentes susceptibles de nuire à la qualité des résultats de recherche sur le moteur. 

nvidia-dgx-1-supercalculateur-deep-learning
NVIDIA DGX-1

ITespresso.fr : Chez Qwant, vous êtes déjà passés à l’ère du deep learning ?

Eric Landri : On a déjà fait tout le reste : le crawl, le big data et le machine learning (« apprentissage automatique », une autre branche de l’IA, ndlr]. On en fait toute la journée sans soucis.

On veut désormais aller plus loin dans la compréhension et la contextualisation des données. D’où le recours aux réseaux neuronaux dans un contexte de vie privée garantie.

Il faut bien appréhender l’accélération globale : les internautes veulent trouver une solution rapide à leurs problèmes. La façon d’apprendre via la machine va permettre de simplifier les résultats qui s’affichent à l’écran.

Serge Lemonde : La problématique de Qwant est particulière car il y a une quantité de données phénoménales, tous types de contenus confondus (vidéos, images, voix, texte…). A ma connaissance, c’est l’une des rares start-up qui doit prendre en compte tous ces éléments en cumul.

L’exercice d’intelligence artificielle doit être contextualisé, tout en prenant en compte la spécificité de Qwant : le respect de la vie privée de ses utilisateurs. C’est donc un super cas d’école à observer pour Nvidia.

Mais la collaboration avec Qwant va aller au-delà. C’est la deuxième annonce du jour…

ITespresso.fr : (roulements de tambour virtuels)

Serge Lemonde :…Qwant va mettre à la disposition de certaines start-up l’accès au DGX-1 en location pour disposer d’une puissance de calcul, de la data et des plugs d’API [connecteurs logiciels] proposés par la société.

Eric Landri : Effectivement, la machine DGX-1 est livrée avec tous les frameworks pour l’intelligence artificielle qui sont embarqués. Notre but est de promouvoir les start-up qui garantissent le respect de la vie privée et qui veulent explorer le deep learning.

ITespresso.fr : Avec quelles contreparties ?

Eric Landri : Notre offre pour les start-up est fixée à 9500 euros par mois pour accéder au DGX-1 et à nos données dans une proportion raisonnable.

Si le test se passe bien, nous serons en mesure de pousser le service BtoC sur Qwant.

C’est un moyen d’accélération qui peut aboutir à trois types de partenariats : un mode basique de collaboration win-win, un investissement financier entre 50 000 euros et 200 000 euros de notre part [de son côté, Nvidia avec son programme Inception peut pousser jusqu’à 5 millions de dollars] ou un recrutement par Qwant de l’équipe start-up si le test initié par ses soins n’est pas convaincant.

Pour cette dernière option, nous sommes sur le point de le faire avec une start-up avec laquelle nous collaborons pour Qwant Junior.

C’est une démarche d’open innovation de luxe qui évite aux start-up d’investir un demi-million d’euros dans de la puissance de calcul. 

ITespresso.fr : Du côté de Nvidia, avez-vous commencé à investir dans des start-up en France dans le cadre du programme Inception ?

Serge Lemonde : Pas pour l’instant. Le rythme est environ d’un investissement dans le monde par cycle de 8 à 9 semaines. Nous ne nous engageons pas de manière isolée. Nous sommes souvent accompagnés par des sociétés de capital-risque ou un co-investisseur (cf Techtechportal.com pour connaître les six start-up AI financées sur l’année 2016).

Au  niveau européen, nous avons déjà lancé des concours. Aux Etats-Unis, nous avons notre convention annuelle GTC DC (GPU developer conference) où nous accordons traditionnellement un espace pour les start-up en compétition. Nous allons le renommer Inception mais c’est le même principe que le programme. Nous disposons d’une déclinaison GTC en Europe.

Aux Etats-Unis, nous venons de pitcher de start-up inscrites dans le programme Inception (cf VentureBeat). Nous organisons aussi de manière régulière des concours avec des start-up sur un vertical spécifique comme le retail.

ITespresso.fr: Nvidia et Qwant collaborent-ils avec des incubateurs ou des accélérateurs en France ?

Serge Lemonde : C’est effectivement un nouveau pan pour Nvidia et ça a démarré en Europe. Nous accompagnons une série de start-up déjà mâture à travers le programme Inception Connect en fonction de verticaux déterminés (l’industrie pharmaceutique par exemple).

C’est l’occasion pour ces start-up sélectionnées de rencontrer des clients grands comptes avec lesquels nous collaborons. Les pitches sont adressés sous forme de business case. Nous y associons toujours un partenaire OEM de type HP ou Dell capable de déployer la solution de la start-up dans une grande entreprise intéressée. Nous travaillons aussi avec un cabinet de recrutement de renommée internationale pour cet événement.

Nous avons aussi des programmes plus académiques avec des universités. Certaines d’entre elles disposent eux-même de programmes start-up.

Eric Landri : Du côté de Qwant, nous travaillons avec l’INRIA et l’IRCAM et les start-up qui en sortent. Nous travaillons aussi avec la French Tech et l’écosystème d’innovation en Allemagne.

Mais aussi avec la technologie spatiale autour des données et photos satellite de la Terre. Avec le deep learning, nous décryptons les images. Par exemple, comment détecter un incendie en forêt qui se déclare ? Ou dans quelle mesure la terre est rongée par la mer ?

A une moindre échelle que Google, nous essayons de combiner les technologies des start-up avec la nôtre pour proposer quelque chose de nouveau.

Globalement,  on observe que les universités rencontrent régulièrement un écueil pour monter des projets H2020 (financement de projets technologiques au niveau européen) : l’accès à la donnée qui n’est pas d’origine américaine.

Comment monter des dossiers européens de financement pour des projets engageants des millions d’euros qui ont vocation à exploiter des données de Twitter (d’origine américaine) lorsque les flux sont coupés de manière unilatérale du jour au lendemain ? Cela devient difficile à justifier.

Chez Qwant, nous sommes en mesure de proposer ces données à des start-up ou à des universités, sous forme de partenariats ou de tests.

Dans la perspective de marché de la voiture connectée [un segment dans lequel Nvidia est impliqué également, ndlr], les constructeurs ou les start-up peuvent venir chez nous avec leur propre data, la « computer » chez nous puis l’intégrer dans leurs propres clients.  

ITespresso.fr : Dans la période d’effervescence liée à la campagne présidentielle, quelles propositions principales souhaiteriez-vous soumettre au prochain Président de la République ?

Eric Landri : J’en ai quelques-unes qui me tiennent à coeur mais elles ne seront pas valables a priori pour l’un des deux candidats qui restent en lice [Marine Le Pen en l’occurrence, ndlr]. Il faut davantage d’Europe pour mener des tests technologiques à grande échelle.

Rien que les marchés France et Allemagne, cela représente 170 millions de personnes. C’est la moitié de la population aux Etats-Unis. Le terrain devient déjà intéressant en termes d’intelligence artificielle.

Le deuxième point porte sur la garantie du respect de la vie privée sans freiner l’essor de l’intelligence artificielle et les investissements associés.

Certes, la concurrence entre Google et Qwant représente une vision différente du marché. Mais le problème principal n’est pas de contrer l’influence d’un Google mais de définir un marché.

Aux Etats-Unis, le gouvernement fédéral peut choisir une start-up pour s’attaquer à un gros marché au nom du Small Business Act.

En France aujourd’hui, c’est complexe de faire travailler une jeune pousse avec l’ANPE par exemple pour avancer sur la question de l’emploi.

Et l’extension éventuelle de ce marché acquis en France à une échelle européenne devient aussi difficile en raison des règles qui sont différentes dans le pays voisin.

Serge Lemonde : En représentant une société américaine, je ne vais pas aborder la question de la présidentielle en France.

Proportionnellement, je remarque que l’on a plus de start-up dédiée à l’intelligence artificielle en Europe qu’aux Etats-Unis. Les pays leaders sont l’Allemagne, la France, le Royaume-Uni, les pays nordiques et la Pologne.

A titre individuel, j’ai apprécié les efforts fournis en France et en Europe pour soutenir les start-up dédiées. Nous disposons des plus grands incubateurs dans le monde.

ITespresso.fr : Question big data : aviez-vous prédit les résultats du premier tour de l’élection présidentielle ?

Eric Landri : Naturellement, nous l’avions prédit chez Qwant (rires). J’en ai vu un millier d’applications et j’ai vraiment rigolé. Nous n’avions évidemment rien prédit et tous les autres se sont trompés.

J’ai la preuve devant moi [mon interlocuteur sourit en me montrant une app mobile développée en interne – mais non diffusée à l’extérieur – sur la foi de données issues de Twitter et Facebook].

On a mixé les canaux par candidat et par jour. On a pris en compte l’évolution des graphes des followers, les volumes de tweets, les flux RSS, l’extraction sémantique pour connaître les thèmes de discussion, les tags en fonction des programmes, les émotions dans les messages (analyse des sentiments)…

On se serait trompé également si on était parti sur le principe d’une diffusion. Une mauvaise évaluation serait retombée sur le dos de Qwant.

Que s’est-il passé avec la présidentielle ? Pourquoi on n’arrive pas à prédire les bons résultats ? Sur Twitter (que ce soit derrière des robots ou des humains), c’est toujours la même population qui parlait. Ils ont vite tous plafonné. A la fin de la journée, c’est difficile de dire qui a vraiment gagné.

On n’a pas observé de mouvement de foule. Il faudrait un pourcentage de la population sur les réseaux sociaux qui soit beaucoup plus clair, plus ouvert et plus complet comme aux Etat-Unis.


Lire la biographie de l´auteur  Masquer la biographie de l´auteur