Le gagnant d'un concours sur Kaggle, L2F, héberge son serveur de calcul chez Hosteur
Nous sommes ravis d'accueillir les chercheurs brillants et enthousiastes de L2F au sein de notre communauté ! Hosteur mettra à leur disposition un serveur puissant Dell qui leur permettra d’effectuer des calculs complexes pour leurs clients afin de mieux comprendre les données dont ils disposent et d’améliorer leur performance en analysant les résultats.
L2F utilise la modélisation topologique et statistique pour «comprendre, prévoir et finalement extraire de la valeur à partir d'ensembles de données complexes, propres à l'entreprise, dans tout le spectre des divisions d'entreprise». Ainsi, le Big Data permet aux mathématiciens de résoudre des problèmes importants auxquels leurs clients font face dans de divers domaines comme le marketing, les ventes ou les ressources humaines.
Le concours sur Kaggle
Kaggle est la plus grande communauté de science de données et de machine learning au monde. En organisant des compétitions qui posent des problèmes issus de la vraie vie, la plateforme permet à des chercheurs du monde entier de participer à des défis extrêmement compétitifs.
Après avoir fondé L2F, les jeunes chercheurs Aldo Podestà, Wallyson Lemes de Oliveira, Francesco Palma et Thomas Boys (École Polytechnique Fédérale de Lausanne) et Paolo Tournon (HEC-Paris), décident, en tant que projet initial, de participer à un concours sur Kaggle.
Le but de la compétition était de construire un modèle qui prédit la durée totale des trajets en taxi à New York. Pour ainsi faire, les participants disposaient des données publiées par la commission de Taxis et de Limousines de New York (NYC Taxi and Limousine Commission) qui comprenaient des détails sur le temps de ramassage, les coordonnées géographiques, le nombre de passagers et plusieurs autres variables.
L’équipe de L2F est sortie en tête des 1 257 équipes participant à la compétition, grâce à leur prédiction extrêmement précise de plus de 600 000 déplacements.
Nous avons eu la chance de discuter avec Aldo Podestà, un des fondateurs de L2F.
Bonjour Aldo ! Félicitations d’abord pour votre performance lors du concours sur Kaggle !
C’est une plateforme très importante pour le monde de la data science. Qu’est-ce que cette réussite veut dire pour vous et pour L2F?
Cette réussite a été pour nous une preuve concrète de notre potentiel. Elle a permit d’affirmer notre légitimité pour une place d’honneur au sein de l’innovation.
D’où vient le nom de votre start-up ? Qu’est-ce que L2F veut dire ?
L2F est un acronyme de « Learn to Forecast ». Ce dernier résume deux des points les plus importants de notre travail : le « learning », phase durant laquelle l’algorithme s’entraîne et apprend à partir des données, et le « forecasting », phase finale durant laquelle l’algorithme, une fois entraîné, produit une prédiction.
Quand un client vient à L2F avec une énorme quantité de données, comment triez-vous ce qui est important et ce qui ne l’est pas ?
Un mélange de longs « brainstorming » et pre-analyse technique permet de trier « up front » la nature même des données . Ensuite, une analyse plus approfondie révèle l’état de ces dernières, qui peuvent être plus ou moins endommagées et par conséquent plus ou moins « soignées ».
Quelle est la place de la créativité dans votre métier ?
La créativité est un agent de premier rang dans notre métier. Elle est toujours présente et ne cesse de nous démarquer par rapport aux autres. Issue de notre jeune âge mais aussi de notre diversité, elle accompagne tant bien le processus de modélisation et de recherche mathématique que le management d’entreprise.
Quels sont les problèmes (ou les objectifs) les plus récurrents pour lesquels vos clients vous contactent ?
Le panel des objectifs est très vaste. Les clients proviennent de tous les secteurs. Ce type de service est par contre une solution d’excellence, ainsi les clients vont souvent présenter des problématiques au cœur de leurs intérêts ou des fonctionnalités centrales.
Vous travaillez constamment en utilisant des algorithmes complexes pour trouver la logique derrière des données brutes. Qu’est-ce qui est compliqué pour vous ?
Ce que nous aimons est compliqué et ce qui est compliqué nous l’aimons. Le processus d’analyse est comme une aventure, à la fois une exploration et une quête de découverte riche de complications. Durant ce processus beaucoup de danger et limitations peuvent survenir, quantitatifs et qualitatifs, techniques et créatifs, c’est ce qui nous pousse à innover constamment.
Pourquoi avez-vous choisi Hosteur pour l’hébergement de votre serveur de calculs ? Quels sont les critères les plus importants pour choisir un hébergeur de qualité dans votre domaine ?
Hosteur a, dès le premier jour, compris et partagé notre enthousiasme et notre vision. Hosteur n’a pas hésité à suivre notre projet ambitieux : implémenter la plus puissante carte graphique du marché dans un serveur de calcul. Couplé à une expertise de très haut niveau, nous avons rapidement pu finaliser un serveur à la pointe de la technologie. Alors que nous étions, au départ, craintifs dans la mise en place de ce type d’infrastructure, Hosteur nous a rassuré et accompagné sans problème tout au long du setup en écoutant et, surtout, en motivant chaque étape. Ce type de relation et soutient sont les critères les plus importants pour choisir un hébergeur de qualité.