Sébastien Corniglion, DSTI : « Former des data scientists prêts à l’emploi »

Jeune entreprise de formation et d’enseignement supérieur, Data ScienceTech Institute (DSTI) veut former des data scientists qui répondent à la demande de multicompétence du marché. Les explications de son co-directeur général, Sébastien Corniglion.

Data ScienceTech Institute (DSTI) est une entreprise privée de formation professionnelle et d’enseignement supérieur lancée à l’initiative des cofondateurs de la société de services informatiques pour PME makeITdynamic. En marge du salon Big Data 2015, le co-directeur général de DSTI, Sébastien Corniglion, présente les masters MSc Data Scientist Designer et MSc Executive Big Data Analyst proposés, et précise les ambitions de l’institut sur un marché déjà encombré.

Silicon.fr : Pallier le déficit de compétences et pourvoir aux besoins de makeITdynamic a-t-il motivé la création de Data ScienceTech Institute (DSTI) en 2013 ?
Sébastien Corniglion
Sébastien Corniglion : DSTI doit sa naissance à deux facteurs : les difficultés rencontrées lors d’un recrutement de talents en quadri-compétence pour makeITdynamic, notre SSII fondée en juin 2013 (ndlr: Sébastien Corniglion et Léo Souquet ne sont plus ses dirigeants). Et notre expérience d’enseignants du supérieur. Dans ce cadre aussi nous avons noté un manque de formation en quadri-compétence.

Des formations Big Data existent ailleurs, du MS Big Data de Télécom ParisTech au cursus spécialisé « Big Data et Business Analytics » de HEC. Comment se distingue un nouvel entrant comme DSTI sur ce marché ?

Le cursus MS de Télécom ParisTech se rapproche du MSc Data Scientist Designer de DSTI, et celui de CentraleSupélec Essec du MSc Executive Big Data Analyst. Quant à la proposition de HEC au sein d’une option de quelques dizaines d’heures dans leurs programmes MBA, elle sera plutôt destinée à sensibiliser les futurs dirigeants aux enjeux de la Data Science et du Big Data… Télécom ParisTech propose un enseignement de haut niveau et proche de celui de l’institut sur les piliers “Systèmes d’Information” et “Machine/Deep Learning”. Mais on ne retrouve ni l’exposition aux applications métiers du pôle Business & Management de DSTI, ni le pilier “Éthique et Droit” pour sensibiliser ces ingénieurs aux règles du jeu de l’écosystème… Je pense, par exemple, aux difficultés rencontrées par la Direction générale des finances publiques (DGFiP), avec la CNIL, pour lancer le prototype de leur outil d’analyse Big Data visant à identifier la fraude à la TVA, et ce malgré le contexte de disette budgétaire… De son côté, CentraleSupélec Essec propose un parcours à “tracks” qui oriente, après un tronc commun de fondamentaux, vers une vision plus “science” ou plus “analyste”. Mais encore une fois, la quadri-compétence – notamment l’éthique et le droit – n’est pas toujours couverte.

DSTI se distingue donc par la quadri-compétence, l’intensité des programmes et l’approche industrielle de l’enseignement. Les visiting professors sont recrutés dans deux viviers : l’industrie, avec une expérience de l’enseignement, et le monde académique, avec une expérience des collaborations industrielles (brevets, projets..). Cette volonté de se tourner vers les professionnels du secteur se retrouve dans la forme même du MSc Data Scientist Designer, qui peut être suivi en initial comme en alternance, notamment via le contrat de professionnalisation ou le congé individuel de formation en alternance. Les entreprises veulent pouvoir maintenir leurs ingénieurs en activité durant leur phase de spécialisation et/ou de reconversion. L’institut maintient donc l’ensemble de ses étudiants dans un contexte professionnel. Tous les cours sont dispensés sur la base d’un mini-projet “fil rouge” proposé par l’enseignant et validé par le conseil scientifique et pédagogique. Les cours feront l’objet d’une note et d’un “bilan de compétences”, ce qui permettra aux étudiants comme aux recruteurs de connaître leurs points forts et leurs points faibles, et de faciliter le processus de recrutement.

DSTI se distingue aussi par son cycle d’admission et ses valeurs, qui se concentrent sur les compétences des candidats en plaçant l’humain au premier plan. DSTI invite un étudiant par programme sur mérite académique, et offre des bourses à 50% sur des thèmes tels que la présence des femmes en Data Science ou celle des étudiants de pays émergents. Les titulaires d’un bac+5, les personnes en reconversion, les titulaires de diplômes de niveaux moindres (bac+4 voire +3), qui possèdent de nombreuses années d’expérience professionnelle et disposent d’une formation initiale avec les connaissances nécessaires en mathématique, peuvent candidater. L’institut considère que l’expérience métier est tout aussi importante qu’un diplôme.

À quel public s’adressent vos formations MSc Data Scientist Designer et MSc Executive Big Data Analyst ? Quel est leur coût ?

Le MSc Data Scientist Designer s’adresse à celles et ceux qui souhaitent devenir les futurs concepteurs des outils, techniques et méthodes de la Data Science. Ils travailleront pour des entités telles que SAS et Google, mais aussi des SSII, des pure-players comme Quantmetry, des industriels tels que Thales ou des organisations du secteur public, qui ne souhaitent pas forcément externaliser cette compétence de conception pour des raisons évidentes de confidentialité. La cible est donc l’ingénieur (ou assimilé) en informatique, les électroniciens, les statisticiens, les mathématiciens ou les physiciens, ayant des connaissances de l’algorithmique et des bases de données.

Le MSc Executive Big Data Analyst, inspiré de diverses rencontres et conseils avisés du directeur du centre de recherche Inria Sophia Antipolis, s’adresse quant à lui à une population très large des diplômés des écoles de commerce (ayant le bagage mathématique suffisant), ainsi qu’aux ingénieurs qui travaillent au quotidien avec de grandes masses de données. Il s’agit ici d’apprendre quels outils, quelles méthodes, quelles techniques, peuvent être utilisés pour traiter les mégadonnées. Les étudiants apprendront notamment comment utiliser le système d’information, comprendre les algorithmes sous-jacents aux outils, les paramétrer et en expliquer les résultats, le tout au travers d’un cadre d’applications métiers et de l’écosystème éthique et juridique.

Ces deux formations coûtent 32 000 euros pour 1600 heures de cours.

Quels sont les soutiens industriels et les ressources (campus, RH…) dont dispose DSTI pour convaincre ?

La liste des partenaires industriels s’accroît mois après mois. Différents acteurs du domaine, dont SAS et ebiznext, financent des chaires d’enseignement. Les partenariats peuvent aussi se traduire par l’intervention de professeurs, la mise en place de projets pour les étudiants ou encore l’intégration d’experts au conseil scientifique et pédagogique de l’institut. On constate, par ailleurs, un apport non négligeable de candidats pour des contrats de professionnalisation.

Le corps professoral « invité » est, pour la première année des programmes, de 35 personnes en pré-recrutement (dont 70% d’internationaux). Leurs candidatures seront examinées par notre conseil scientifique le 16 avril 2015 et dévoilées peu après. Et le corps professoral socle est constitué d’une dizaine de personnes mises à disposition par SAS France, parmi lesquelles ses propres formateurs et ceux de ses clients. Quant à la gestion de l’institut, elle se répartit entre Paris et Nice Sophia-Antipolis. Le président du conseil d’administration, José Massol (Vintium International), et les directeurs généraux, Léo Souquet (en charge des relations extérieures) et moi-même (à l’enseignement et la recherche), nous déplacerons régulièrement entre les deux campus.

Lire aussi :
Big Data : ça avance… mais en ordre dispersé
Big Data : IBM, GE, SAS, Hortonworks… forment une alliance autour de Hadoop
Jeremy Harroch, Quantmetry : « Les compétences en Big Data sont rares »

Crédit Photo : lassedesignen-Shutterstock

Droit de réponse de Télécom ParisTech du 30/03/2015 : après la publication de l’entretien de Sébastien Corniglion (DSTI), Télécom Paritech a souhaité exercer son droit de réponse concernant son mastère spécialisé « Big Data » évoqué dans l’article. La rédaction publie les précisions de Stéphan Clémençon, professeur à Télécom ParisTech et responsable du MS Big Data, ci-dessous :

« Le Mastère Spécialisé « Big Data : gestion et analyse des données massives » propose une approche très large des contenus, en particulier les aspects juridiques et éthiques avec une chaire dédiée et les aspects « business » grâce à un contact très rapproché avec les entreprises. Les relations permanentes avec les entreprises permettent aux étudiants de rencontrer le maximum de professionnels et de découvrir la réalité des situations existantes. La logique du Mastère Spécialisé n’est pas de formater des pratiques professionnelles qui sont encore émergentes, mais de rester dans une démarche d’innovation où doivent persister tous les possibles.

Le Mastère Spécialisé « Big Data » a été mis en place dès septembre 2013, avec la participation d’enseignants-chercheurs de Télécom ParisTech spécialistes de domaines pointus comme le machine learning, le data mining à grande échelle, l’optimisation distribuée, les statistiques, les bases de données NoSQL… Mais au-delà de ces compétences technologiques, ce qui fait la spécificité de cette formation c’est justement son ouverture sur les besoins réels de l’économie, d’une part, et la prise en compte des aspects juridiques et éthiques, d’autre part. Le programme est élaboré au sein d’un comité de veille qui se réunit deux fois par an, en concertation avec des entreprises telles que CapGemini, Thales, Orange, Safran, SAS, Criteo, Airbus… Tout au long de l’année, ces entreprises et bien d’autres s’investissent avec des interventions hebdomadaires de professionnels issus de tous types de structures (grandes entreprises, start-up, services publics…), des « projets fils rouge » qui impliquent les étudiants sur des projets de longue durée tutorés par des entreprises, un stage et une thèse professionnelle, mais aussi au travers des données réelles fournies par les entreprises.

D’autre part, le volet « Sciences économiques et sociales » est très riche avec un cours sur l’économie de l’internet et le droit des données personnelles, un cours sur l’économétrie pour le Big Data et un cours sur l’écosystème Big Data. Ce dernier traite de la création de valeur par les données et des conditions (organisationnelles, économiques, sociales) qui permettent cette création à travers des exemples et le témoignage d’entreprises dans des secteurs très variés : transport, défense, énergie, banque/assurance, etc. En complément, des conférences sont organisées régulièrement à Télécom ParisTech, comme par exemple sur l’internet des objets et la notion de « privacy ».

Enfin, la formation s’adosse sur les compétences d’enseignants-chercheurs impliqués dans trois chaires de recherche : « Machine Learning for Big Data », « Big Data & Market Insights » et « Valeurs et politiques des informations personnelles ». Ces trois chaires comptent des partenaires de premier ordre (BNP Paribas, la CNIL, Dassault Systèmes, Voyages-sncf.com, Deloitte…) qui s’impliquent dans le Mastère Spécialisé, proposant stages, problématiques industrielles, jeux de données… Le Mastère Spécialisé Big Data de Télécom ParisTech est donc une formation complète, qui prépare pleinement les futurs data scientists à intervenir au cœur des problématiques rencontrées par les entreprises. »