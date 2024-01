Grâce à la formation continue, les data scientists connaissent souvent le secteur sur lequel ils exercent leur savoir-faire. Un transfert de compétences peut avoir lieu entre ancien et nouveau métier. L'autoformation reste indispensable.

De l'optimisation énergétique, avec Purecontrol ou Thrasos, à la gestion des déchets, grâce notamment à Greyparrot, en passant par la détection des fuites dans les réseaux d'eau potable et les solutions proposées par Lacroix Environnement, la majorité des domaines relatifs à la transition écologique et énergétique se sont emparés des possibilités offertes par l'intelligence artificielle pour améliorer leur process. À la manœuvre ? Les data scientists. Un profil scientifique, accessible en formation initiale ou continue, dont le travail va consister à extraire de la valeur des données, que ce soit pour travailler à la modélisation d'intelligences d'artificielles, mais aussi pour abonder des KPI ou des charts.

Formation initiale ou formation continue ?



« Après mon bac, je suis entré à l'École nationale du génie de l'eau et de l'environnement de Strasbourg, avec l'ambition de devenir ingénieur spécialisé en hydraulique. Cinq ans plus tard, je rentrais à Eau de Paris pour travailler à des missions de maîtrise d'œuvre. Sept ans après, j'y suis encore », raconte Guillaume Lellouche, maintenant data scientist chez Eau de Paris. Un profil qu'Éric Vacheret, directeur de la branche formation continue du Groupe des écoles nationales d'économie et statistique (Genes) retrouve beaucoup parmi ses étudiants : « Ceux et celles qui poussent nos portes ont généralement entre sept et quinze ans d'expérience professionnelle et un diplôme d'ingénieur ou équivalent. » Et Guillaume Lellouche de compléter : « Souvent la data science vient après la formation initiale. L'expérience a montré que les data scientists de formation initiale tendent à moins connaître le domaine sur lequel ils appliquent leur expertise. »

“ L'expérience a montré que les data scientists de formation initiale tendent à moins connaître le domaine sur lequel ils appliquent leur expertise ” Guillaume Lellouche, data scientist Une hypothèse tempérée par Maxime Carrere, dont la formation a été rythmée par une prépa à une école d'ingénieur, un master spécialisé en robotique et une thèse sur les réseaux de neurones. Chez Scalian, structure spécialisée dans le conseil et l'ingénierie informatique, depuis huit ans maintenant, Maxime Carrere défend une vision du métier basée notamment sur l'analyse des besoins et l'interaction avec le client et met en avant ses compétences de gestionnaire de projet. Il a participé jusqu'alors à un projet d'intelligence artificielle dans le domaine de l'environnement. Il s'agissait d'arriver à anticiper jusqu'à trois jours les efflorescences de cyanobactéries dans les plans d'eau.

Cultiver ses compétences

« Travailler à la modélisation hydraulique des réseaux demande de manipuler un nombre de données assez conséquent. Pour y arriver, nous utilisons deux langages, qu'on retrouve dans le domaine de la data science : R et Python », explique Guillaume Lellouche. Une compétence qui lui a permis d'opérer plus facilement sa transition entre deux environnements techniques. Le volet statistique lui a été fourni par une formation en six mois, à l'échelle d'un bloc de trois jours tous les mois, par l'Ensae – Ensai Formation continue. Éric Vacheret indique, en outre, que cette formation inclut une demi-journée consacrée aux questions éthiques et juridiques liées à la collecte et à la protection des données.

« Il y a beaucoup de thésards parmi les data scientists », explique Maxime Carrere. Des années qu'on imagine déterminantes dans la formation théorique et pratique initiale de tout jeune professionnel, et que Maxime Carrere s'emploie à actualiser en assistant à des meet'ups sur différents enjeux. « Durant mes années de formation, le deep learning en était à ses premiers succès. J'ai travaillé sur les réseaux de neurones durant ma thèse. Depuis le Perceptron multi-couche en 1957 – ancêtre des systèmes actuels, ce sujet a considérablement évolué. Rester au courant de l'actualité dans notre domaine est vital », insiste Maxime Carrere. Une remarque dans le sens de laquelle Guillaume Lellouche abonde et indique consulter beaucoup de forums et de chaînes de discussions autour des sujets mathématiques et des langages informatiques, par exemple le canal Slack public « GRRRR », consacré au langage R.