Data Science : comment la mettre en œuvre dans l’usine ?

L’avènement de la Data Science et du Machine Learning nous apportera de nombreuses opportunités de gagner en performance sur le terrain dans l’usine. Pour autant les déceptions ne sont pas rares.
Nous vous proposons dans cet article d’explorer les freins qui empêchent l’obtention de gains concrets tout en esquissant des pistes pour y remédier.


Des espoirs décalés de la réalité et pas assez d’engagement

Un des travers de la technologie en général est de laisser penser qu’elle va permettre de résoudre les problèmes simplement, sans effort. La dénomination « Intelligence Artificielle » utilisée augmente évidemment cette espérance. Le Machine Learning et la Data Science ne font pas exception. Contrairement à ce qui peut être perçu, ce ne sont pas des solutions miracles. Seules des approches structurées, orientées métier, sont susceptibles d’aboutir à des résultats concrets. Ces approches récentes, puissantes et performantes, nécessitent :

  • De disposer de données pertinentes par rapport au sujet traité, qui plus est de qualité.
  • Des compétences métier pour construire des approches qui font sens par rapport à l’objectif à atteindre.
  • Et bien sûr des compétences en Data Science / Machine Learning pour manier ces outils avec rigueur. Tout en gardant un regard critique sur les résultats obtenus.

Tout cela nécessite de l’engagement pour s’assurer que d’un bout à l’autre de la mise en œuvre de l’approche les ressources et moyens soient mis en place avec une vision systémique pour le succès de la démarche.


Pour commencer : définir l’objectif et les attendus

On ne conduit pas de projet de ce type sans un objectif et des livrables précis. La finalité d’un tel projet doit être la performance de l’usine en permettant d’actionner des leviers qui vont avoir un impact direct sur cette dernière. Il est donc primordial de constituer une équipe projet qui implique les utilisateurs finaux et ceux qui sont garants de la performance sur le périmètre envisagé pour que l’objectif soit fixé en adéquation avec leurs attentes. C’est cet objectif qui permettra de mesurer la qualité in fine de la démarche avec des métriques métier.


Construire les data-set : un travail fastidieux et chronophage

Le point de départ pour tout exercice de modélisation est de constituer un jeu de données adapté à l’objectif à atteindre. Construire un tel data-set peu prendre un temps conséquent : si l’on interroge les Data Scientistes ou Data Analystes, c’est une tâche qui peut représenter de 40 à 70% de leur temps. Les éléments qui complexifient cette tâche sont :

  • Des données éclatées dans des systèmes multiples et hétérogènes ;
  • Des données structurées à des mailles différentes et potentiellement avec des structures différentes. Par exemple, des données temporelles et des données de traçabilité ;
  • Une qualité de données incertaine ;
  • Des historiques disponibles trop petits ;
  • Etc.

Il est donc nécessaire de mettre en place des outils et une organisation pour collecter, centraliser et stocker les données dans la durée tout en proposant une structuration métier adaptée. En parallèle il faut prévoir les traitements pour les agréger de manière pertinente relativement au métier.


Développer des modèles : un travail multidisciplinaire et collectif

Développer des modèles ou des analyses pour répondre à l’objectif nécessite bien entendu des données et la mobilisation des compétences des experts en data science. Cependant, cela n’est pas suffisant. Une interaction régulière avec les experts du métier pour confronter les avancées à la réalité du terrain est indispensable pour s’assurer de l’alignement de la solution élaborée avec les besoins.
De plus, la démarche a à gagner en intégrant des regards de disciplines différentes de l’entreprise (production, R&D, méthodes, procédés, qualité, amélioration continue…). En effet, les connaissances métier sont autant d’informations qui viennent compléter celles extraites des données, et permettent ainsi de construire des modèles plus performants, pertinents et extensibles.


Mettre en œuvre les modèles sur le terrain

Construire le meilleur modèle n’a aucun sens s’il n’est pas utilisé. Pour autant, la mise en œuvre sur le terrain peut se confronter à plusieurs freins. En particulier, pour que celle-ci soit effective, il faut :

  • Disposer en continu des données d’entrée du modèle pour l’alimenter en conditions réelles ;
  • Gérer l’exécution des modèles, récupérer les résultats et les mettre à disposition des utilisateurs sous une forme qui soit compatible avec leurs usages (visualisation, alerting…) ;
  • Former les équipes terrain à l’utilisation de ces nouvelles informations, leur interprétation et aux actions à prendre en fonction des situations.

Maintenir les modèles dans la durée

Une fois le modèle en place sur le terrain, tout n’est pas fini. Il reste encore tout le travail d’ajustement pour qu’il délivre les résultats escomptés. A la fois au démarrage de son implémentation, pour s’assurer que la complexité de la réalité ne vienne pas impacter de manière négative les attentes des utilisateurs. A ce stade des aller-retours réguliers sont nécessaires pour que les objectifs soient atteints de manière fiable.

Sur le plus long terme, il est nécessaire que les équipes opérationnelles intègrent cette nouvelle composante dans leurs projets : nouvelle recette, nouveau produit, modification de la ligne de production ou des procédés… À chaque fois, il faut vérifier l’impact sur les modèles et si besoin les ajuster avec les équipes qui les ont conçus.

L’entreprise doit donc se doter des outils, se structurer et s’organiser pour être en mesure de déployer rapidement les modèles et les maintenir dans la durée pour réellement bénéficier de toute la valeur ajoutée qu’ils peuvent apporter.


En conclusion

  • Rester pragmatique en privilégiant des approches collaboratives et itératives focalisées sur l’enjeu métier à traiter.
  • Au plus tôt mettre en place les briques nécessaires pour disposer des jeux de données pour l’élaboration des modèles mais aussi des flux de données pour alimenter l’exécution du modèle en phase de run. C’est en particulier ce que permet notre Process Data Lake.
  • Avoir une approche d’amélioration continue en faisant des aller-retours entre la conception du modèle et son exécution sur le terrain pour le faire coller au mieux aux usages métier.
  • Avoir des processus clairs pour encadrer la conception et la maintenance des modèles.


Auteur : Mathieu Cura



Demandez une démo de notre solution SaaS