Lancement d’un projet de deep learning dans le domaine de la fabrication – Partie 2 : Collecte de données et établissement de la vérité terrain

Une fois qu’une entreprise a formé une équipe de projet deep learning, identifié des objectifs et sélectionné un projet pour aller de l’avant, l’étape suivante consiste à collecter des données et à vérifier la vérité du terrain.
Données absolues et relatives
Deux types de données doivent être collectés au cours de cette phase : les données d’image (absolues) et les données de processus (relatives). Les données d’image collectées par l’équipe de deep learning aident à optimiser et à entraîner le réseau neuronal sur les défauts et les déterminations de réussite/échec. Une capture d’image fiable implique, entre autres, l’identification d’une caméra avec une résolution appropriée, mais aussi la sélection et le paramétrage d’une configuration d’éclairage adéquate.
Les données de processus permettent à une entreprise développant un système basé sur le deep learning d’effectuer une optimisation avancée. Il peut s’agir de collecter des données sur le coût unitaire des fuites par rapport aux produits mis au rebut, la fréquence de réussite à l’inspection par rapport à la fréquence d’échec ainsi que la fréquence de survenue des différents types de défauts. L’équipe de deep learning doit analyser les performances du système basé sur le deep learning par rapport à la vérité terrain ainsi que les performances d’une solution existante, telle qu’une inspection manuelle, par rapport à la vérité terrain.
Maintenir un processus continu
Toutes les phases d’un projet de deep learning doivent généralement être effectuées en continu. Ce travail comprend la collecte de données d’image et de processus, la formation du modèle et la mise à jour de l’étiquetage des données.
Les entreprises ont besoin de travailleurs capables d’étiqueter de manière cohérente et fiable les défauts dans les images, de sorte que le modèle de deep learning s’améliore en termes de données de qualité. La continuité du processus de formation permet aux équipes de rationaliser la collecte et la journalisation de données précises.
Pour éviter les anomalies statistiques, les équipes doivent capturer et suivre les variations de produits, les changements de composants, la dérive de l’équipement et l’usure des outils. Conjointement, l’ensemble de l’étiquetage des images doit être réalisé de façon cohérente et non biaisée, avec des mesures indépendantes et des définitions claires. Lorsque les spécifications d’un produit changent, que de nouveaux produits sont ajoutés ou que des produits obsolètes sont supprimés, les équipes doivent mettre à jour les étiquettes d’image. Les équipes doivent également déployer un processus permettant de capturer continuellement des informations au fil du temps afin que, lorsqu’un problème survient, l’équipe puisse réagir et le corriger.
Une équipe de deep learning doit éviter d’utiliser de faux défauts dans le cadre de la formation. Les faux défauts, marquages, fissures ou rayures sur une pièce par exemple, peuvent ne pas être représentatifs des défauts réels et avoir un impact négatif sur le processus de formation. Par exemple, si un membre d’une équipe ajoute manuellement des rayures au milieu d’une pièce à des fins de test, le système commence à rechercher des défauts uniquement dans cette zone.
Parvenir à la vérité terrain
Les équipes disposent de plusieurs options pour la vérité terrain, y compris l’utilisation de résultats d’inspection manuelle industrielle. Avec cette méthode, les données sont facilement disponibles et acceptées. C’est parfois la seule option pour les pièces qui nécessitent une manipulation spéciale, par exemple l’inclinaison, dans le cadre de l’inspection. D’autre part, les résultats peuvent varier au fil du temps ou selon les inspecteurs, et certains intervenants peuvent avoir un intérêt direct dans le système actuellement en place. Cette méthode devrait être utilisée uniquement comme point de départ car les entreprises doivent investir dans la collecte et la conservation des données pour déterminer une base de référence plus précise.
Les tests Knapp peuvent aider les entreprises à classer les inspecteurs de qualité humaine en faisant passer plusieurs pièces connues — bonnes et mauvaises — devant le même groupe d’inspecteurs plusieurs fois. Dans les tests Knapp, les différents inspecteurs vérifient plusieurs fois les pièces de contrôle qui sont mélangées aux pièces de production, et les résultats de chaque personne sont compilés pour parvenir à un résultat de réussite/échec consensuel. Si cette méthode permet aux entreprises de voir quels types de défauts sont détectés de manière cohérente et quels inspecteurs sont les plus performants, elle est limitée à de petits ensembles de données. Ce processus peut également produire des résultats non représentatifs, puisque l’apparence des défauts peut être irréaliste — ou artificielle — et leur distribution sera inévitablement toujours irréaliste. Les entreprises doivent évaluer la précision et la répétabilité des inspecteurs individuels et créer des ensembles de données étiquetés initiaux pour la formation des réseaux neuronaux à l’aide d’images présentant des défauts réalistes.
Méthode | Avantages | Limites | Recommandation |
---|---|---|---|
Inspection manuelle |
|
|
|
méthode de test Knapp |
|
|
|
Enfin, une entreprise doit avoir au moins un expert de confiance ayant une connaissance intime des normes de qualité de l’entreprise pour obtenir la vérité terrain. Tout d’abord, les équipes enregistrent les images et les résultats d’inspection en cours de production par le biais d’inspections visuelles manuelle et automatisée. L’expert confirme ensuite si une détermination de réussite/échec peut être effectuée de manière fiable à partir de l’image et aide à définir une norme de qualité d’image pour l’équipe d’étiquetage, en veillant à ce que seules des données précises soient introduites dans le modèle deep learning.
Dans cet exemple, un expert de confiance intervient pour établir la vérité terrain dans une application d’inspection des soudures par points.
Les résultats de l’inspection visuelle manuelle et automatisée peuvent ensuite être comparés. Si les résultats s’alignent, l’équipe peut supposer que les décisions sont correctes et les images peuvent être ajoutées à l’ensemble de données. Si les résultats diffèrent, l’expert les examine et décide quoi faire. L’expert aide à établir une base de données d’images fiables avec des images basées sur des échantillons du monde réel dans des conditions réalistes. En outre, l’expert aide à créer des statistiques de performance fiables, y compris la distribution des défauts et les données de performance d’inspection manuelles et automatisées, tout en améliorant les processus d’inspection. L’expert fournit également des données qui peuvent être réutilisées pour de futurs projets d’automatisation. Notez que lorsque des pièces doivent être manipulées ou prises en main pour trouver des défauts, cette méthode fournira de mauvais résultats. Un autre inconvénient de cette méthode est qu’elle repose sur un seul décideur.
Dans la 3e partie, nous examinerons la phase d’optimisation.