SHAP expliqué : comment l'IA dit à vos ingénieurs exactement pourquoi elle a déclenché une alerte

« Parce que le modèle l'a dit » ne suffit pas

Imaginez cette conversation lors de votre réunion de maintenance du matin :

« L'IA dit de remplacer le roulement du Moteur 12B. »

« Pourquoi ? »

« Parce que la confiance du modèle est à 91 %. »

« 91 % de quoi ? Qu'est-ce qui ne va pas exactement ? Est-ce la vibration ? La température ? Est-ce vraiment le roulement ou pourrait-ce être l'alignement ? »

Silence.

C'est le moment où la plupart des outils de maintenance basés sur l'IA perdent les personnes qui comptent le plus : les ingénieurs de fiabilité qui doivent in fine prendre la décision. Et ils ont raison de résister. Des décennies d'expérience leur disent qu'un chiffre sans contexte est inutile — ou pire, dangereux.

Le problème de confiance est réel

Les ingénieurs de fiabilité ne sont pas obstinés quand ils rejettent l'IA en boîte noire. Ils sont responsables. Ils savent que :

Un modèle entraîné sur des données limitées peut apprendre de mauvais schémas
La dérive des capteurs, les erreurs de calibration et les changements de procédé créent de faux signaux
Le coût d'un arrêt erroné peut s'élever à des dizaines de milliers d'euros par heure
Le coût d'une défaillance manquée peut être encore plus élevé

Ainsi, quand un système d'IA dit « défaut détecté » sans expliquer son raisonnement, il est ignoré. Les études sur l'adoption de la maintenance prédictive montrent systématiquement la même chose : la technologie n'est pas le goulot d'étranglement — c'est la confiance. Les ingénieurs ont besoin de comprendre le « pourquoi » avant d'agir sur le « quoi ».

C'est exactement ce que SHAP a été conçu pour résoudre.

Ce qu'est réellement SHAP

SHAP signifie SHapley Additive exPlanations. Le nom vient de Lloyd Shapley, économiste lauréat du prix Nobel qui a résolu un problème fondamental de théorie des jeux : comment distribuer équitablement le gain d'un effort collectif entre les joueurs individuels ?

Appliqué à l'apprentissage automatique, l'« équipe » est l'ensemble des caractéristiques d'entrée (lectures de capteurs, métriques calculées), et le « gain » est la prédiction du modèle. SHAP répond à la question : dans quelle mesure chaque caractéristique a-t-elle contribué à cette prédiction spécifique ?

Voici une analogie simple. Imaginez que votre usine ait eu une journée parfaite — zéro anomalie, tout fonctionnait sans accroc. C'est votre référence. Puis quelque chose change : la vibration augmente, la température monte, le courant devient irrégulier. SHAP demande, pour chacun de ces changements : « Si on ramenait cette caractéristique à sa valeur normale, de combien la prédiction changerait-elle ? » Il fait cela pour chaque caractéristique et chaque combinaison de caractéristiques, produisant un score de contribution précis pour chacune.

Le résultat n'est pas un vague « ces caractéristiques sont importantes en général ». C'est spécifique à cette prédiction, cette machine, ce moment : « La vibration RMS a contribué +0,34 à la prédiction de défaut. Le delta de température a contribué +0,21. L'écart type du régime a contribué -0,05, poussant en réalité à l'écart de la prédiction de défaut. »

Ce n'est pas une boîte noire. C'est un rapport de diagnostic.

Comment Prevly applique ceci. Prevly utilise SHAP directement pour son modèle de durée de vie résiduelle à gradient boosté. Pour les modèles d'apprentissage profond — l'autoencoder LSTM qui détecte les anomalies et le CNN qui classifie les défauts de roulement — il utilise une méthode d'attribution étroitement apparentée, Integrated Gradients, qui produit le même type de décomposition de contribution par caractéristique. Le graphique en cascade et la façon de le lire sont identiques ; seule la mathématique sous-jacente diffère (valeurs de Shapley vs. gradients intégrés). Tout ce guide s'applique donc à chaque alerte Prevly, quel que soit le modèle qui l'a déclenchée.

Lire le graphique en cascade : exemple de défaut de roulement

Parcourons une prédiction réelle. Le modèle a signalé un défaut de roulement sur une pompe centrifuge avec 87 % de confiance. Six caractéristiques ont orienté la prédiction. Voici le graphique en cascade SHAP :

Valeur de base (moyenne saine) : 0,12
───────────────────────────────────────────────
vibration_x_rms     ████████████████░  +0,34
temperature_delta   ██████████░        +0,21
current_kurtosis    █████░             +0,12
flow_rate_mean      ██░                +0,04
rpm_std             ▓░                 -0,05
pressure_slope      ▓▓░                -0,08
───────────────────────────────────────────────
Prédiction finale :                     0,70
                          (87 % de probabilité de défaut après sigmoïde)

De haut en bas :

vibration_x_rms (+0,34) : C'est le principal facteur. La vibration RMS radiale a dépassé ce que le modèle considère comme normal pour cette machine dans ses conditions de fonctionnement actuelles. Pas seulement « au-dessus du seuil » — au-dessus de la référence apprise par le modèle pour cette pompe spécifique à cette vitesse et cette charge. Un ingénieur expérimenté verrait immédiatement : jeu mécanique, balourd ou défaut de roulement.

temperature_delta (+0,21) : Ce n'est pas la température absolue — c'est la différence entre la température du roulement et celle du carter. Un delta croissant signifie que le roulement génère plus de chaleur qu'il ne le devrait par rapport à son environnement. Cela exclut les variations de température ambiante et pointe vers un frottement interne.

current_kurtosis (+0,12) : La kurtosis mesure le « piqué » du signal de courant moteur. Une kurtosis élevée signifie de brèves et fortes fluctuations de courant — le type produit quand un roulement endommagé accroche par intermittence, forçant le moteur à travailler plus durement par à-coups. La kurtosis normale est proche de 3,0 (gaussienne) ; le moteur de ce roulement affiche 4,8.

flow_rate_mean (+0,04) : Une petite contribution positive. Le débit a légèrement diminué, ce qui est cohérent avec une résistance mécanique accrue dans la pompe — mais pas assez en soi pour signaler quoi que ce soit.

rpm_std (-0,05) : C'est là que c'est intéressant. La valeur négative signifie que cette caractéristique pousse à l'écart de la prédiction de défaut. Le régime est stable, ce qui indique à l'ingénieur : ce n'est pas un problème d'entraînement, de variateur ou de variation de charge. La vitesse du moteur est constante. Cela aide à affiner le diagnostic — le problème est en aval de l'entraînement.

pressure_slope (-0,08) : La tendance de la pression de refoulement est plate. Là encore, c'est une preuve contre certains modes de défaillance (comme l'érosion de la roue ou la cavitation, qui se manifestent par des changements de pression). Le modèle en tient compte — il ne regarde pas seulement ce qui ne va pas, il considère aussi ce qui est normal.

Deuxième exemple : défaut de bobinage de stator de moteur

Les défauts de roulement sont l'exemple classique, mais SHAP fonctionne de manière identique pour les modes de défaillance électriques — où les contributions de caractéristiques racontent une histoire complètement différente.

Le modèle signale le Moteur 22C avec 79 % de probabilité de défaut. Voici le graphique en cascade SHAP :

Valeur de base (moyenne saine) : 0,15
───────────────────────────────────────────────
current_rms         ██████████████░    +0,28
current_imbalance   █████████░         +0,19
temperature_stator  ██████░            +0,14
vibration_x_rms     ██░                +0,04
power_factor        ▓▓░                -0,07
rpm_std             ▓░                 -0,03
───────────────────────────────────────────────
Prédiction finale :                     0,70
                          (79 % de probabilité de défaut après sigmoïde)

Le schéma est immédiatement reconnaissable pour tout spécialiste des moteurs : dominé par le courant, pas par la vibration. Le courant RMS est élevé, le déséquilibre de phases augmente (indiquant une résistance asymétrique des bobinages), et la température du stator monte — schéma classique d'un court-circuit inter-spires en phase précoce. Pendant ce temps, la vibration et le régime sont essentiellement normaux, excluant les causes mécaniques.

Sans SHAP, l'alerte dirait « anomalie détectée sur le Moteur 22C ». L'ingénieur vérifierait par défaut le roulement (le mode de défaillance le plus courant). Avec SHAP, il passe directement aux tests électriques — résistance d'isolement au mégohmmètre, comparaison par chocs et thermographie infrarouge du bobinage — économisant des heures d'investigation mal orientée.

Cet exemple illustre un point essentiel : SHAP ne dit pas seulement que quelque chose ne va pas, il indique quel type de problème, guidant le flux de diagnostic avant même qu'un technicien ne se rende sur la machine.

SHAP par rapport aux autres méthodes d'explicabilité

SHAP n'est pas la seule approche de l'explicabilité ML, mais il présente des avantages spécifiques pour l'usage industriel. LIME (Local Interpretable Model-agnostic Explanations) approxime le modèle localement à l'aide d'un modèle linéaire plus simple. Il est plus rapide à calculer mais moins précis — les attributions LIME peuvent varier entre les exécutions pour la même prédiction, ce qui nuit à la confiance dans un contexte de maintenance où la cohérence est primordiale. Les poids d'attention des modèles Transformer indiquent sur quels pas de temps le modèle s'est concentré, mais ils ne fournissent pas d'attribution par caractéristique — on sait quand le modèle a regardé, mais pas ce qu'il a vu. SHAP fournit des contributions exactes, déterministes et par caractéristique, ancrées dans la théorie des jeux, ce qui en fait le choix le plus solide lorsque les ingénieurs ont besoin d'explications répétables et auditables sur lesquelles agir.

Ce que cela signifie en pratique

Un ingénieur lisant cette décomposition SHAP arrive à la même conclusion qu'avec une analyse de vibration manuelle — mais en quelques secondes plutôt qu'en quelques heures :

Vibration radiale élevée + élévation de la température du roulement = défaut mécanique du roulement
La kurtosis du courant confirme une résistance mécanique intermittente
Le régime stable exclut les problèmes d'entraînement ou électriques
La pression stable exclut les problèmes hydrauliques ou de cavitation
Diagnostic le plus probable : défaut de piste extérieure, stade précoce à intermédiaire

Il dispose maintenant d'une hypothèse spécifique et testable. Il peut planifier une inspection aux ultrasons, vérifier le spectre de vibration pour les fréquences caractéristiques de défaut de roulement (BPFO), et prendre une décision étayée par les données sur le moment d'intervenir.

Comparez cela à « anomalie détectée, confiance 87 % ». C'est la différence entre une information actionnable et du bruit.

Pourquoi les responsables d'usine devraient s'y intéresser

L'explicabilité n'est pas seulement une commodité pour les ingénieurs. Pour les responsables d'usine et les directeurs des opérations, l'attribution SHAP remplit trois fonctions commerciales essentielles :

Piste d'audit. Chaque prédiction est accompagnée d'un enregistrement complet de ce qui l'a motivée. Quand la direction demande « pourquoi avons-nous arrêté la Ligne 3 mardi ? », la réponse n'est pas « l'IA nous l'a dit ». C'est « la vibration RMS du roulement était 2,3 fois la référence, le delta thermique augmentait de 0,4 degré par jour, et la kurtosis du courant indiquait une résistance mécanique intermittente — cohérent avec un défaut de piste extérieure confirmé à l'inspection ». Cela tient dans n'importe quelle revue.

Conformité et normes. ISO 55000 (gestion des actifs) et ISO 27001 (sécurité de l'information) mettent toutes deux l'accent sur des processus de décision documentés. L'attribution SHAP vous fournit une documentation générée automatiquement et horodatée pour chaque décision de maintenance impliquant l'IA. Quand l'auditeur demande comment fonctionne votre IA, vous pouvez lui montrer exactement ce qu'elle prend en compte et pourquoi.

Réduction du coût des faux positifs. Quand les ingénieurs font confiance aux alertes — parce qu'ils peuvent vérifier le raisonnement — ils y donnent suite plus rapidement et avec plus de précision. Plus d'effet « cri au loup » où des alertes valides sont ignorées parce que le système a la réputation de générer des fausses alarmes. Chaque alerte est accompagnée de ses propres preuves, et les ingénieurs peuvent rapidement distinguer un vrai schéma de dégradation d'un dysfonctionnement de capteur.

Comment Prevly met cela en œuvre

Dans Prevly, SHAP n'est pas une réflexion après coup ni un module premium. Chaque alerte d'anomalie et chaque prédiction de durée de vie résiduelle (RUL) incluent automatiquement les principales caractéristiques contributives avec leurs valeurs SHAP. La visualisation en cascade est intégrée à la vue détaillée de l'alerte — les ingénieurs la voient dès qu'ils ouvrent une alerte.

Le système calcule l'attribution SHAP en temps réel en utilisant le même modèle qui a généré la prédiction. Il n'y a pas de pipeline d'explicabilité séparé à maintenir. Et comme Prevly apprend une référence distincte par machine, les valeurs SHAP reflètent ce qui est anormal pour cet actif spécifique — pas un seuil générique tiré d'un référentiel normatif.

Pour les équipes qui souhaitent aller plus loin, le vecteur complet de caractéristiques SHAP est disponible via API, permettant l'intégration avec les flux GMAO existants, des tableaux de bord personnalisés ou des outils d'analyse des causes racines.

La confiance est le prérequis

Le meilleur modèle ML du monde ne vaut rien si personne n'agit sur ses résultats. SHAP comble le fossé entre ce que l'IA peut détecter et ce que les ingénieurs accepteront réellement de confiance. Il transforme une prédiction en conversation — une conversation où l'IA montre son travail et l'ingénieur décide quoi en faire.

Ce n'est pas l'IA qui remplace l'expertise. C'est l'IA qui augmente l'expertise avec vitesse et cohérence.

Démarrez un essai gratuit sur prevly.org et découvrez des prédictions d'IA explicables sur vos propres données d'équipement. Chaque alerte est accompagnée du « pourquoi » intégré.

Lectures complémentaires : La prédiction RUL expliquée · Pourquoi les alertes de seuil échouent · Des capteurs aux prédictions