SHAP erklärt: Wie KI Ihren Ingenieuren genau sagt, warum sie einen Alarm ausgelöst hat
SHAP erklärt: Wie KI Ihren Ingenieuren genau sagt, warum sie einen Alarm ausgelöst hat
„Weil das Modell es gesagt hat" reicht nicht
Stellen Sie sich folgendes Gespräch bei Ihrer morgendlichen Instandhaltungsbesprechung vor:
„Die KI sagt, wir sollen das Lager an Motor 12B tauschen."
„Warum?"
„Weil die Modellkonfidenz bei 91 % liegt."
„91 % wovon? Was ist tatsächlich los? Ist es Schwingung? Temperatur? Ist es überhaupt ein Lager oder könnte es Ausrichtung sein?"
Stille.
Das ist der Moment, in dem die meisten KI-gestützten Instandhaltungstools die wichtigsten Personen verlieren: die Reliability Engineers, die letztlich die Entscheidung treffen müssen. Und sie haben recht, kritisch nachzufragen. Jahrzehntelange Erfahrung sagt ihnen, dass eine Zahl ohne Kontext nutzlos ist — oder schlimmer noch, gefährlich.
Das Vertrauensproblem ist real
Reliability Engineers sind nicht stur, wenn sie Blackbox-KI ablehnen. Sie handeln verantwortungsvoll. Sie wissen:
- Ein Modell, das mit begrenzten Daten trainiert wurde, kann falsche Muster lernen
- Sensordrift, Kalibrierungsfehler und Prozessänderungen erzeugen Fehlsignale
- Die Kosten einer falschen Abstellung können Zehntausende Euro pro Stunde betragen
- Die Kosten eines übersehenen Ausfalls können noch höher sein
Wenn also ein KI-System „Fehler erkannt" meldet, ohne seine Begründung zu erklären, wird es ignoriert. Studien zur Einführung von Predictive Maintenance zeigen konsistent dasselbe: Die Technologie ist nicht der Engpass — das Vertrauen ist es. Ingenieure müssen das „Warum" verstehen, bevor sie auf das „Was" reagieren.
Genau dafür wurde SHAP entwickelt.
Was SHAP tatsächlich ist
SHAP steht für SHapley Additive exPlanations. Der Name stammt von Lloyd Shapley, einem Wirtschaftsnobelpreisträger, der ein grundlegendes Problem der Spieltheorie gelöst hat: Wie verteilt man den Ertrag einer Teamleistung fair auf die einzelnen Mitwirkenden?
Auf maschinelles Lernen angewendet ist das „Team" die Menge der Eingabemerkmale (Sensorwerte, berechnete Kennzahlen), und der „Ertrag" ist die Vorhersage des Modells. SHAP beantwortet die Frage: Wie viel hat jedes Merkmal zu genau dieser Vorhersage beigetragen?
Eine einfache Analogie: Stellen Sie sich vor, Ihre Anlage hätte einen perfekten Tag — null Anomalien, alles läuft einwandfrei. Das ist Ihre Baseline. Nun ändert sich etwas: Schwingung steigt, Temperatur steigt, Strom wird unregelmäßig. SHAP fragt für jede dieser Änderungen: „Wenn wir dieses eine Merkmal auf seinen Normalwert zurücksetzen, wie stark würde sich die Vorhersage ändern?" Dies geschieht für jedes Merkmal und jede Merkmalskombination und ergibt einen präzisen Beitragswert für jedes einzelne.
Das Ergebnis ist kein vages „Diese Merkmale sind generell wichtig." Es ist spezifisch für diese Vorhersage, diese Maschine, diesen Moment: „Vibration RMS trug +0,34 zur Fehlervorhersage bei. Temperaturdifferenz trug +0,21 bei. Drehzahl-Standardabweichung trug -0,05 bei und wirkte tatsächlich gegen die Fehlervorhersage."
Das ist keine Blackbox. Das ist ein Diagnosebericht.
Ein SHAP-Waterfall lesen: Beispiel Lagerfehler
Gehen wir eine reale Vorhersage durch. Das Modell hat einen Lagerfehler an einer Kreiselpumpe mit 87 % Konfidenz gemeldet. Sechs Merkmale haben die Vorhersage bestimmt. Hier ist das SHAP-Waterfall:
Basiswert (gesunder Durchschnitt): 0.12
───────────────────────────────────────────────
vibration_x_rms ████████████████░ +0.34
temperature_delta ██████████░ +0.21
current_kurtosis █████░ +0.12
flow_rate_mean ██░ +0.04
rpm_std ▓░ -0.05
pressure_slope ▓▓░ -0.08
───────────────────────────────────────────────
Endvorhersage: 0.70
(87 % Fehlerwahrscheinlichkeit nach Sigmoid)
Von oben nach unten gelesen:
vibration_x_rms (+0,34): Dies ist der stärkste Treiber. Der Radialschwingungs-RMS hat sich über das hinaus erhöht, was das Modell unter den aktuellen Betriebsbedingungen als normal für diese Maschine betrachtet. Nicht einfach „über dem Schwellenwert" — über der gelernten Baseline für genau diese Pumpe bei dieser Drehzahl und Last. Ein erfahrener Ingenieur würde bei diesem Befund sofort an mechanische Lockerheit, Unwucht oder Lagerdefekt denken.
temperature_delta (+0,21): Dies ist nicht die absolute Temperatur — sondern die Differenz zwischen Lager- und Gehäusetemperatur. Eine wachsende Differenz bedeutet, dass das Lager mehr Wärme erzeugt als es sollte. Dies schließt Umgebungstemperaturänderungen aus und deutet auf innere Reibung hin.
current_kurtosis (+0,12): Kurtosis misst die „Spitzigkeit" des Motorstromsignals. Erhöhte Kurtosis bedeutet kurze, scharfe Stromschwankungen — die Art, die entsteht, wenn ein beschädigtes Lager zeitweise hakt und der Motor in kurzen Stößen stärker arbeiten muss. Normale Kurtosis liegt nahe 3,0 (Gauß-Verteilung); der Motor dieses Lagers zeigt 4,8.
flow_rate_mean (+0,04): Ein kleiner positiver Beitrag. Der Durchfluss ist leicht gesunken, konsistent mit erhöhtem mechanischen Widerstand in der Pumpe — aber allein nicht ausreichend, um etwas zu melden.
rpm_std (-0,05): Hier wird es interessant. Der negative Wert bedeutet, dass dieses Merkmal gegen die Fehlervorhersage wirkt. Die Drehzahl ist stabil, was dem Ingenieur sagt: Dies ist kein Antriebsproblem, kein VFD-Problem und keine Lastvariation. Die Motordrehzahl ist konstant. Das hilft tatsächlich, die Diagnose einzugrenzen — das Problem liegt nach dem Antrieb.
pressure_slope (-0,08): Der Drucktrend am Auslass ist flach. Auch dies ist ein Hinweis gegen bestimmte Fehlermodi (wie Laufraderosion oder Kavitation, die Druckänderungen zeigen würden). Das Modell berücksichtigt dies — es betrachtet nicht nur, was auffällig ist, sondern auch, was normal ist.
Zweites Beispiel: Statorwicklungsfehler am Motor
Lagerfehler sind das Lehrbuchbeispiel, aber SHAP funktioniert identisch für elektrische Fehlermodi — bei denen die Merkmalsbeiträge eine völlig andere Geschichte erzählen.
Das Modell meldet Motor 22C mit 79 % Fehlerwahrscheinlichkeit. Hier ist das SHAP-Waterfall:
Basiswert (gesunder Durchschnitt): 0.15
───────────────────────────────────────────────
current_rms ██████████████░ +0.28
current_imbalance █████████░ +0.19
temperature_stator ██████░ +0.14
vibration_x_rms ██░ +0.04
power_factor ▓▓░ -0.07
rpm_std ▓░ -0.03
───────────────────────────────────────────────
Endvorhersage: 0.70
(79 % Fehlerwahrscheinlichkeit nach Sigmoid)
Das Muster ist für jeden Motorenspezialisten sofort erkennbar: strombestimmt, nicht schwingungsbestimmt. Der Strom-RMS ist erhöht, die Phasenunwucht wächst (was auf asymmetrischen Wicklungswiderstand hindeutet), und die Statortemperatur steigt — ein klassischer früher Windungsschluss. Gleichzeitig sind Schwingung und Drehzahl im Wesentlichen normal, was mechanische Ursachen ausschließt.
Ohne SHAP würde der Alarm lauten: „Anomalie an Motor 22C erkannt." Der Ingenieur würde standardmäßig das Lager prüfen (der häufigste Fehlermodus). Mit SHAP geht er direkt zur elektrischen Prüfung — Isolationswiderstandsmessung, Stoßvergleichstest und Thermografie der Wicklung — und spart Stunden fehlgeleiteter Untersuchung.
Dieses Beispiel verdeutlicht einen entscheidenden Punkt: SHAP sagt Ihnen nicht nur, dass etwas nicht stimmt, sondern welche Art von Problem vorliegt, und lenkt den Diagnoseworkflow, bevor ein Techniker überhaupt zur Maschine geht.
SHAP im Vergleich zu anderen Erklärungsmethoden
SHAP ist nicht der einzige Ansatz für ML-Erklärbarkeit, hat aber spezifische Vorteile im industriellen Einsatz. LIME (Local Interpretable Model-agnostic Explanations) approximiert das Modell lokal mit einem einfacheren linearen Modell. Es ist schneller zu berechnen, aber weniger präzise — LIME-Attributionen können bei derselben Vorhersage zwischen Durchläufen variieren, was in einem Instandhaltungskontext, in dem Konsistenz entscheidend ist, das Vertrauen untergräbt. Attention Weights aus Transformer-Modellen zeigen, auf welche Zeitschritte das Modell fokussiert hat, liefern aber keine merkmalsbezogene Attribution — Sie wissen wann das Modell hingeschaut hat, aber nicht was es gesehen hat. SHAP liefert exakte, deterministische, merkmalsbezogene Beiträge auf spieltheoretischer Grundlage und ist damit die stärkste Wahl, wenn Ingenieure wiederholbare, nachprüfbare Erklärungen benötigen, auf die sie handeln können.
Was das in der Praxis bedeutet
Ein Ingenieur, der diese SHAP-Aufschlüsselung liest, zieht denselben Schluss wie bei einer manuellen Schwingungsanalyse — aber in Sekunden statt Stunden:
- Erhöhte Radialschwingung + Lagertemperaturanstieg = mechanischer Lagerdefekt
- Strom-Kurtosis bestätigt intermittierenden mechanischen Widerstand
- Stabile Drehzahl schließt Antriebs-/Elektroprobleme aus
- Stabiler Druck schließt hydraulische/Kavitationsprobleme aus
- Wahrscheinlichste Diagnose: Außenringdefekt, frühes bis mittleres Stadium
Sie haben nun eine spezifische, prüfbare Hypothese. Sie können eine Ultraschallinspektion planen, das Schwingungsspektrum auf Lagerdefektfrequenzen (BPFO) prüfen und eine datenbasierte Entscheidung über den Interventionszeitpunkt treffen.
Vergleichen Sie dies mit „Anomalie erkannt, Konfidenz 87 %." Es ist der Unterschied zwischen verwertbarer Information und Rauschen.
Warum Werksleiter sich dafür interessieren sollten
Erklärbarkeit ist nicht nur ein technisches Komfortmerkmal. Für Werksleiter und Betriebsleiter erfüllt die SHAP-Attribution drei kritische Geschäftsfunktionen:
Nachvollziehbarkeit. Jede Vorhersage enthält einen vollständigen Nachweis dessen, was sie ausgelöst hat. Wenn die Geschäftsleitung fragt „Warum haben wir Linie 3 am Dienstag abgestellt?", lautet die Antwort nicht „Die KI hat es uns gesagt." Sie lautet: „Der Lagerschwingungs-RMS lag beim 2,3-Fachen der Baseline, die thermische Differenz stieg um 0,4 Grad pro Tag, und die Strom-Kurtosis deutete auf intermittierenden mechanischen Widerstand hin — konsistent mit einem Außenringdefekt, der bei der Inspektion bestätigt wurde." Das hält jeder Überprüfung stand.
Compliance und Normen. ISO 55000 (Asset Management) und ISO 27001 (Informationssicherheit) betonen beide dokumentierte Entscheidungsprozesse. Die SHAP-Attribution liefert Ihnen maschinell generierte, zeitgestempelte Dokumentation für jede Instandhaltungsentscheidung, an der KI beteiligt war. Wenn der Auditor fragt, wie Ihre KI funktioniert, können Sie genau zeigen, was sie berücksichtigt und warum.
Reduzierte Fehlalarmkosten. Wenn Ingenieure den Alarmen vertrauen — weil sie die Begründung überprüfen können — handeln sie schneller und präziser. Kein „Der-Junge-der-Wolf-rief"-Effekt mehr, bei dem berechtigte Alarme abgewiesen werden, weil das System einen Ruf für Fehlalarme hat. Jeder Alarm kommt mit seinem eigenen Beleg, und Ingenieure können schnell zwischen einem echten Degradationsmuster und einer Sensorstörung unterscheiden.
Wie Prevly dies umsetzt
Bei Prevly ist SHAP kein Zusatzmodul und kein Premium-Feature. Jeder Anomalie-Alarm und jede RUL-Vorhersage (Restnutzungsdauer) enthält automatisch die wichtigsten beitragenden Merkmale mit ihren SHAP-Werten. Die Waterfall-Visualisierung ist in die Alarmdetailansicht integriert — Ingenieure sehen sie, sobald sie einen Alarm öffnen.
Das System berechnet die SHAP-Attribution in Echtzeit mit demselben Modell, das die Vorhersage generiert hat. Es gibt keine separate Erklärbarkeits-Pipeline, die gepflegt werden muss. Und da Prevly eine eigene Baseline pro Maschine lernt, spiegeln die SHAP-Werte wider, was für genau dieses Asset abnormal ist — nicht irgendeinen generischen Schwellenwert aus einem Normenwerk.
Für Teams, die tiefer einsteigen möchten, ist der vollständige SHAP-Merkmalsvektor über die API verfügbar und ermöglicht die Integration in bestehende CMMS-Workflows, eigene Dashboards oder Root-Cause-Analyse-Tools.
Vertrauen ist die Voraussetzung
Das beste ML-Modell der Welt ist wertlos, wenn niemand auf seine Ergebnisse reagiert. SHAP überbrückt die Lücke zwischen dem, was KI erkennen kann, und dem, was Ingenieure tatsächlich vertrauen. Es verwandelt eine Vorhersage in ein Gespräch — eines, in dem die KI ihre Arbeit zeigt und der Ingenieur entscheidet, was damit zu tun ist.
Das ist nicht KI, die Expertise ersetzt. Das ist KI, die Expertise mit Geschwindigkeit und Konsistenz ergänzt.
Starten Sie eine kostenlose Testphase auf prevly.org und erleben Sie erklärbare KI-Vorhersagen für Ihre eigenen Anlagendaten. Jeder Alarm liefert das „Warum" gleich mit.
Weiterführende Artikel: Restlebensdauer-Vorhersage erklärt · Warum Schwellenwert-Alarme versagen · Vom Sensor zur Vorhersage