RUL予測の解説 — 監査可能な帰属分析とともに

残余耐用寿命（RUL）予測は、信頼性エンジニアが信じてはじめて有用なものになります。「この軸受はあと9日もつ」という情報は、次の質問 — なぜ？ — に肩をすくめることしかできなければ意味がありません。保守の意思決定を動かすモデルとは、その推論を示すモデルです。

この記事では、RUL予測が実際に何を出力するのか、その背後にある異常検知モデルとRULモデルがどのように機能するか、そしてなぜ監査可能な帰属分析が予測を行動に変える機能なのかを解説します。

RUL予測が出力するもの

RULとは、資産が故障または許容できない劣化の閾値を超えるまでに残されている有効寿命の推定値です — 資産に応じてサイクル・時間・日数で表されます。

優れたRUL出力は単なる数値ではありません：

トリアージのための点推定（例：「≈9日」）。
悲観的なケースに対して計画できるよう信頼区間（例：P10/P50/P90）。
どの入力がこの推定を引き下げたかを示す特徴量寄与度。

3番目の要素こそが、意思決定支援ツールをブラックボックスと区別するものです。

数値を支えるモデル

異なる課題には異なるモデルファミリーが必要です。正直な答えは、どのモデルも万能ではなく — データの形状とサンプル数によって選択するということです。

異常検知 — LSTMオートエンコーダー。 振動・プロセス信号で「これは正常ではない」を検知するために、LSTMオートエンコーダーは健全な運転のみで学習されます。正常な動作を再構成することを学習し、再構成誤差が急増すると変化が生じたことを示します。教師なしであるため、ほとんどの工場が持っていないラベル付き故障履歴がなくても機能します。（非常に小さなデータセットでは、より単純なIsolation Forestがコールドスタートのフォールバックです。GPUを持つ非常に大きなデータセットでは、TranADのようなトランスフォーマーベースの検出器が適しています。）

RUL推定 — 勾配ブースティングツリーとシーケンスモデル。 エンジニアリングされた特徴量（複数ウィンドウのローリング統計・トレンド傾き・スペクトル特徴量）から残余寿命を予測するために、勾配ブースティングツリーは強力で高速で解釈可能なベースラインです。生のマルチセンサーシーケンスが利用できる場合、調整済みLSTMが時間的劣化パターンを直接学習します：公開されているNASA C-MAPSSターボファンデータセットでは、調整済みLSTM残余耐用寿命モデルがRMSE約11.5サイクル、MAE9未満を達成します — 公開結果と比較して競争力があり、単一GPUで1分以内に学習できます。確率的な寿命曲線には、Weibull-RNNや物理情報モデル（例：Parisの法則によるクラック成長）がP10/P50/P90のバンドを追加します。

故障分類 — 1D-CNN。 何が問題か（軸受外輪・内輪・アンバランス・芯ずれ）を診断するために、高周波振動ウィンドウの1次元畳み込みネットワークが故障シグネチャを直接分類します。

重要なのは略語ではありません。これらが査読済みの状態監視研究で使用されているのと同じアーキテクチャ — 簡略化されたおもちゃではなく — であり、オンプレミスで動作するということです。

「振動異常検知LSTM」が繰り返し登場する理由

技術文献を検索すると、LSTMオートエンコーダーが振動異常検知に頻繁に登場します。3つの理由があります：

スナップショットではなくシーケンスをモデル化する。 振動は本質的に時間的です。スライディングウィンドウにわたるオートエンコーダーは、瞬間的な値だけでなく、信号がどのように変化するかをとらえます。
故障ラベルが不要。 健全なデータで学習し、逸脱を検知します。すべての故障モードを記録していない工場の現実に合致します。
閾値が調整可能。 再構成誤差は連続スコアを提供し、誤検知の許容度に合わせてアラーム閾値を選択できます。

トレードオフとして、異常スコアのみでは「何かがおかしい」とわかるだけ — 何が、どれほど緊急かはわかりません。そのため、異常検知はRULモデルと故障モデルに入力するのであって、それらを置き換えるのではありません。

帰属分析：監査可能性を生む要素

本番環境グレードのPdMを科学実験と区別する要件があります：すべての予測は特徴量ごとに説明可能でなければなりません。

ツリーベースのRULモデルでは、特徴量ごとの寄与度分析（SHAP方式の帰属）が、振動RMS・温度トレンド・圧力分散などの各入力がこの特定の予測に対して推定値をどれだけ押し上げ、または押し下げたかを正確に示します。
深層モデル（LSTMオートエンコーダー・1D-CNN）では、勾配ベースの帰属（Integrated Gradients）がモデルの出力を入力信号にマッピングし返し、波形のどの部分またはどのウィンドウが異常スコアを駆動したかを確認できます。

これがエンジニアリングの好奇心を超えて重要な理由は：

トリアージ。 エンジニアが数秒でモデルをドメイン知識に照らして検証できます。「RULが低下し、主要な駆動因子が軸受周波数の振動エネルギーだ」は行動可能です。「RULが低下した、理由不明」は無視されます。
信頼。 保守チームは尋問できるツールを採用します。帰属分析は、モデルが上書きされるのではなく常設の指示を受けるようになる方法です。
監査。 規制環境では、「モデルがそう言った」は保守決定の防衛可能な根拠ではありません。特徴量ごとの帰属記録がその役割を果たします。

帰属分析のない予測は、信頼するしかない数値です。帰属分析のある予測は、検証できる仮説です — そして信頼性エンジニアが行動するのはその種類の予測だけです。

あらゆるRULモデルに尋ねるべき質問

信頼区間を出力しますか、それとも点推定のみですか？
個々の予測に対して特徴量ごとの帰属分析を示せますか？（グローバルな特徴量重要度ではなく — この予測について。）
故障履歴がないコールドスタート時にはどうなりますか？
公開されたベンチマークは何で、どの公開データセットで？（「高精度」という曖昧な主張はベンチマークではありません。）
データが存在する場所で動作しますか？

最善のRULモデルは、スライド上の誤差が最も小さいものではありません。エンジニアがすべての予測を確認できるもの — そのため信頼できるもの — です。

Prevlyはオンプレミスで異常検知・RUL予測・故障分類を実行し、すべての予測に特徴量ごとの帰属分析を提供します。インタラクティブデモを試すまたは技術的なウォークスルーをリクエストしてください。