予知保全におけるエッジ vs クラウド:どちらをいつ使うか
予知保全におけるエッジ vs クラウド:どちらをいつ使うか
誤った二択
すべての予知保全ベンダーは自社のアプローチが優れていると言います。エッジベンダーはクラウドが遅すぎてコストがかかりすぎると言います。クラウドベンダーはエッジが複雑なモデルを扱えないと言います。どちらも間違っています——あるいはむしろ、特定の文脈では両方とも正しいのです。
本当の問いは「エッジかクラウドか?」ではありません。「どの計算がどこで行われるべきか、そしてなぜか?」です。
意思決定マトリクス
| 要素 | エッジ | クラウド | ハイブリッド | |---|---|---|---| | レイテンシ要件 | <10ms(安全クリティカル) | <500ms(許容可能) | 混合 | | 接続性 | 断続的・なし | 安定 | 可変 | | モデルの複雑さ | シンプル(IF、ONNX) | 複雑(LSTM、Transformer) | 両方 | | データ量 | >100Kポイント/秒 | 集計サマリー | 事前フィルタリング済み | | 規制 | データがサイトを出られない | クラウド準拠リージョン | ローカル処理、メタはクラウドへ | | スケール時のコスト | 固定CAPEX | 変動OPEX | 最適化済み | | 更新頻度 | 手動・スケジュール | 継続的 | 段階的 |
エッジが勝る場合
1. 安全クリティカルなレイテンシ
コンプレッサーのサージ検知システムはクラウドへの往復200msを待てません。応答が到着するまでに、機械的な損傷はすでに起きています。
目安: 応答時間要件が50ms以下なら、エッジで実行しなければなりません。これは絶対です。
実例: 12,000 RPMで稼働する遠心コンプレッサーは5msで1回転を完了します。サージ検知は2〜3回転以内にトリガーされる必要があります。それは10〜15ms——クラウドへのネットワーク往復では不可能です。
2. 不安定な接続性
洋上石油プラットフォーム、地下の鉱山、地方の製造サイト、モバイル機器(フリート、クレーン、船)では接続性が断続的なことがよくあります。ネットワークが機能しないときでも、PdMシステムは機能し続けなければなりません。
エッジで機能するもの:
- Isolation Forest異常検知(小さなモデル、高速推論)
- ONNXにエクスポートされたニューラルネットワーク(クラウドで事前訓練、エッジに展開)
- フォールバックとしてのルールベースアラート
- 接続時に同期するローカルデータバッファリング
3. データ主権
一部の業界(国防、原子力、製薬)はセンサーデータが施設外に出ることを禁じています。集計された健全性スコアのみを中央ダッシュボードに送信するエッジ推論は、MLのニーズとコンプライアンス要件の両方を満たします。
4. 帯域幅の経済性
25.6 kHzでサンプリングする単一の振動センサーは1日に約2 GBの生データを生成します。200個のセンサーで掛け合わせると、1日に400 GBになります——クラウドへのストリーミングは高コストで、ほとんどのユースケースでは不要です。
エッジの前処理: 特徴量をローカルで抽出し(RMS、カートシス、スペクトルピーク、軸受周波数)、200KBの生波形の代わりに20バイトの特徴量ベクトルを送信します。これは帯域幅を10,000倍削減します。
クラウドが勝る場合
1. 複雑なモデルのトレーニング
LSTMオートエンコーダーやTranADトランスフォーマーモデルのトレーニングには、GPUコンピュート、数か月にわたる履歴データ、ハイパーパラメーターの最適化が必要です。これはエッジでは起きません。
パターン:
- センサーデータがクラウドに流れる(生または特徴量抽出済み)
- モデルがGPUクラスターで訓練される(Ray Train、分散)
- 訓練されたモデルがONNXにエクスポートされる
- ONNXモデルが推論のためにエッジに展開される
2. クロスアセット学習
最も強力なPdM機能は、フリート全体でパターンを学習することです。「シカゴ工場のポンプ7Aが、先月ミュンヘン工場のポンプ3Bの故障に先行した劣化パターンと同じパターンを示している。」
これはすべての設備からの集中データ——つまりクラウド——を必要とします。エッジデバイスはローカルのセンサーしか見えません。
3. 高度なアナリティクス
- 根本原因分析: PCMCIの因果グラフは複数の関連センサーと設備からのデータが必要
- 残存寿命: 信頼区間付きのWeibull-RNNモデルは過去の故障データが必要
- 特徴量寄与度の説明: 説明可能性のための特徴量寄与度の計算は計算コストが高い
- デジタルツイン: 物理インフォームドモデルは集中シミュレーション環境が必要
4. マルチプラントダッシュボード
運営担当副社長は15のプラント、3,000の設備、20,000のセンサーを一つのビューで見る必要があります。これはクラウドの問題です——スケールでの集計、可視化、ロールベースのアクセス。
ハイブリッドアーキテクチャ
最良のPdMシステムは両方を使います。レイヤーの仕組みを示します。
レイヤー1:センサー → エッジゲートウェイ(μs)
- 信号調整、サンプリング、FFT
- 即時の安全停止(ハードワイヤード、ソフトウェアではない)
レイヤー2:エッジエージェント(ms)
- 特徴量抽出(ローリング統計、スペクトル特徴)
- ONNX モデル推論(異常スコア、基本的な故障クラス)
- ローカルアラート(SMS、リレー出力、ローカルHMI)
- バッチアップロード用データバッファリング
レイヤー3:クラウドプラットフォーム(秒)
- 完全MLパイプライン(LSTM、TranAD、Weibull-RNN、CNN)
- クロスアセットパターンマッチング
- 特徴量寄与度の説明
- 信頼区間付きRUL予測
- ダッシュボード、レポート、CMMS統合
レイヤー4:クラウドMLOps(時間・日)
- 蓄積データに基づくモデルの再訓練
- 新モデルバージョンのA/Bテスト
- テナント固有の微調整のためのAutoML
- ONNXエクスポート → エッジ展開
実際のデータフロー
- 12 kHz振動 → エッジFFT → 256スペクトルビン → クラウド(10秒ごと)
- 1 Hz温度・圧力 → エッジローリング統計 → クラウド(60秒ごと)
- エッジ異常スコア → クラウド(MQTTでリアルタイム)→ ダッシュボード
- クラウドLSTM予測 → アラートエンジン → PagerDuty/ServiceNow
コストの最適化
ハイブリッドアプローチは技術的に優れているだけでなく——コストも低くなります。
| アーキテクチャ | 月額コスト(200設備) | レイテンシ | オフライン対応 | |---|---|---|---| | クラウドのみ | 約2,400ユーロ(コンピュート + 帯域幅) | 200〜500ms | なし | | エッジのみ | 約8,000ユーロ(ハードウェアCAPEX償却) | <10ms | あり | | ハイブリッド | 約1,800ユーロ(帯域幅削減 + 小規模クラウド) | <10msローカル、<500msクラウド | 部分的 |
エッジの前処理による帯域幅の節約だけで、通常6か月以内にエッジハードウェアのコストを回収できます。
アーキテクチャの選択
クラウドから始める場合:
- 信頼性の高い接続性がある(>99%の稼働率)
- レイテンシ要件が>100ms
- 設備が<50台(エッジハードウェアのCAPEXが正当化されない)
- 最速の価値実現を望む
エッジから始める場合:
- 不安定または接続性がない
- 安全クリティカルなレイテンシ要件がある(<50ms)
- データが施設外に出られない
- エッジゲートウェイがすでにある(Raspberry Pi、Siemens IOT2050など)
ハイブリッドから始める場合:
- 複数のサイトに50台以上の設備がある
- 高速なローカル応答と高度なクラウドアナリティクスの両方が必要
- ローカルの耐障害性を持つクロスアセット学習が欲しい
Prevlyのアプローチ
Prevlyは3つのアーキテクチャをすべてサポートします。
- エッジ展開: ONNX推論、ローカルダッシュボード、Parquetバッチ同期を備えたスタンドアロンエッジエージェント——オンプレミスの自律性とデータ主権を必要とするサイト向け。
- クラウド展開: すべてのMLモデル、説明可能性、RUL予測、統合を備えた完全なクラウドSaaS。
- ハイブリッド展開: エッジエージェントとクラウドプラットフォームの組み合わせ——ローカルの耐障害性を持つフリート全体の学習。
最新のプランと各ティアに含まれる内容については現在の料金をご覧ください。
エッジエージェントはPython 3.10+を備えた任意のLinuxデバイスで動作します——35ユーロのRaspberry Pi 5から産業用Advantechゲートウェイまで。モデルはクラウドで訓練され、ONNXエクスポートを通じてエッジに自動的に展開されます。
「エッジかクラウドか?」への正しい答えはほぼ常に「はい」だからです。
関連記事: オンプレミス vs クラウドPdM · 読み取り専用OPC-UA監視 · 自社構築 vs 購入