Edge vs. Cloud dla Predictive Maintenance: Kiedy co wybrać?

Fałszywa dychotomia

Każdy dostawca systemów predictive maintenance przekona Cię, że jego podejście jest lepsze. Dostawcy rozwiązań edge twierdzą, że chmura jest zbyt wolna i zbyt droga. Dostawcy chmurowi twierdzą, że edge nie radzi sobie ze złożonymi modelami. Obie strony się mylą — a właściwie obie mają rację w określonych kontekstach.

Prawdziwe pytanie nie brzmi „edge czy chmura?", lecz: „które obliczenia powinny odbywać się gdzie i dlaczego?"

Macierz decyzyjna

| Czynnik | Edge | Chmura | Hybrydowe | |---|---|---|---| | Wymagana latencja | <10 ms (krytyczne dla bezpieczeństwa) | <500 ms (akceptowalne) | Mieszane | | Łączność | Przerywana/brak | Niezawodna | Zmienna | | Złożoność modelu | Prosta (IF, ONNX) | Złożona (LSTM, Transformer) | Obie | | Wolumen danych | >100K punktów/s | Zagregowane podsumowania | Wstępnie przefiltrowane | | Regulacje | Dane nie mogą opuszczać zakładu | Region zgodny z chmurą | Przetwarzanie lokalne, metadane do chmury | | Koszt przy skali | Stałe CAPEX | Zmienne OPEX | Zoptymalizowane | | Częstotliwość aktualizacji | Ręcznie/planowo | Ciągła | Etapowa |

Kiedy wygrywa edge

1. Latencja krytyczna dla bezpieczeństwa

System wykrywania surge w sprężarce nie może czekać 200 ms na odpowiedź z chmury. Zanim odpowiedź dotrze, uszkodzenia mechaniczne są już faktem.

Zasada ogólna: Jeśli wymagany czas reakcji wynosi poniżej 50 ms, przetwarzanie musi odbywać się na brzegu sieci. Bez wyjątków.

Przykład z życia: Sprężarka odśrodkowa pracująca z prędkością 12 000 obr./min wykonuje pełny obrót w 5 ms. Wykrycie surge musi nastąpić w ciągu 2–3 obrotów. To 10–15 ms — niemożliwe przy komunikacji sieciowej z chmurą.

2. Zawodna łączność

Morskie platformy wiertnicze, kopalnie podziemne, wiejskie zakłady produkcyjne oraz sprzęt mobilny (floty, żurawie, statki) często dysponują przerywaną łącznością. System PdM musi działać wtedy, gdy sieć zawodzi.

Co sprawdza się na edge:

Wykrywanie anomalii metodą Isolation Forest (mały model, szybkie wnioskowanie)
Sieci neuronowe wyeksportowane do ONNX (wytrenowane w chmurze, wdrożone na edge)
Alerty oparte na regułach jako rozwiązanie awaryjne
Lokalne buforowanie danych z synchronizacją po przywróceniu połączenia

3. Suwerenność danych

Niektóre branże (obronność, przemysł jądrowy, farmacja) zabraniają, by dane sensoryczne opuszczały zakład. Wnioskowanie na edge, przy którym do centralnego pulpitu nawigacyjnego wysyłane są wyłącznie zagregowane oceny kondycji, spełnia zarówno wymagania ML, jak i wymogi compliance.

4. Ekonomia przepustowości

Pojedynczy czujnik drgań próbkujący z częstotliwością 25,6 kHz generuje około 2 GB/dzień surowych danych. Przy 200 czujnikach daje to 400 GB/dzień — przesyłanie tego do chmury jest kosztowne i zbędne w większości przypadków.

Przetwarzanie wstępne na edge: Wyodrębniaj cechy lokalnie (RMS, kurtoza, piki spektralne, częstotliwości łożysk), a następnie wysyłaj 20-bajtowy wektor cech zamiast 200-kilobajtowego surowego przebiegu. To redukcja przepustowości o czynnik 10 000.

Kiedy wygrywa chmura

1. Trenowanie złożonych modeli

Trenowanie autoenkodera LSTM lub modelu transformerowego TranAD wymaga mocy obliczeniowej GPU, dużych zbiorów danych obejmujących miesiące historii oraz optymalizacji hiperparametrów. To nie dzieje się na edge.

Schemat postępowania:

Dane sensoryczne trafiają do chmury (surowe lub po ekstrakcji cech)
Modele są trenowane na klastrach GPU (Ray Train, rozproszone)
Wytrenowane modele są eksportowane do ONNX
Modele ONNX są wdrażane na edge do wnioskowania

2. Uczenie przekrojowe na wielu urządzeniach

Najbardziej wartościową funkcją PdM jest wykrywanie wzorców w całej flocie. „Pompa 7A w zakładzie w Chicago wykazuje ten sam wzorzec degradacji, który poprzedzał awarię pompy 3B w zakładzie w Monachium w zeszłym miesiącu."

Wymaga to scentralizowanych danych ze wszystkich urządzeń — a to oznacza chmurę. Urządzenia edge widzą wyłącznie swoje lokalne czujniki.

3. Zaawansowana analityka

Analiza przyczyn źródłowych: Grafy przyczynowe PCMCI potrzebują danych z wielu powiązanych czujników i urządzeń
Pozostały czas eksploatacji: Modele Weibull-RNN z przedziałami ufności wymagają historycznych danych o awariach
Atrybucja cech: Obliczanie wkładu poszczególnych cech dla wyjaśnialności jest obliczeniowo kosztowne
Cyfrowe bliźniaki: Modele oparte na fizyce wymagają scentralizowanych środowisk symulacyjnych

4. Pulpity nawigacyjne wielu zakładów

Wiceprezes ds. operacyjnych potrzebuje jednego widoku obejmującego 15 zakładów, 3000 urządzeń i 20 000 czujników. To jest problem chmurowy — agregacja, wizualizacja i kontrola dostępu oparta na rolach w skali.

Architektura hybrydowa

Najlepsze systemy PdM korzystają z obu. Oto jak działają poszczególne warstwy:

Warstwa 1: Czujnik → Brama edge (μs)
  - Kondycjonowanie sygnału, próbkowanie, FFT
  - Natychmiastowe wyłączenia awaryjne (hardwired, nie programowe)

Warstwa 2: Agent edge (ms)
  - Ekstrakcja cech (statystyki krokowe, cechy spektralne)
  - Wnioskowanie modelu ONNX (wynik anomalii, podstawowa klasa usterki)
  - Lokalne alerty (SMS, wyjście przekaźnikowe, lokalny HMI)
  - Buforowanie danych do wsadowego przesyłu

Warstwa 3: Platforma chmurowa (sekundy)
  - Pełny potok ML (LSTM, TranAD, Weibull-RNN, CNN)
  - Dopasowywanie wzorców między urządzeniami
  - Atrybucja cech (Integrated Gradients dla modeli głębokich)
  - Prognozowanie RUL z przedziałami ufności
  - Pulpit, raportowanie, integracja CMMS

Warstwa 4: Cloud ML Ops (godziny/dni)
  - Ponowne trenowanie modeli na zgromadzonych danych
  - Testy A/B nowych wersji modeli
  - AutoML do dostrajania pod konkretnego klienta
  - Eksport ONNX → wdrożenie na edge

Przepływ danych w praktyce

Drgania 12 kHz → Edge FFT → 256 binów spektralnych → Chmura (co 10 sekund)
Temperatura/ciśnienie 1 Hz → Statystyki krokowe na edge → Chmura (co 60 sekund)
Wynik anomalii z edge → Chmura (w czasie rzeczywistym przez MQTT) → Pulpit
Prognoza LSTM z chmury → Silnik alertów → PagerDuty/ServiceNow

Optymalizacja kosztów

Podejście hybrydowe jest nie tylko technicznie lepsze — jest też tańsze:

| Architektura | Miesięczny koszt (200 urządzeń) | Latencja | Tryb offline | |---|---|---|---| | Tylko chmura | ~2 400 € (obliczenia + przepustowość) | 200–500 ms | Nie | | Tylko edge | ~8 000 € (amortyzacja CAPEX hardware) | <10 ms | Tak | | Hybrydowe | ~1 800 € (zmniejszona przepustowość + mniejsza chmura) | <10 ms lokalnie, <500 ms chmura | Częściowo |

Samo oszczędności na przepustowości dzięki przetwarzaniu wstępnemu na edge zazwyczaj zwracają koszty hardware edge w ciągu 6 miesięcy.

Wybór architektury

Zacznij od chmury, jeśli:

Masz niezawodną łączność (dostępność >99%)
Twoje wymagania dotyczące latencji wynoszą >100 ms
Masz <50 urządzeń (CAPEX hardware edge się nie opłaca)
Zależy Ci na najszybszym czasie do pierwszych wyników

Zacznij od edge, jeśli:

Masz zawodną lub żadną łączność
Masz wymagania dotyczące latencji krytycznej dla bezpieczeństwa (<50 ms)
Dane nie mogą opuszczać Twojego zakładu
Masz już bramy edge (Raspberry Pi, Siemens IOT2050 itp.)

Zacznij hybrydowo, jeśli:

Masz 50+ urządzeń w wielu lokalizacjach
Potrzebujesz zarówno szybkiej lokalnej odpowiedzi, jak i zaawansowanej analityki chmurowej
Chcesz uczenia przekrojowego na wielu urządzeniach z lokalną odpornością

Podejście Prevly

Prevly obsługuje wszystkie trzy architektury:

Wdrożenie edge: Samodzielny agent edge z wnioskowaniem ONNX, lokalnym pulpitem nawigacyjnym i synchronizacją wsadową w formacie Parquet — dla zakładów wymagających autonomii on-premise i suwerenności danych.
Wdrożenie chmurowe: Pełne SaaS w chmurze ze wszystkimi modelami ML, wyjaśnialnością, prognozowaniem RUL i integracjami.
Wdrożenie hybrydowe: Agenty edge plus platforma chmurowa — uczenie na poziomie całej floty z lokalną odpornością.

Aktualne plany i zawartość poszczególnych tierów znajdziesz na stronie cennik.

Agent edge działa na każdym urządzeniu z systemem Linux i Python 3.10+ — od Raspberry Pi 5 za 35 € po przemysłową bramę Advantech. Modele są trenowane w chmurze i automatycznie wdrażane na edge przez eksport ONNX.

Bo właściwa odpowiedź na pytanie „edge czy chmura?" brzmi niemal zawsze: „jedno i drugie."

Powiązane artykuły: PdM on-premise vs chmura · Monitorowanie OPC-UA tylko do odczytu · Budować czy kupić PdM