Teollisuuden tekoäly

Anomalioiden tunnistus prosessidatasta: Z-score ja tekoäly käytännössä

Atorcom · 3.6.2026 · 12 min lukuaika

Kuvittele tilanne: tuotantolinjan paluuveden lämpötila on noussut puoli astetta tunnin aikana. Yksikään kiinteä raja-arvo ei ole lauennut. Seuraava vuoro alkaa kahden tunnin päästä — ja vika löytyy vasta aamupalaverissa, kun lämpö on jo ehtinyt nousta kaksi astetta ja pumppu on käynyt ylikuormalla kolme tuntia.

Tämä on tilanne, jonka anomalioiden tunnistus olisi havainnut jo ensimmäisellä puolella tunnilla. Z-score olisi ylittänyt varoitustason, paikallinen tekoäly olisi kontekstualisoinut havainnon, ja kunnossapito olisi saanut ilmoituksen samalla vuorolla. Eikä pilveä tarvittu — ei tiedonsiirtoa ulkopuolelle, ei riippuvuutta ulkoisesta palvelusta.

Tässä artikkelissa käymme läpi, miten anomalioiden tunnistus toteutetaan käytännönläheisesti teollisessa prosessissa: miksi kiinteät rajat epäonnistuvat, miten Z-score toimii, missä se ei riitä — ja miten paikallinen tekoäly täydentää kokonaisuuden.

Miksi anomalioiden tunnistus on teollisuuden kriittisin kyky 2026?

Vuonna 2026 suurin osa suomalaisista teollisuuslaitoksista kerää prosessidataa OPC UA -rajapinnan kautta, mutta varsinainen anomalioiden tunnistus on vielä lapsen kengissä. Tyypillinen tilanne näyttää tältä: automaatiojärjestelmässä on kiinteät korkeat ja matalat hälytysrajat — ja sen ulkopuolella ei ole mitään.

Kiinteä raja on välttämätön, mutta ei riittävä. Se tunnistaa räikeät poikkeamat, kuten anturin rikkoutumisen tai painepikin. Se ei tunnista hiljalleen kehittyvää vikaa, joka etenee normaalialueen sisällä — mutta väärään suuntaan väärässä kontekstissa.

Teollisessa prosessissa poikkeama ei synny tyhjiössä. Se syntyy kontekstissa:

  • Kuormitustaso: sama lämpötila on normaali täydellä kuormalla, mutta poikkeava tyhjäkäynnillä.
  • Vuorokauden aika: yöllinen käyttäytyminen poikkeaa päiväajan käyttäytymisestä.
  • Sääolosuhteet: ulkolämpötila, kosteus ja aurinkopaiste vaikuttavat erityisesti energiantuotannossa.
  • Prosessin tila: käynnistys, vakaa ajo, alasajo ja huoltojakso kaikki tuottavat erilaisen normaalin.

Kun anomalioiden tunnistus huomioi nämä kontekstimuuttujat, se löytää poikkeamia, joita kiinteät rajat eivät koskaan havaitse — ja löytää ne ajoissa, ei viikkoja myöhemmin viikkoraportista.

Kuusi syytä, miksi kiinteät raja-arvot epäonnistuvat anomalioiden tunnistuksessa

Monessa laitoksessa poikkeamien havaitseminen nojaa pelkästään SCADA-järjestelmän kiinteisiin hälytyksiin. Tässä syitä, miksi se ei riitä.

1. Kontekstisokkeus

Kiinteä raja ei tiedä, onko laitos täydellä vai puolikkaalla kuormalla, meneekö tuotanto normaalisti vai käynnistyykö prosessi uudelleen. Sama arvo voi olla täysin normaali yhdessä tilanteessa ja kriittinen poikkeama toisessa.

2. Hitaasti kehittyvät viat jäävät piiloon

Laakerin kuluminen, venttiilin tiivistevuoto tai lämmönvaihtimen likaantuminen kehittyvät viikkoja tai kuukausia. Arvot pysyvät koko ajan rajojen sisällä — mutta trendi kertoo jo selvää tarinaa, jos sitä osataan lukea.

3. Liian paljon vääriä hälytyksiä

Kiinteät rajat säädetään usein niin väljiksi, ettei niistä tule liikaa hälytyksiä. Tuloksena on hälytysmyrsky — niin paljon viestejä, että operaattorit alkavat jättää ne huomiotta. Tärkeä poikkeama hukkuu kohinaan.

4. Usean signaalin yhteisvaikutus jää näkemättä

Paine saattaa olla normaali, lämpötila normaali ja virtaama normaali — mutta niiden yhdistelmä kertoo selvästi, että prosessissa on jotain vialla. Yksittäisiä raja-arvoja seuraamalla tätä ei koskaan havaita.

5. Ei toimintamallia havainnon jälkeen

Vaikka SCADA tuottaa hälytyksen, se ei kerro: onko tämä vakava, mihin se liittyy, ja kenen pitää tehdä mitäkin? Ilman priorisoitua ja kontekstualisoitua tietoa hälytyksestä tulee lisätyö, ei toiminnan käynnistäjä.

6. Historia ja juurisyy-tieto puuttuvat

Hälytysloki kertoo milloin raja ylittyi, muttei tarjoa ympäröivää prosessidataa, trendiä ennen poikkeamaa tai jälkianalyysiä. Juurisyyn selvittäminen alkaa aina tyhjältä pöydältä.

Anomalioiden tunnistus Z-scorella: kaava, logiikka ja käytäntö

Z-score on tilastollinen työkalu, joka mittaa, kuinka monta keskihajontaa yksittäinen havainto on normaalin tason yläpuolella tai alapuolella. Kaava on yksinkertainen:

Z = (arvo − keskiarvo) / keskihajonta

Jos Z-score on alle 2, arvo on normaalin vaihtelun sisällä. Jos se ylittää 3, arvo on jo tilastollisesti harvinainen — 99,7 % arvoista pysyy tällä välillä normaalijakautuneessa datassa. Teollisuuden prosessidatassa käytetään usein rajoja 2,5 (varoitus) ja 3,5 (kriittinen).

Pelkkä kaava ei tee Z-scoresta hyödyllistä. Käytännön toteutus vaatii neljä rakennuspalikkkaa:

1. Kontekstisidonnainen baseline

Laske keskiarvo ja keskihajonta erikseen eri prosessitiloille: kuormitusluokka, vuorokauden aika, vuodenaika, käynnistys- vs. vakaa ajo. Yksi globaali baseline tuottaa liikaa vääriä positiivisia.

2. Riittävä ja puhdas vertailujakso

Baseline lasketaan tyypillisesti 30–90 päivän vertailujaksolta, jolta poistetaan tunnetut vika- ja huoltojaksot. Jos baseline sisältää poikkeamia, malli oppii ne normaaleiksi.

3. Peräkkäisten pisteiden vaatimus

Yksittäinen Z-score-ylitys voi olla mittauskohina. Vaadi 3–5 peräkkäistä ylitystä ennen hälytystä. Tällä poistat suurimman osan vääristä hälytyksistä menettämättä tunnistusherkkyyttä.

4. Vastuumalli ja toimintapolku

Poikkeama ilman toimintamallia on arvoton. Kytke hälytykseen: vastuuroolille tieto, viitedata juurisyyn analyysiin ja kirjausmahdollisuus toimenpiteistä. Vasta tälloin Z-score muuttuu operatiiviseksi hyödyksi.

Vaihe Toimenpide Miksi kriittinen
1. Datapohja 30–90 päivän puhdas vertailujakso ilman tunnettuja häiriöjaksoja Baseline ei saa sisältää poikkeamia, muuten malli oppii ne normaaleiksi
2. Ryhmittely Laske baseline prosessin tilan, kuormituksen ja ajan mukaan Yksi globaali raja tuottaa kymmeniä vääriä hälytyksiä päivässä
3. Rajat Varoitus Z > 2,5 — Kriittinen Z > 3,5 Erotellaan seurattava poikkeama ja välitöntä toimenpidettä vaativa
4. Vahvistus 3–5 peräkkäistä ylitystä ennen hälytystä Mittauskohina ei tuota hälytyksiä, mutta jatkuva poikkeama kyllä
5. Toimintamalli Kytkennät vastuurooleihin, juurisyydatan tarjonta, kirjausmahdollisuus Havainto ilman toimintaa on vain lisäkohina operaattorille
70–90 %

vähemmän vääriä hälytyksiä syntyy, kun siirrytään kiinteistä rajoista kontekstikohtaiseen Z-scoreen peräkkäisvaatimuksineen. Operaattorit voivat taas luottaa hälytyksiin.

Missä Z-score ei riitä — ja miksi paikallinen tekoäly täydentää mallin

Z-score on erinomainen ensimmäinen kerros. Se on nopea, selitettava ja helppo auditoida. Mutta se tarkastelee jokaista mittapistettä erikseen. Monimutkaisessa prosessissa poikkeama syntyy usein usean signaalin yhteisvaikutuksesta — ja juuri tähän paikallinen tekoäly tuo lisäarvon.

Käytännön malli toimii kolmessa tasossa:

  • Taso 1 — Z-score: nopea, mittapistekohtainen poikkeamahavainto. Vasteaika sekunteina.
  • Taso 2 — korrelaatioanalyysi: tekoäly tunnistaa, mitkä muut mittapisteet liikkuivat samanaikaisesti ja millaisia syy-seuraussuhteita on historiassa havaittu.
  • Taso 3 — priorisointi: tekoäly arvioi, onko poikkeama operatiivisesti merkittävä vai ohimenevä, ja ehdottaa mahdollisia juurisyitä.

Tärkeintä on, että tekoäly toimii paikallisesti. Prosessidata on teollisuudessa usein arkaluonteista: se voi paljastaa tuotantomäärät, reseptit, kapasiteetin käytön tai energiatehokkuuden luvut. Siksi analyysin täytyy tapahtua laitoksen omassa verkossa — ei pilvipalvelussa.

DataPortia hyödyntää Ollama-malleja suoraan laitoksen omalla palvelimella. Data ei koskaan poistu laitoksen verkosta — ja silti käytettävissä on kielimallipohjainen kontekstualisointi, joka selittää poikkeaman operaattorille luonnollisella kielellä.

Käytännön esimerkki: kaukolämpölaitoksen poikkeama, jota kiinteät rajat eivät havainneet

Kuvataan tilanne kaukolämpöä tuottavasta laitoksesta. Järjestelmässä on kolme kattilaa, verkon paluupuolen lämmönvaihtimet sekä useita pumppu- ja venttiiliryhmiä.

Käytännön esimerkki

Kaukolämpölaitos: kiinteistä rajoista kontekstikohtaiseen anomalioiden tunnistukseen

❌ Ennen (kiinteät rajat)

  • Paluuveden lämpötila nousi hitaasti neljä tuntia
  • Absoluuttinen arvo pysyi aina rajojen sisällä
  • SCADA ei tuottanut yhtään hälytystä
  • Vika havaittiin aamuvuoron aluksi — neljä tuntia myöhemmin
  • Lämmönvaihtimen likaantuminen oli edennyt jo pitkälle
  • Puhdistus vaati suunnittelemattoman tuotantoseisokin

✅ Jälkeen (Z-score + paikallinen tekoäly)

  • Z-score ylitti varoitustason 2,5 jo 35 minuutin kuluttua nousun alusta
  • Peräkkäisvaatimus täyttyi: neljä pistettä peräkkäin
  • Tekoäly tunnisti: samanaikaisesti pumpun virtaama laski 4 %
  • Ehdotus: lämmönvaihtimen likaantuminen todennäköinen syy
  • Kunnossapito tarkisti tilanteen saman vuoron aikana
  • Puhdistus tehtiin suunnitellusti — ei suunnittelematonta seisokkia
3,5 h

aikaisempi havaitseminen. Siinä ajassa, jonka laitos kävi ylikuormalla, ehti kertyä ylimääräisiä energiakustannuksia ja kulumisjälkeä, joilta molemmat vältyttiin kontekstikohtaisella anomalioiden tunnistuksella.

Miten rakentaa anomalioiden tunnistus ilman raskasta datatiedeprojektia

Suurin harhaluulo anomalioiden tunnistuksessa on, että se vaatii monen vuoden datatiedeprojektin, suuren budjetin tai pilvipohjaisen AI-alustan. Todellisuudessa käytännöllinen malli on rakennettavissa vaiheistettuna ilman erillisiä konsultteja.

Vaihe 1: Valitse 5–10 kriittistä mittapistettä

Aloita mittapisteistä, joihin liittyy korkein taloudellinen riski tai joissa poikkeama voi vaurioittaa laitteistoa. Enemmän ei ole parempi — fokusoitu malli on parempi kuin leveä mutta pinnallinen.

Vaihe 2: Rakenna kontekstisidonnainen baseline

Käytä 60–90 päivän historiadataa. Ryhmittele prosessin tilan mukaan: kuormitusluokka, vuorokauden aika, vuodenaika. Tarkista, ettei baseline-jakso sisällä tunnettuja vikajaksoja tai huoltoaikoja.

Vaihe 3: Määritä rajat ja peräkkäisvaatimus

Aloita varoitusrajalla Z > 2,5 ja kriittisellä Z > 3,5. Vaadi 3–5 peräkkäistä ylitystä ennen hälytystä. Seuraa viikko, mittaa väärien hälytysten määrä ja säädä tarvittaessa.

Vaihe 4: Lisää paikallinen tekoäly kontekstualisoimaan havainnot

Kytke anomaliahavainnot paikalliseen kielimalliin, joka selittää poikkeaman kontekstin: mitä muita mittapisteitä liikkui, mitä se historiallisesti on tarkoittanut ja mikä toimenpide on suositeltu.

Vaihe 5: Laajenna vaiheittain

Kun ensimmäiset 5–10 mittapistettä toimivat luotettavasti, laajenna seuraavaan kriittisimpien mittapisteiden joukkoon. Vältä laajentamista liian nopeasti — jokainen uusi mittapiste vaatii kunnollisen baselinen.

Milloin anomalioiden tunnistus kannattaa — ja milloin ei vielä hyödytä?

Tilanne Kiinteät rajat Z-score + tekoäly
Räikeä anturivika tai paine-ero ✅ Havaitsee hyvin ✅ Havaitsee yhtä hyvin
Hitaasti kehittyvä laakerin kuluminen ❌ Ei havaitse ✅ Havaitsee viikkoja aiemmin
Poikkeama kuormituksen muutoksen yhteydessä ❌ Vääriä hälytyksiä ✅ Kontekstikohtainen arvio
Usean signaalin yhteisvaikutus ❌ Ei tunnista ✅ Korrelaatioanalyysi
Alle 5 mittapistettä, yksinkertainen prosessi ✅ Riittää Voi olla ylimitoitettu
10–2000 mittapistettä, jatkuva tuotanto ❌ Ei riitä ✅ Suunniteltu juuri tähän
Tietoturva- tai datahallintavaatimukset ✅ SCADA-pohjainen ✅ Paikallinen, data ei poistu verkosta

Yhteenveto: anomalioiden tunnistus muuttuu teoriasta operatiiviseksi käytännöksi

Vuonna 2026 anomalioiden tunnistus ei enää vaadi massiivista datatiedeprojektia. Se vaatii oikean rakenteen: kontekstikohtainen Z-score, peräkkäisvaatimus ja paikallinen tekoäly, joka kontekstualisoi havainnon — ja toimintamalli, joka muuttaa havainnon korjaavaksi toimenpiteeksi.

Tärkeimmät opit:

  • Kiinteät rajat eivät riitä — ne näkevät vain räikeät poikkeamat, eivät hiljalleen kehittyviä vikoja tai kontekstiriippuvaisia tilanteita.
  • Z-score on paras lähtökohta — selitettävä, nopea ja auditoitava.
  • Kontekstisidonnainen baseline ratkaisee — yksi globaali raja tuottaa liikaa hälytyskohina.
  • Paikallinen tekoäly täydentää — se kontekstualisoi usean signaalin yhteisvaikutuksen ilman pilviriippuvuutta.
  • Aloita pienestä, laajenna vaiheistettuna — 5–10 kriittistä mittapistettä riittää alkuun.

Kun datan keruu, visualisointi, anomalioiden tunnistus ja tekoälyanalyysi ovat samassa kokonaisuudessa, malli muuttuu teoriasta päivittäiseksi toimintatavaksi ilman IT-projektia.

Kokeile anomalioiden tunnistusta omalla prosessidatalla

DataPortia kerää OPC UA -datan, laskee Z-scoret ja analysoi poikkeamat paikallisella tekoälyllä — ilman pilviriippuvuutta. Kokeile ilmaiseksi 30 päivää.

Aloita ilmainen kokeilu →

Jaa artikkeli sosiaalisessa mediassa

Facebook
X
LinkedIn

Valmiina muuttamaan teollisuusdatasi arvokkaaksi tiedoksi?

Ota yhteyttä räätälöityä demoa varten tai pyydä ilmainen 30 päivän kokeilu kaikilla ominaisuuksilla.

DataPortia Reviews
DataPortia Reviews
DataPortia Reviews

Aloita tänään

Hallitsetpa yhtä prosessilinjaa tai usean kohteen toimintaa, teollisuuden tiedonkeruuohjelmisto DataPortia skaalautuu tarpeisiisi.

Email: myynti@atorcom.fi

Puhelin: +358 45 882 1525

Y-tunnus: 3010969-9

Virallinen jälleenmyyjä:
Painamalla “Lähetä” hyväksyn, että tietojani käsitellään tietosuojaselosteen mukaisesti.

© Atorcom. Kaikki oikeudet pidätetään. | Rekisteri- ja tietosuojaseloste