Detection and data-driven root cause analysis of paper machine drive anomalies
Ritala, Mikko (2019)
Diplomityö
Ritala, Mikko
2019
School of Engineering Science, Tuotantotalous
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe202002034263
https://urn.fi/URN:NBN:fi-fe202002034263
Tiivistelmä
The Industrial Internet has increased interest in the collection and utilization of data. The latter has become easier due to increased computing power and the development of analytical methods. The goal of this thesis is to develop methods for detecting anomalies and identifying their root causes. Machine learning (ML) is used to create regression models for the electricity consumption of paper machine (PM) drives. ML enables a way of creating models describing the behavior of equipment. In the empirical part of the thesis, ML models are compared to the physics-based model. Creating a physics-based model requires considerable knowledge of the process. Considering all the process features that affect electricity consumption is a time-consuming task. The ML model, on the other hand, learns the effects of process features from historical data.
Anomalies are identified by comparing model output and measured process value. Time periods when the difference between model output and measured process value is significant are considered anomalous. During an anomalous time period, there may have been an undesired change in the process that could lead to equipment damage. Process features that can explain anomalies are sought from the data using the Pearson correlation. Knowing what caused the anomalies can help to prevent machine failures.
An application is created during the thesis that is used in the case study in which machine failures are studied. A model is created to find anomalous periods, and the application is used to identify the root causes of anomalies. The application can explain anomalies, but root causes for machine failures cannot be identified. In future research, other methods for root cause identification besides correlation could be studied. Teollinen Internet on lisännyt kiinnostusta datan keräämiseen ja hyödyntämiseen. Laskentatehon ja analyyttisten menetelmien kehitys on helpottanut datan hyödyntämistä. Tavoitteena tässä työssä on kehittää menetelmiä poikkeavuustilanteiden tunnistamiseen ja niiden juurisyiden selvittämiseen. Työssä rakennetaan paperikoneen käyttöjen sähkön kulutusta mallintavia regressiomalleja koneoppimisen avulla. Koneoppimista käyttämällä voidaan tehdä erilaisten laitteiden toimintaa kuvaavia malleja. Työn empiirisessä osuudessa koneoppimismalleja verrataan fysiikkaan perustuvaan malliin. Fysiikkaan perustuvan mallin tekeminen vaatii paljon prosessiosaamista. Kaikkien sähkönkulutukseen vaikuttavien tekijöiden huomioon ottaminen vie paljon aikaa. Koneoppimismalli oppii prosessinmuuttujien väliset vuorovaikutukset historiadatasta.
Poikkeavuudet tunnistetaan vertailemalla mallin tulosta mitattuun prosessiarvoon. Ajanjaksoja pidetään poikkeavina, kun mallin tuloksen ja mitatun prosessiarvon erotus on merkittävä. Poikkeavan ajanjakson syynä voi olla epäedullinen muutos prosessissa. Muutos prosessissa voi pahimmassa tapauksessa johtaa laitteiden hajoamiseen. Selittäviä tekijöitä poikkeavuustilanteille etsitään datasta Pearson korrelaation avulla. Tieto siitä, mikä aiheutti poikkeaman voi auttaa vikatilanteiden ehkäisemisessä.
Työn aikana rakennettiin sovellus, jota hyödynnetään vikatilanteiden tutkimisessa. Ensin rakennetaan malli poikkeavuuksien löytämiseksi, minkä jälkeen juurisyitä etsitään sovelluksen avulla. Työkalun avulla voidaan selittää poikkeavuustilanteita, mutta juurisyitä vikaantumisille ei löytynyt. Tulevaisuudessa muitakin menetelmiä kuin korrelaatiota voidaan tutkia juurisyiden etsimisessä.
Anomalies are identified by comparing model output and measured process value. Time periods when the difference between model output and measured process value is significant are considered anomalous. During an anomalous time period, there may have been an undesired change in the process that could lead to equipment damage. Process features that can explain anomalies are sought from the data using the Pearson correlation. Knowing what caused the anomalies can help to prevent machine failures.
An application is created during the thesis that is used in the case study in which machine failures are studied. A model is created to find anomalous periods, and the application is used to identify the root causes of anomalies. The application can explain anomalies, but root causes for machine failures cannot be identified. In future research, other methods for root cause identification besides correlation could be studied.
Poikkeavuudet tunnistetaan vertailemalla mallin tulosta mitattuun prosessiarvoon. Ajanjaksoja pidetään poikkeavina, kun mallin tuloksen ja mitatun prosessiarvon erotus on merkittävä. Poikkeavan ajanjakson syynä voi olla epäedullinen muutos prosessissa. Muutos prosessissa voi pahimmassa tapauksessa johtaa laitteiden hajoamiseen. Selittäviä tekijöitä poikkeavuustilanteille etsitään datasta Pearson korrelaation avulla. Tieto siitä, mikä aiheutti poikkeaman voi auttaa vikatilanteiden ehkäisemisessä.
Työn aikana rakennettiin sovellus, jota hyödynnetään vikatilanteiden tutkimisessa. Ensin rakennetaan malli poikkeavuuksien löytämiseksi, minkä jälkeen juurisyitä etsitään sovelluksen avulla. Työkalun avulla voidaan selittää poikkeavuustilanteita, mutta juurisyitä vikaantumisille ei löytynyt. Tulevaisuudessa muitakin menetelmiä kuin korrelaatiota voidaan tutkia juurisyiden etsimisessä.