Clustering electricity consumption data to identify optimal electricity contracts
Halas, Jan (2020)
Diplomityö
Halas, Jan
2020
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe202001081471
https://urn.fi/URN:NBN:fi-fe202001081471
Tiivistelmä
This thesis is aimed to study development of electricity consumption trends, cluster historical consumption time series and aim to determine optimal price contract for both individual clusters and customers.
First main objective of this thesis is with the help of machine learning algorithms to meaningfully segment electricity consumption data. Second objective is then to find optimal electricity contract solution for each of these segments.
A literature review is conducted to gain information on the latest developments in the field of energy consumption studies combined with clustering algorithms and their applications on the historical electricity consumption data of customers. In addition, the concepts of data preprocessing as a key part of any data science project are covered.
The results imply that two-tier clustering, as a machine learning technique, is an efficient tool to segment electricity load profiles and provide insights into consumer behavior. A solid model performance of 93 % accuracy provides applicable indications to determine optimal electricity contract type for company’s client. The results show that the data-segmentation model constructed could be applied to create economic benefits for the electricity consumers. Tämän diplomityön tarkoituksena on tutkia sähkönkulutukseen ja sen segmentointiin liittyviä trendejä, rakentaa sähkönkuluttajien segmentointimalli käyttäen aikasarjadataa sekä määritellä kyseisille segmenteille tai yksittäisille kuluttajille kustannustehokkaimmat sähkösopimukset.
Työn ensimmäisenä tavoitteena on koneoppimisen menetelmien avulla segmentoida 370 asiakkaan sähkönkulutus. Toisena keskeisenä tavoitteena on määrittää näille segmenteille optimaaliset kulutustyyliin sopivat sähkösopimukset.
Vastauksia näihin edellä mainittuihin tavoitteisiin haetaan kirjallisuuskatsauksen avulla. Diplomityössä tutustutaan energiakulutuksen tutkimuksiin, koneoppimisen algoritmeihin ja niiden soveltamiseen sähkönkulutuksen klusteroinnin näkökulmasta. Lisäksi tutustutaan datan prosessointiin, joka on oleellinen osa datan tutkimisessa.
Lopputulokset tukevat kirjallisuuskatsauksen pohjalta valittua ja käytettyä kaksivaiheista klusterointimenetelmää, joka osoittautui tehokkaaksi ja tarkaksi tavaksi segmentoida sähkönkuluttajia. Rakennettu malli tuotti 93 prosentin tarkkuuden käytetyllä datasetillä. Täten on mahdollista todeta, että malli luo hyvän edellytyksen määrittämään suurella varmuudella edullisimman sähkösopimuksen sähköyhtiön asiakkaalle. Käytännössä tämä tarkoittaa sitä, että segmentointimalli pystyy parhaassa tapauksessa auttaa säästämään selvää rahaa asiakkaalle.
First main objective of this thesis is with the help of machine learning algorithms to meaningfully segment electricity consumption data. Second objective is then to find optimal electricity contract solution for each of these segments.
A literature review is conducted to gain information on the latest developments in the field of energy consumption studies combined with clustering algorithms and their applications on the historical electricity consumption data of customers. In addition, the concepts of data preprocessing as a key part of any data science project are covered.
The results imply that two-tier clustering, as a machine learning technique, is an efficient tool to segment electricity load profiles and provide insights into consumer behavior. A solid model performance of 93 % accuracy provides applicable indications to determine optimal electricity contract type for company’s client. The results show that the data-segmentation model constructed could be applied to create economic benefits for the electricity consumers.
Työn ensimmäisenä tavoitteena on koneoppimisen menetelmien avulla segmentoida 370 asiakkaan sähkönkulutus. Toisena keskeisenä tavoitteena on määrittää näille segmenteille optimaaliset kulutustyyliin sopivat sähkösopimukset.
Vastauksia näihin edellä mainittuihin tavoitteisiin haetaan kirjallisuuskatsauksen avulla. Diplomityössä tutustutaan energiakulutuksen tutkimuksiin, koneoppimisen algoritmeihin ja niiden soveltamiseen sähkönkulutuksen klusteroinnin näkökulmasta. Lisäksi tutustutaan datan prosessointiin, joka on oleellinen osa datan tutkimisessa.
Lopputulokset tukevat kirjallisuuskatsauksen pohjalta valittua ja käytettyä kaksivaiheista klusterointimenetelmää, joka osoittautui tehokkaaksi ja tarkaksi tavaksi segmentoida sähkönkuluttajia. Rakennettu malli tuotti 93 prosentin tarkkuuden käytetyllä datasetillä. Täten on mahdollista todeta, että malli luo hyvän edellytyksen määrittämään suurella varmuudella edullisimman sähkösopimuksen sähköyhtiön asiakkaalle. Käytännössä tämä tarkoittaa sitä, että segmentointimalli pystyy parhaassa tapauksessa auttaa säästämään selvää rahaa asiakkaalle.