On-premises-datan käsittely pilviraportoinnissa : case CGI Suomi Oy
Mustonen, Jenna (2020)
Mustonen, Jenna
2020
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202005057370
https://urn.fi/URN:NBN:fi:amk-202005057370
Tiivistelmä
Opinnäytetyössä tutustuttiin pilvi- ja on-premises-ympäristöjen ominaisuuksiin ja eroihin, kerrottiin tietojen käsittelystä, kuljettamisesta ja varastoinnista ETL-prosessien avulla raportoinnin käytettäväksi sekä perehdyttiin tiedon laadun merkitykseen raportointiratkaisun onnistumiseksi. Samalla tutustuttiin Power BI -sovelluksen tapoihin päivittää ja ottaa tietoa vastaan erilaisista tietolähteistä.
Toteutuksen komponentteina käytettiin Azure Blob Storagea, Data Factorya, SQL-tietovarastoa ja Azure Analysis Serviceä. Reaaliaikaisesti tietomallia lukevat testiraportit julkaistiin Power BI Servicessä.
Opinnäytetyön tavoitteena oli valmistella tietojen kuljettamisen ja tuoreuttamisen ratkaisuehdotus ajanhallinnan raportoinnille, joka toteutetaan CGI Oy:lle Microsoftin Power BI -raportointiohjelmistolla. Ratkaisussa selvitettiin, onko ajanhallinnan dataa mahdollista viedä tietoturvallisesti pilvipalveluihin, sekä tutkittiin tapaa päivittää dataa monta kertaa päivässä raportoinnin vaatimusten mukaisesti. Samalla päätettiin tapa siirtää ja käsitellä informaatiota raporteilla käytettävään ja muokattavaan muotoon.
Lopputuloksena muodostui testiratkaisu CGI:lle, jossa lähdetiedostot kuljetetaan paikalliselta palvelimelta tunnin välein Azure-pilveen Power BI -raportoinnin hyödynnettäväksi.
Tulevaisuudessa ratkaisussa tuetaan rivitason suodattamista ja parannetaan tiedon päivittymisen nopeutta. Raportteja tullaan upottamaan ulkopuolisiin sovelluksiin, jolloin Power BI Servicen lisäksi käytetään Power BI Embedded -ratkaisua, jossa käyttäjän identiteettiä vastaan palautetaan tietolähteestä raportille tarvittavat tiedot suojausasetusten mukaisesti. This thesis introduces the main features and differences of the on-premises and cloud environments, explains the basic tools and different steps of the ETL procedure and specifies the quality requirements for successful reporting from the data. It also introduces Power BI and its ways to connect, modify and refresh the data from the different repositories.
The components of the implementation were Azure Blob Storage, Data Factory, SQL Database and Azure Analysis Service. Test reports with live connection were published into Power BI Service.
The goal of the thesis was to produce and design the proposed solution for CGI time management reporting with Power BI, which uses the data from the on-premises environment published to the Azure cloud in a secure manner. The solution tests the possibilities to publish time management data into cloud safely and determines the way for rapid data refreshing the reports multiple times per day.
The result was a test solution that transfers the data from a local environment into Azure Cloud once an hour and modifies the data to suit Power BI reporting.
In the future, the RLS (Row Level Security) will be implemented into Azure Analysis Service and the refresh rate will become more frequent. Reports will be published into external applications, which requires the deployment of the Power BI Embedded, which uses the effective identity to identify the user for the reports.
Toteutuksen komponentteina käytettiin Azure Blob Storagea, Data Factorya, SQL-tietovarastoa ja Azure Analysis Serviceä. Reaaliaikaisesti tietomallia lukevat testiraportit julkaistiin Power BI Servicessä.
Opinnäytetyön tavoitteena oli valmistella tietojen kuljettamisen ja tuoreuttamisen ratkaisuehdotus ajanhallinnan raportoinnille, joka toteutetaan CGI Oy:lle Microsoftin Power BI -raportointiohjelmistolla. Ratkaisussa selvitettiin, onko ajanhallinnan dataa mahdollista viedä tietoturvallisesti pilvipalveluihin, sekä tutkittiin tapaa päivittää dataa monta kertaa päivässä raportoinnin vaatimusten mukaisesti. Samalla päätettiin tapa siirtää ja käsitellä informaatiota raporteilla käytettävään ja muokattavaan muotoon.
Lopputuloksena muodostui testiratkaisu CGI:lle, jossa lähdetiedostot kuljetetaan paikalliselta palvelimelta tunnin välein Azure-pilveen Power BI -raportoinnin hyödynnettäväksi.
Tulevaisuudessa ratkaisussa tuetaan rivitason suodattamista ja parannetaan tiedon päivittymisen nopeutta. Raportteja tullaan upottamaan ulkopuolisiin sovelluksiin, jolloin Power BI Servicen lisäksi käytetään Power BI Embedded -ratkaisua, jossa käyttäjän identiteettiä vastaan palautetaan tietolähteestä raportille tarvittavat tiedot suojausasetusten mukaisesti.
The components of the implementation were Azure Blob Storage, Data Factory, SQL Database and Azure Analysis Service. Test reports with live connection were published into Power BI Service.
The goal of the thesis was to produce and design the proposed solution for CGI time management reporting with Power BI, which uses the data from the on-premises environment published to the Azure cloud in a secure manner. The solution tests the possibilities to publish time management data into cloud safely and determines the way for rapid data refreshing the reports multiple times per day.
The result was a test solution that transfers the data from a local environment into Azure Cloud once an hour and modifies the data to suit Power BI reporting.
In the future, the RLS (Row Level Security) will be implemented into Azure Analysis Service and the refresh rate will become more frequent. Reports will be published into external applications, which requires the deployment of the Power BI Embedded, which uses the effective identity to identify the user for the reports.