Datan varastointiratkaisun valinta data-analytiikkaa hyödyntävässä yrityksessä
Jokelainen, Artturi; Junter, Einari (2017)
Kandidaatintutkielma
Jokelainen, Artturi
Junter, Einari
2017
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe201705246850
https://urn.fi/URN:NBN:fi-fe201705246850
Tiivistelmä
Kandidaatintyö on toteutettu kirjallisuuskatsauksena. Työn tavoite on kartoittaa erilaisia big datan varastointiratkaisuja data-analytiikassa erilaisten yritysten näkökulmasta. Työssä pyritään selvittämään ne päätekijät, joita yrityksen tulee ottaa huomioon valitessaan käytettäviä tietokantaratkaisuja ja niiden hankintamenetelmiä big data -analytiikkaan.
Työssä perehdytään big datan varastointiratkaisuihin niin teknisestä kuin liiketoiminnallisestakin näkökulmasta. Työssä keskitytään etenkin perinteisten relaatiotietokantojen ja nykyaikaisten NoSQL-tietokantojen, sekä ulkoistettujen pilvipalveluna toimivien tietokantapalveluiden ja yrityksen sisäisten IT-infrastruktuuriratkaisujen vertailuun. Huomioon otetaan ratkaisuiden tekninen soveltuvuus big data -analytiikkaan, sekä esimerkiksi kustannukset, tietoturva ja muita liiketoiminnan kannalta oleellisia tekijöitä.
Työn keskeisimpiin tuloksiin kuuluu se, että NoSQL-tietokannat sopivat yleisesti paremmin big data -analytiikkaan. Lisäksi työssä on havaittu, että datan varastoinnin ulkoistaminen pilvipalveluiden avulla voi usein tuoda yritykselle kustannussäästöjä. Työn tuotoksena syntyy taulukosta ja nelikenttämatriisista koostuva graafinen esitys, jonka avulla erilaisten yritysten on mahdollista lähteä valitsemaan tietokantaratkaisua big data -analytiikkaan riippuen yrityksen ja analytiikkaprojektin tavoitteista ja ominaisuuksista.
Työssä perehdytään big datan varastointiratkaisuihin niin teknisestä kuin liiketoiminnallisestakin näkökulmasta. Työssä keskitytään etenkin perinteisten relaatiotietokantojen ja nykyaikaisten NoSQL-tietokantojen, sekä ulkoistettujen pilvipalveluna toimivien tietokantapalveluiden ja yrityksen sisäisten IT-infrastruktuuriratkaisujen vertailuun. Huomioon otetaan ratkaisuiden tekninen soveltuvuus big data -analytiikkaan, sekä esimerkiksi kustannukset, tietoturva ja muita liiketoiminnan kannalta oleellisia tekijöitä.
Työn keskeisimpiin tuloksiin kuuluu se, että NoSQL-tietokannat sopivat yleisesti paremmin big data -analytiikkaan. Lisäksi työssä on havaittu, että datan varastoinnin ulkoistaminen pilvipalveluiden avulla voi usein tuoda yritykselle kustannussäästöjä. Työn tuotoksena syntyy taulukosta ja nelikenttämatriisista koostuva graafinen esitys, jonka avulla erilaisten yritysten on mahdollista lähteä valitsemaan tietokantaratkaisua big data -analytiikkaan riippuen yrityksen ja analytiikkaprojektin tavoitteista ja ominaisuuksista.