Koneoppimiskehitys ML.NET-sovelluskehyksellä
Juppi, Henri (2019)
Juppi, Henri
2019
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-201905077926
https://urn.fi/URN:NBN:fi:amk-201905077926
Tiivistelmä
Insinöörityöprojektin yhtenä tarkoituksena oli kehittää koneoppimisratkaisuja projektin teettäneen yrityksen datalla. Kehittämisen työkaluksi valittiin ML.NET-sovelluskehys, joka on ilmainen avoimen lähdekoodin koneoppimissovelluskehys. Insinöörityössä tutkittiin, miten ML.NET-sovelluskehystä käytetään ja mitä se tarjoaa.
Insinöörityöprojektissa oli tarkoituksena kehittää keinoja auttaa käyttäjiä dokumenttien luokittelussa ja samankaltaisten dokumenttien löytämisessä projektin teettäneen yrityksen .NET-sovelluksissa. Näitä ongelmia ratkaistiin ja toteutettiin ML.NET-sovelluskehyksellä. Insinöörityöprojektissa kehitettiin työkalu, joka helpottaa uusien koneoppimisratkaisujen kehittämistä. Työkalusta kehitettiin konsolisovellus, jonka toimintaa voitiin säätää työkaluun laadituilla asetuksilla.
Kehitystyö aloitettiin dokumenttien luokittelulla, johon keskityttiin insinöörityön aikana eniten. Dokumenttien luokittelulla tavoiteltiin luokittelun automatisointia ilman, että käyttäjien tarvitsisi luokitella dokumentteja itse. Mittaustuloksien perusteella tavoitetta ei saavutettu kokonaan. Mittauksilla kuitenkin päästiin sellaiseen tulokseen, että dokumenttien luokittelun automatisointia voidaan yrittää tuotantosovelluksissa.
Dokumenttien luokittelun jälkeen tehtiin suomen ja englannin kielen luokittelija. Tämän kielten luokittelijan mittaustulokset olivat lähes täydelliset. Luokittelijaa voi käyttää samankielisten dokumenttien etsimisessä tai datan esikäsittelyssä suomen- ja englanninkielisissä teksteissä.
Lopuksi kehitystyössä tehtiin dokumenttien ryhmittelyä, jonka avulla pyrittiin löytämään samankaltaisia dokumentteja, joita voitaisiin ehdottaa käyttäjille. Dokumenttien ryhmittelyllä onnistuttiin luomaan selkeitä ryhmiä datasta. Samankaltaisilla dokumenteilla voidaan yrittää mitata ryhmittelyn vaikutuksia käyttäjien katseluhistoriaan tuotantosovelluksissa.
Insinöörityöprojektissa oli tarkoituksena kehittää keinoja auttaa käyttäjiä dokumenttien luokittelussa ja samankaltaisten dokumenttien löytämisessä projektin teettäneen yrityksen .NET-sovelluksissa. Näitä ongelmia ratkaistiin ja toteutettiin ML.NET-sovelluskehyksellä. Insinöörityöprojektissa kehitettiin työkalu, joka helpottaa uusien koneoppimisratkaisujen kehittämistä. Työkalusta kehitettiin konsolisovellus, jonka toimintaa voitiin säätää työkaluun laadituilla asetuksilla.
Kehitystyö aloitettiin dokumenttien luokittelulla, johon keskityttiin insinöörityön aikana eniten. Dokumenttien luokittelulla tavoiteltiin luokittelun automatisointia ilman, että käyttäjien tarvitsisi luokitella dokumentteja itse. Mittaustuloksien perusteella tavoitetta ei saavutettu kokonaan. Mittauksilla kuitenkin päästiin sellaiseen tulokseen, että dokumenttien luokittelun automatisointia voidaan yrittää tuotantosovelluksissa.
Dokumenttien luokittelun jälkeen tehtiin suomen ja englannin kielen luokittelija. Tämän kielten luokittelijan mittaustulokset olivat lähes täydelliset. Luokittelijaa voi käyttää samankielisten dokumenttien etsimisessä tai datan esikäsittelyssä suomen- ja englanninkielisissä teksteissä.
Lopuksi kehitystyössä tehtiin dokumenttien ryhmittelyä, jonka avulla pyrittiin löytämään samankaltaisia dokumentteja, joita voitaisiin ehdottaa käyttäjille. Dokumenttien ryhmittelyllä onnistuttiin luomaan selkeitä ryhmiä datasta. Samankaltaisilla dokumenteilla voidaan yrittää mitata ryhmittelyn vaikutuksia käyttäjien katseluhistoriaan tuotantosovelluksissa.