Reinforcement learning in machinery control
Kallio, Samu (2021)
Kandidaatintyö
Kallio, Samu
2021
School of Energy Systems, Konetekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021082744530
https://urn.fi/URN:NBN:fi-fe2021082744530
Tiivistelmä
This thesis focuses on assessing the suitability of reinforcement learning in machinery control. For this purpose, two simulated robots representing common machinery control tasks are trained by utilizing state-of-the-art reinforcement learning algorithms. The learning behavior is assessed with behavioral scores received from the robot’s environment, as well as visually observing the simulation behavior.
Both robots learned stable behavioral models that corresponded the desired behavior with small imperfections. This led to the conclusion that reinforcement learning has potential as a tool of machinery control automation with certain precautions. Tässä kandidaatintyössä arvioidaan vahvistusoppimisen soveltuvuutta koneohjauksen automatisointiin. Tämä tehdään kouluttamalla kaksi simuloitua, tavanomaista koneohjauksen tehtävää edustavaa yksinkertaista robottia hyödyntämällä lupaavimpia vahvistusoppimisalgoritmeja. Oppimiskäyttäytymistä seurataan numeerisilla pisteytysarvoilla, joita algoritmi vastaanottaa toiminnastaan, sekä seuraamalla simulaation käyttäytymistä visuaalisesti.
Koulutuksen tuloksena molemmat robotit saatiin oppimaan vakaa käyttäytymismalli, joka vastasi haluttua pienin epätäydellisyyksin. Johtopäätöksenä tästä katsottiin, että vahvistusoppimisella on tietyin varauksin potentiaalia koneautomaation välineenä.
Both robots learned stable behavioral models that corresponded the desired behavior with small imperfections. This led to the conclusion that reinforcement learning has potential as a tool of machinery control automation with certain precautions.
Koulutuksen tuloksena molemmat robotit saatiin oppimaan vakaa käyttäytymismalli, joka vastasi haluttua pienin epätäydellisyyksin. Johtopäätöksenä tästä katsottiin, että vahvistusoppimisella on tietyin varauksin potentiaalia koneautomaation välineenä.