Band gap prediction for inorganic crystals with machine learning
Sotskov, Vadim (2018)
Diplomityö
Sotskov, Vadim
2018
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2018051124013
https://urn.fi/URN:NBN:fi-fe2018051124013
Tiivistelmä
Recently, results from various computational materials science codes are stored in databases, which allow fast search and screening of different materials by their properties. Such huge materials databases allow a big-data driven approach in materials discovery, which should significantly accelerate the progress in this field.
The key idea is to apply machine learning on existing calculations for making accurate interpolations for physical properties. Therefore, it would be possible to predict properties for new materials, instead of making explicit calculations for all of them, thus involving significantly less computational costs, than is required in DFT, Quantum Monte Carlo, or any other quantum mechanical modeling method.
The main goal of this thesis is to predict band gap values of inorganic crystals and to classify materials into metals and insulators, using a machine learning approach. Theoretical part of this thesis includes an overview of the used machine learning approach and introduces “descriptors” – materials representations in a data set, which play a key role in prediction accuracy. The main objective of this thesis is to study, how different descriptors and algorithms affect the learning. Results showed that with a proper descriptor and learning algorithm it is possible to predict band gap with mean absolute error of 0.53 eV and classify materials into metals and insulators with 90% of accuracy. Viime aikoina tietokantoihin on tallennettu laskennallisen materiaalifysiikan tuloksia useista eri lähteistä. Tämä mahdollistaa eri materiaalien nopean etsinnän ja seulonnan niiden ominaisuuksien perusteella. Tällaiset valtavat materiaalitietokannat mahdollistavat suuren datapohjaisen lähestymistavan materiaalien löytämisessä, mikä merkittävästi nopeuttaa alan kehitystä. Yksi avainideoista on nykyisten laskelmien käyttö tarkkojen interpolointimallien luomiseen koneoppimisen avulla. Tämä mahdollistaa nopean ominaisuuksien ennustaminen uusille materiaaleille sen sijaan, että niille suoritettaisiin varsinaisia laskelmia, mikä merkitseee huomattavasti pienempiä laskentakustannuksia kuin mitä vaaditaan DFT, Quantum Monte Carlo -järjestelmässä tai missä tahansa muussa kvanttimekaanisessa mallintamismenetelmässä.
Tämän opinnäytetyön päätavoitteena on arvioida epäorgaanisten kiteiden kaistaleveyksiä ja luokitella aineet metalleihin ja eristeisiin käyttäen koneoppimista. Opinnäytetyön teoreettinen osa sisältää yleiskatsauksen koneoppimisesta ja esittelee kiderakenteiden geometrian hahmottamiseen luotuja rakennekuvauksia joilla on keskeinen rooli ennustustarkkuudessa. Tämän opinnäytetyön päätavoitteena on tutkia, kuinka erilaiset rakennekuvaukset vaikuttavat oppimiseen. Tulokset osoittivat, että oikealla rakennekuvauksella on mahdollista ennustaa energia-aukon suuruus keskimäärin 0.53 eV virheellä ja luokitella materiaalit metalleihin ja eristeisiin 90% tarkkuudella.
The key idea is to apply machine learning on existing calculations for making accurate interpolations for physical properties. Therefore, it would be possible to predict properties for new materials, instead of making explicit calculations for all of them, thus involving significantly less computational costs, than is required in DFT, Quantum Monte Carlo, or any other quantum mechanical modeling method.
The main goal of this thesis is to predict band gap values of inorganic crystals and to classify materials into metals and insulators, using a machine learning approach. Theoretical part of this thesis includes an overview of the used machine learning approach and introduces “descriptors” – materials representations in a data set, which play a key role in prediction accuracy. The main objective of this thesis is to study, how different descriptors and algorithms affect the learning. Results showed that with a proper descriptor and learning algorithm it is possible to predict band gap with mean absolute error of 0.53 eV and classify materials into metals and insulators with 90% of accuracy.
Tämän opinnäytetyön päätavoitteena on arvioida epäorgaanisten kiteiden kaistaleveyksiä ja luokitella aineet metalleihin ja eristeisiin käyttäen koneoppimista. Opinnäytetyön teoreettinen osa sisältää yleiskatsauksen koneoppimisesta ja esittelee kiderakenteiden geometrian hahmottamiseen luotuja rakennekuvauksia joilla on keskeinen rooli ennustustarkkuudessa. Tämän opinnäytetyön päätavoitteena on tutkia, kuinka erilaiset rakennekuvaukset vaikuttavat oppimiseen. Tulokset osoittivat, että oikealla rakennekuvauksella on mahdollista ennustaa energia-aukon suuruus keskimäärin 0.53 eV virheellä ja luokitella materiaalit metalleihin ja eristeisiin 90% tarkkuudella.