Analysis of survey data by numerical modelling
Hyvärinen, Arna (2020)
Diplomityö
Hyvärinen, Arna
2020
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2020110989725
https://urn.fi/URN:NBN:fi-fe2020110989725
Tiivistelmä
Analysing survey data poses a challenge of often being based on human feelings, which cannot be measured by objective numerical values. The Finnish Institute of Occupational Health has formulated a survey to measure the cognitive ergonomy of the workplace.
In this thesis, the survey data is analysed by means of Principal Component Analysis. These results are compared to analysis results of Probabilistic Principal Component Analysis and L1-norm Principal Component Analysis. The added value of Principal Compo- nent Analysis is producing clear visualisations, which helps with explaining the results.
Survey data is often riddled with missing values, the handling of which by data imputation is discussed. Different methods of analysis have different capabilities, and they compute differently if at all in the presence of missing values.
In conclusion, survey data analysis can be performed using different methods, and due to the nature of the data, results may vary. Kyselydata-analyysi koskee usein pehmeitä arvoja kuten tunteita, joita ei välttämättä voi esittää suoraan numeerisesti. Tämä tekee kyselydata-analyysistä haastavaa. Työterveyslaitos on valmistanut työn kognitiivista ergonomiaa mittaavan kyselyn.
Tässä työssä kyselydataa analysoidaan pääkomponenttianalyysin keinoin. Tuloksia vertaillaan todennäköisyyspääkomponenttianalyysin ja L1-normipääkomponenttianalyysin tuloksiin. Pääkomponenttianalyysin hyöty tulee selkeistä visualisaatioista, joilla tulokset on helppo selittää.
Kyselydatassa on usein paljon puuttuvia arvoja. Näiden käsittelyä pohditaan. Eri analyysikeinot omaavat erilaisia vahvuuksia ja rajoituksia, ja ne käyttäytyvät eri lailla puuttuvien arvojen suhteen.
Kyselydata-analyysia voidaan suorittaa eri tavoin, ja datan luoneen takia tulokset voivat eritä.
In this thesis, the survey data is analysed by means of Principal Component Analysis. These results are compared to analysis results of Probabilistic Principal Component Analysis and L1-norm Principal Component Analysis. The added value of Principal Compo- nent Analysis is producing clear visualisations, which helps with explaining the results.
Survey data is often riddled with missing values, the handling of which by data imputation is discussed. Different methods of analysis have different capabilities, and they compute differently if at all in the presence of missing values.
In conclusion, survey data analysis can be performed using different methods, and due to the nature of the data, results may vary.
Tässä työssä kyselydataa analysoidaan pääkomponenttianalyysin keinoin. Tuloksia vertaillaan todennäköisyyspääkomponenttianalyysin ja L1-normipääkomponenttianalyysin tuloksiin. Pääkomponenttianalyysin hyöty tulee selkeistä visualisaatioista, joilla tulokset on helppo selittää.
Kyselydatassa on usein paljon puuttuvia arvoja. Näiden käsittelyä pohditaan. Eri analyysikeinot omaavat erilaisia vahvuuksia ja rajoituksia, ja ne käyttäytyvät eri lailla puuttuvien arvojen suhteen.
Kyselydata-analyysia voidaan suorittaa eri tavoin, ja datan luoneen takia tulokset voivat eritä.