Visualizations as tools for finding deeper insight into data
Väänänen, Karri (2017)
Diplomityö
Väänänen, Karri
2017
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe201705226714
https://urn.fi/URN:NBN:fi-fe201705226714
Tiivistelmä
In this thesis, data and information visualization are studied as ways to generate deeper insight into data. Open data from traffic and public transportation is used in developing web-based spatio-temporal visualizations. Also, the thesis aims to study the processes around exploratory data analysis and the role of human cognition concerning visualizations.
Information visualization, data mining and visualization processes, and human cognition in the context of visualizations are studied from literature. The commonalities in visualization creation and data analysis process are examined. In addition, web-based 2D and 3D visualization artefacts are created in an iterative process. The data management of visualization prototypes, including data discovery, collection, and preprocessing, is discussed. Also, a predictive machine learning method is briefly applied to traffic flow data.
The results show that a visualization process is iterative and similar to data mining processes. Visualizations have specifiable features that define useful visualizations. Moreover, there are many techniques for visualizations to reduce cognitive burden of a data analysis task. The created prototypes demonstrate the value of 3D in visualizing complex multi-dimensional datasets. They also demonstrate the numerous challenges data management poses on visualization development. Tässä diplomityössä tutkitaan data- ja informaatiovisualisaatioita tapoina syvän ymmärryksen luomiseen tietomassasta. Avointa dataa tie- ja joukkoliikenteestä käytetään spatiaalisten, ajallisten ja verkkoperäisten visualisaatioiden kehittämisessä. Työ pyrkii myös tutkimaan ihmisen ymmärryksen roolia visualisaatioissa ja tutkivan data-analyysin prosesseja.
Informaatiovisualisaatiota, data-analyysin ja visualisoinnin prosesseja sekä ihmisen ymmärrystä visualisaatioiden yhteydessä tutkitaan kirjallisuudesta. Visualisaatioiden kehittämisen ja data-analyysiprosessien yhteyksiä vertaillaan. Lisäksi verkkoperäisiä 2D ja 3D visualisaatioita kehitetään osana iteratiivista prosessia. Visualisaatioiden tiedonhallinnointia käsitellään, kuten datan löytämistä, keräämistä ja esiprosessointia. Myös ennakoivan koneoppimisen keinoja sovelletaan lyhyesti liikennevirtadataan.
Tulokset osoittavat, että visualisaatioprosessi on iteratiivinen ja samankaltainen data-analyysiprosesseihin verrattuna. Visualisaatioilla on eriteltäviä ominaisuuksia, jotka määrittävät hyödyllisen visualisaation. Lisäksi on monia visualisoinnin tekniikoita, joilla voidaan vähentää data-analyysityön ymmärryksellistä taakkaa. Luodut prototyypit osoittavat 3D visualisoinnin arvon kuvannettaessa monimutkaisia moniulotteisia joukkoja tietoa. Ne osoittavat myös millaisia haasteita tiedonhallinnointi asettaa visualisaatioiden kehittämiselle.
Information visualization, data mining and visualization processes, and human cognition in the context of visualizations are studied from literature. The commonalities in visualization creation and data analysis process are examined. In addition, web-based 2D and 3D visualization artefacts are created in an iterative process. The data management of visualization prototypes, including data discovery, collection, and preprocessing, is discussed. Also, a predictive machine learning method is briefly applied to traffic flow data.
The results show that a visualization process is iterative and similar to data mining processes. Visualizations have specifiable features that define useful visualizations. Moreover, there are many techniques for visualizations to reduce cognitive burden of a data analysis task. The created prototypes demonstrate the value of 3D in visualizing complex multi-dimensional datasets. They also demonstrate the numerous challenges data management poses on visualization development.
Informaatiovisualisaatiota, data-analyysin ja visualisoinnin prosesseja sekä ihmisen ymmärrystä visualisaatioiden yhteydessä tutkitaan kirjallisuudesta. Visualisaatioiden kehittämisen ja data-analyysiprosessien yhteyksiä vertaillaan. Lisäksi verkkoperäisiä 2D ja 3D visualisaatioita kehitetään osana iteratiivista prosessia. Visualisaatioiden tiedonhallinnointia käsitellään, kuten datan löytämistä, keräämistä ja esiprosessointia. Myös ennakoivan koneoppimisen keinoja sovelletaan lyhyesti liikennevirtadataan.
Tulokset osoittavat, että visualisaatioprosessi on iteratiivinen ja samankaltainen data-analyysiprosesseihin verrattuna. Visualisaatioilla on eriteltäviä ominaisuuksia, jotka määrittävät hyödyllisen visualisaation. Lisäksi on monia visualisoinnin tekniikoita, joilla voidaan vähentää data-analyysityön ymmärryksellistä taakkaa. Luodut prototyypit osoittavat 3D visualisoinnin arvon kuvannettaessa monimutkaisia moniulotteisia joukkoja tietoa. Ne osoittavat myös millaisia haasteita tiedonhallinnointi asettaa visualisaatioiden kehittämiselle.