Pedestrian Detection with Deep Convolutional Neural Networks

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2018-03-19
Department
Major/Subject
Computer Science
Mcode
SCI3042
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
en
Pages
92
Series
Abstract
The thesis studied the classic computer vision problem of pedestrian detection, where an algorithm attempts to locate the humans present in the input data. The problem is all the more relevant due to the increasing need for such a system as autonomous vehicles are going to be introduced to the consumer market in the future. It was set about to be solved by implementing and training from scratch a combination of two convolutional neural networks. One had a good track record on visual tasks and the second had concentrated on fast run-time performance, which is a practical concern in the context of this problem. In the first experiment, where the novel network was asked to just determine whether pedestrians were present in the input images, it showed acceptable train­ing progress, but with only 29 epochs completed by the large network, the training did not converge and it had a misclassification rate of 0.44. The second experi­ment was a proper localization task, but due to lacking training time and poor testing of the hyperparameters and the cost function the network did not manage to converge and did not produce acceptable results. In a field comprised of best practices built by trial and error based development, this work can be seen as an error that can be drawn upon and serves as a start­ing point for further research. No fundamental problem with the approach was found, so more training time and a more exhaustive testing on the different hyperparameters and cost function variations are recommended as the path to a good working solution. As part of the work, a new dataset with many additional sensors was collected both in winter and summer conditions, but it was never used, as the lacking ground true values for the locations of the pedestrians were not able to be produced.

Työssä tutkittiin klassista konenäon piiriin kuuluvaa jalankulkijoiden tunnistamisen ongelmaa, jossa algoritmi pyrkii paikantamaan ihmisten sijainnin syötekuvista. Ongelma on yhä oleellisempi markkinoille tulevaisuudessa tulevien autonomisten ajoneuvojen myötä. Se pyrittiin ratkaisemaan implementoimalla ja opettamalla alusta alkaen kahden konvolutiivisen neuroverkon yhdistelmä. Toinen näistä oli osoittautunut hyväksi visuaalisten ongelmien ratkaisussa ja toinen oli keskittynyt nopeaan ajonaikaiseen suorituskykyyn, mikä on tärkeä käytännön huolenaihe tässä kontekstissa. Ensimmäisessä kokeessa, jossa tätä uudenlaista neuroverkkoa pyydettiin vain ennustamaan onko kuvassa ihmisiä, sen oppimisen eteneminen vaikutti hyvältä alulta, mutta näin isolle verkolle vain 29 eepokin ajo ei riittänyt konvergoitumiseen, joten sen luokitteluvirhe jäi 0.44:aan. Toinen koe oli varsinainen paikannuskoe, mutta lyhyen opetusajan ja puutteellisen hyperparametrien ja kustannusfunktion testaamisen myötä verkkoa ei saatu konvergoitumaan sellaiseksi, että se olisi tuottanut hyväksyttäviä tuloksia. Tutkimuksen alalla, joka koostuu joukosta parhaita käytäntöjä, jotka on luotu yrityksen ja erehdyksen kautta, tämä työ voidaan nähdä yhtenä erehdyksenä, josta voi oppia ja joka toimii hyvänä lähtökohtana tulevissa tutkimuksissa. Mitään perustavanlaatuista ongelmaa lähestymistavassa ei havaittu, joten isommalla määrällä opetusaikaa ja perusteellisemmalla hyperparametrien ja kustannusfunk­tioiden testaamisella voitaisiin hyvin toimiva ratkaisu saada luotua. Osana työtä kerättiin myös uusi aineisto sekä kesä- että talviolosuhteissa suuremmalla määrällä erilaisia antureita, mutta sitä ei päästy hyödyntämään, kun puuttuvia oikeita jalankulkijoiden sijainteja ei saatu luotua.
Description
Supervisor
Lehtinen, Jaakko
Thesis advisor
Kutila, Matti
Lehtinen, Jaakko
Keywords
convolutional, neural networks, pedestrian detection, localization, computer vision, autonomous vehicles
Other note
Citation