Hand tracking in high-speed camera videos
Hiltunen, Ville (2013)
Diplomityö
Hiltunen, Ville
2013
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe201311277458
https://urn.fi/URN:NBN:fi-fe201311277458
Tiivistelmä
Visual object tracking has been one of the most popular research topics in the field of
computer vision recently. Specifically, hand tracking has attracted significant attention
since it would enable many useful practical applications. However, hand tracking is still
a very challenging problem which cannot be considered solved. The fact that almost
every aspect of hand appearance can change is the fundamental reason for this difficulty.
This thesis focused on 2D-based hand tracking in high-speed camera videos. During the
project, a toolbox for this purpose was collected which contains nine different tracking
methods. In the experiments, these methods were tested and compared against each other
with both high-speed videos recorded during the project and publicly available normal
speed videos. The results revealed that tracking accuracies varied considerably depending
on the video and the method. Therefore, no single method was clearly the best in all
videos, but three methods, CT, HT, and TLD, performed better than the others overall.
Moreover, the results provide insights about the suitability of each method to different
types and situations of hand tracking. Kohteiden visuaalinen seuranta videoissa on ollut yksi tietokonenäkötutkimuksen suosituimmista aiheista viime aikoina. Erityisesti käsien liikkeiden seuranta on kiinnostanut
paljon sen mahdollistamien monien käytännön sovellusten johdosta. Käsien liikkeiden
seuranta on kuitenkin erittäin vaikea ongelma, jota ei voida pitää ratkaistuna. Perimmäinen syy tähän vaikeuteen on se, että lähes jokainen seikka käden ulkonäöstä voi vaihdella.
Tässä diplomityössä keskityttiin kaksiulotteiseen kädenseurantaan suurnopeusvideoissa.
Projektin aikana tarkoitusta varten kerättiin yhdeksän eri menetelmää sisältävä kokoelma.
Testeissä näitä menetelmiä verrattiin toisiinsa käyttäen sekä omia suurnopeusvideoita että
yleisesti saatavilla olevia normaalinopeuksisia videoita. Kokeiden tulokset osoittivat, että
seurantatarkkuudet vaihtelivat huomattavasti eri videoiden ja menetelmien välillä. Siksi
yksikään menetelmä ei ollut selvästi paras kaikissa videoissa, mutta kolme menetelmää,
CT, HT ja TLD, nousi ylitse muiden kaiken kaikkiaan. Lisäksi tulokset antavat selviä
viitteitä menetelmien soveltuvuudesta käden seurantaan eri sovelluksissa ja tilanteissa.
computer vision recently. Specifically, hand tracking has attracted significant attention
since it would enable many useful practical applications. However, hand tracking is still
a very challenging problem which cannot be considered solved. The fact that almost
every aspect of hand appearance can change is the fundamental reason for this difficulty.
This thesis focused on 2D-based hand tracking in high-speed camera videos. During the
project, a toolbox for this purpose was collected which contains nine different tracking
methods. In the experiments, these methods were tested and compared against each other
with both high-speed videos recorded during the project and publicly available normal
speed videos. The results revealed that tracking accuracies varied considerably depending
on the video and the method. Therefore, no single method was clearly the best in all
videos, but three methods, CT, HT, and TLD, performed better than the others overall.
Moreover, the results provide insights about the suitability of each method to different
types and situations of hand tracking.
paljon sen mahdollistamien monien käytännön sovellusten johdosta. Käsien liikkeiden
seuranta on kuitenkin erittäin vaikea ongelma, jota ei voida pitää ratkaistuna. Perimmäinen syy tähän vaikeuteen on se, että lähes jokainen seikka käden ulkonäöstä voi vaihdella.
Tässä diplomityössä keskityttiin kaksiulotteiseen kädenseurantaan suurnopeusvideoissa.
Projektin aikana tarkoitusta varten kerättiin yhdeksän eri menetelmää sisältävä kokoelma.
Testeissä näitä menetelmiä verrattiin toisiinsa käyttäen sekä omia suurnopeusvideoita että
yleisesti saatavilla olevia normaalinopeuksisia videoita. Kokeiden tulokset osoittivat, että
seurantatarkkuudet vaihtelivat huomattavasti eri videoiden ja menetelmien välillä. Siksi
yksikään menetelmä ei ollut selvästi paras kaikissa videoissa, mutta kolme menetelmää,
CT, HT ja TLD, nousi ylitse muiden kaiken kaikkiaan. Lisäksi tulokset antavat selviä
viitteitä menetelmien soveltuvuudesta käden seurantaan eri sovelluksissa ja tilanteissa.