Discovery of Mycobacterium tuberculosis gene expression biomarkers for drug therapy response

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Sähkötekniikan korkeakoulu | Master's thesis
Ask about the availability of the thesis by sending email to the Aalto University Learning Centre oppimiskeskus@aalto.fi
Date
2015-10-19
Department
Major/Subject
Laskennallinen ja kognitiivinen biotiede
Mcode
IL3003
Degree programme
BIO - Bioinformaatioteknologia (TS2005)
Language
en
Pages
6+87
Series
Abstract
Tuberculosis (TB), caused by Mycobacterium tuberculosis (M.tb) in humans, remains a major world-wide medical challenge, affecting approximately one-third of the world’s population and killing 1.5 million people every year. New drug targets and biomarkers for treatment response are urgently needed to accelerate the development of new therapeutics and to help identify hard-to-treat patients. Until now, the possibility of using M.tb gene expression signatures as such biomarkers has not systematically been explored. This thesis models disease manifestations and treatment responses during the first 2 weeks of the standard drug therapy using whole-genome gene expression data of sputum M.tb. M.tb bacilli in sputum is dominated by a population that demonstrates phenotypic tolerance to the currently used drugs, thus making the adaptation mechanisms of this population critical to determine. For the modeling purposes, advanced machine learning methods are used, including: Principal Component Analysis, stability selection, Support Vector Machine, lasso regression, and time-course differential expression analysis based on Gaussian Processes. The main contributions of this work are as follows: 1) it shows evidence on strong associations between M.tb transcriptional patterns and patient treatment response; 2) it identifies specific mRNA signatures that predict disease severity (e.g., chest X-ray score) and early treatment success (e.g., time to positivity and TB status at week 8) with success rates of at least 89%; 3) it indicates the existence of two main patterns of mycobacterial gene expression response to early treatment; and 4) it establishes a computational framework that is well-suited for mining gene expression signatures predictive of a clinical outcome. Although the identified biomarkers require further validation, they serve as potential targets for future drug and biomarker development. Overall, the results propose a novel biomarker discovery strategy.

Tuberkuloosi on yhä yksi vakavimmista globaaleista sairauksista: kolmasosa maailman ihmisistä on saanut tuberkuloosibakteeritartunnan, ja siihen kuolee 1,5 miljoonaa ihmistä vuosittain. Tutkimukselta vaaditaan erityisesti uusia lääkekohteita ja hoitovastetta ennustavia biomarkkereita, jotka nopeuttaisivat uusien lääkkeiden kehittämistä ja auttaisivat erottamaan vaikeasti hoidettavat potilaat. Mahdollisuutta hyödyntää tuberkuloosibakteerin geeniekspressiota ko. biomarkkereina ei aikaisemmin ole kattavasti tutkittu. Tämä diplomityö mallintaa taudin oireita ja hoitovastetta peruslääkehoidon kahden ensimmäisen viikon aikana käyttämällä keuhkolimasta eristetyn tuberkuloosibakteerin koko genomin ekspressiota. Valtaosa limassa olevista bakteereista kuuluu populaation, joka on ilmiasultaan resistentti nykyisin käytössä oleville lääkkeille, minkä takia niiden selviytymismekanismit on tärkeitä määrittää. Mallinnuksessa käytetään seuraavia kehittyneitä koneoppimismenetelmiä: pääkomponenttianalyysi (PCA), stabiliteettivalinta, tukivektorikone (SVM), L1-regressio ja differentiaalisen ekspressoitumisen aikasarja-analyysi, joka perustuu Gaussisiin prosesseihin. Työn tärkeimmät saavutukset ovat seuraavat: 1) se osoittaa vahvan yhteyden tuberkuloosibakteerin geeniekspression hahmojen ja potilaan hoitovasteen välillä, 2) se määrittää lähetti-RNA-piirteitä, jotka ennustavat taudin vakavuuden (esim. rintakehän röntgenarvo) ja aikaisen hoidon onnistumisen (esim. tuberkuloosin tila viikolla kahdeksan) vähintään 89 %:n tarkkuudella, 3) se antaa näyttöä siitä, että bakteerin geeniekspressiovaste noudattaa kahta päähahmoa lääkehoidon alussa, ja 4) se luo laskennallisen rungon, joka soveltuu erityisesti kliinistä muuttujaa ennustavien geeniekspressiopohjaisten biomarkkereiden etsimiseen. Vaikka ehdotetut biomarkkerit vaativat vielä validoinnin, ne toimivat mahdollisina kohteina tulevalle lääke- ja biomarkkerikehitykselle. Kaiken kaikkiaan tulokset esittelevät uuden strategian biomarkkereiden etsimiseen.
Description
Supervisor
Rousu, Juho
Thesis advisor
Cichonska, Anna
Keywords
biomarker, gene expression modeling, mycobacterium tuberculosis, stability selection, treatment response
Other note
Citation