Social media mining for affective and business cues
Bounab, Yazid (2023-09-14)
https://urn.fi/URN:ISBN:9789526237831
Kuvaus
Tiivistelmä
Abstract
Social media has become part of everyday life and significantly contributed to the emergence of new social behavior that impact individuals, communities and business industry.This thesis contributes to the development of new natural language processing modules to uncover new insights from user generated content. Specifically, the thesis tackles five key research objectives. First, it seeks to comprehend the role of multimedia objects in stimulating users' responses in tourism sector by mapping the image quality with user's engagement and sentiment polarity. Second, it contributes to automatic text summarization of story-telling documents by providing a new framework to handle named-entity and co-referencing while keeping track of the semantic role labelling. Third, it provides a new framework for extending word-level semantic similarity to sentence-level similarity that helps in paraphrasing detection. Fourth, it provides a new deep learning framework using BERT architecture for cause detection that is applied in a business application, consisting of trade-barrier identification. Fifth, it suggests a new deep learning based model for online radicalization detection utilizing ERG22+ ontology. The thesis takes the Feynman's three-step methodology (setting up hypothesis, collecting relevant data and testing the hypothesis through experiments) as the primary methodology to achieve each of the five goals.
The thesis delivers new dataset (Tourism48), new natural language processing modules, and algorithms, which are made publicly available to scientific community.
Tiivistelmä
Sosiaalisesta mediasta on tullut arkipäivän osa ja se on merkittävästi vaikuttanut uusien sosiaalisten käyttäytymistapojen syntyyn, jotka vaikuttavat yksilöihin, yhteisöihin ja liiketoimintaan. Tämä väitöskirja edistää uusien kielitieteellisten käsittelymoduulien kehittämistä käyttäjän luomaa sisältöä koskevien uusien näkökulmien paljastamiseksi. Erityisesti väitöskirja käsittelee viittä tärkeää tutkimustavoitetta. Ensinnäkin se pyrkii ymmärtämään monimediakohteiden roolin käyttäjien vastauksen herättämisessä matkailusektorilla kartoittamalla kuvanlaadun käyttäjän sitoutumisen ja tunteenpolariteetin kanssa. Toiseksi se edistää tarinankerronnallisten dokumenttien automaattista tiivistämistä tarjoamalla uuden raamin käsittelemään nimikkeitä ja viittauksia säilyttäen samalla semanttista roolimerkintää. Kolmanneksi se tarjoaa uuden raamin sanatasoisen semanttisen samankaltaisuuden laajentamiseksi lauseen tasoiseen samankaltaisuuteen, mikä auttaa parafrasoinnin havaitsemisessa. Neljänneksi se tarjoaa uuden syväoppimisraamin käyttäen BERT-arkkitehtuuria syiden havaitsemiseen, jota sovelletaan liiketoiminnan sovelluksessa, joka koostuu kaupan esteiden tunnistamisesta. Viidenneksi se ehdottaa uutta syväoppimisperustaista mallia verkko-radikaalisoinnin havaitsemiseen käyttäen ERG22+ ontologiaa. Väitöskirja käyttää Feynmanin kolmen vaiheen metodologiaa (hypoteesin asettaminen, relevanttien tietojen kerääminen ja hypoteesin testaaminen kokeiden avulla) päämetodologianaan saavuttaakseen jokaisen viidestä tavoitteesta.
Väitöskirja tarjoaa uuden datan (Tourism48), uusia kielitieteellisiä käsittelymoduuleja ja algoritmeja, joita on saatavilla tieteelliselle yhteisölle.
Original papers
Original papers are not included in the electronic version of the dissertation.
Bounab, Y., Seppänen, J., Savusalo, M., Mäkynen, R., & Oussalah, M. (2019). Sentence to sentence similarity : a review. Proceedings of the FRUCT’25, 439–443.
Bounab, Y., Adeegbe, J. M., & Oussalah, M. (2019). Towards storytelling automatic textual summerized. Proceedings of the FRUCT’25, 434–438.
Bounab, Y., Oussalah, M., & Beddiar, D. R. (2020). Impact of quality of images on users behavior on social media. 2020 Tenth International Conference on Image Processing Theory, Tools and Applications (IPTA), 9286466. https://doi.org/10.1109/IPTA50016.2020.9286466
Bounab, Y., Oussalah, M., & Ferdenache, A. (2020). Reconciling image captioning and user’s comments for urban tourism. 2020 Tenth International Conference on Image Processing Theory, Tools and Applications (IPTA), 9286602. https://doi.org/10.1109/IPTA50016.2020.9286602
Bounab, Y., & Oussalah, M. (2022). A new knowledge discovery approach for mining business trade barriers. Journal of Intelligent Information Systems, 59(3), 567–590. https://doi.org/10.1007/s10844-022-00701-z
Bounab, Y., & Oussalah, M. (2022). Radicalization and ERG22 in social media. Manuscript in preparation
Osajulkaisut
Osajulkaisut eivät sisälly väitöskirjan elektroniseen versioon.
Bounab, Y., Seppänen, J., Savusalo, M., Mäkynen, R., & Oussalah, M. (2019). Sentence to sentence similarity : a review. Proceedings of the FRUCT’25, 439–443.
Bounab, Y., Adeegbe, J. M., & Oussalah, M. (2019). Towards storytelling automatic textual summerized. Proceedings of the FRUCT’25, 434–438.
Bounab, Y., Oussalah, M., & Beddiar, D. R. (2020). Impact of quality of images on users behavior on social media. 2020 Tenth International Conference on Image Processing Theory, Tools and Applications (IPTA), 9286466. https://doi.org/10.1109/IPTA50016.2020.9286466
Bounab, Y., Oussalah, M., & Ferdenache, A. (2020). Reconciling image captioning and user’s comments for urban tourism. 2020 Tenth International Conference on Image Processing Theory, Tools and Applications (IPTA), 9286602. https://doi.org/10.1109/IPTA50016.2020.9286602
Bounab, Y., & Oussalah, M. (2022). A new knowledge discovery approach for mining business trade barriers. Journal of Intelligent Information Systems, 59(3), 567–590. https://doi.org/10.1007/s10844-022-00701-z
Bounab, Y., & Oussalah, M. (2022). Radicalization and ERG22 in social media. Manuscript in preparation
Kokoelmat
- Avoin saatavuus [32049]