Duygu Sınıflandırmasında Derin Öğrenme ve Makine Öğrenmesi: X Platformundaki Mobil Oyun Tweet'lerinin Karşılaştırmalı Analizi


Creative Commons License

Kına E., Özdağ R.

Erzincan Üniversitesi Fen Bilimleri Enstitüsü Dergisi, cilt.18, sa.2, ss.639-658, 2025 (Hakemli Dergi)

Özet

Bu makale, mobil oyunlarla ilgili tweetlerin duygu analizini gerçekleştirmek için uygulanan farklı makine ve
derin öğrenme yöntemlerinin karşılaştırılmasına dayalı bir genel bakış sunmaktadır. Twitter'dan (X) 2020-2021
yılları arasında toplanan veri kümesi, Count Vectorizer ve TF-IDF metodolojisi kullanılarak ön işlemden
geçirilmiş ve vektörleştirilmiştir. Doğrusal Destek Vektör Sınıflandırıcısı (SVC), Lojistik Regresyon (LR),
Ridge Sınıflandırıcısı (RC) ve Oylama Sınıflandırıcısı (VC) gibi geleneksel makine öğrenimi modelleri,
TEMSAP-CNNLSTM modelinin tek başına ve BERT ile geliştirilmiş sürümleri gibi birkaç derin öğrenme
mimarisine karşı kıyaslanmıştır. Sonuçlar, derin öğrenme modellerinin geleneksel makine öğrenimi
sınıflandırıcılarından daha iyi performans gösterdiğini, bu modellerin %97,10'lukla en yüksek sınıflandırma
performansına ulaştığını ve yanlış negatifleri ve yanlış pozitifleri en aza indirmede etkileyici bir başarı elde
ettiğini ortaya koymuştur. Ridge Sınıflandırıcı en düşük performansı sergilemiş, twitter yorumlarını %76,76
doğrulukla doğru sınıflandırarak duyarlılık sınıflandırmasındaki sınırlılıklarını göstermiştir. Buna ek olarak,
Oylama Sınıflandırıcısı gibi toplu öğrenme teknikleri, bireysel makine öğrenimi modellerinden çok daha iyi
performans göstermiş ve böylece model birleştirmenin faydalarını yeniden ortaya koymuştur. Bu çalışma,
BERT gibi dönüştürücü tabanlı modellerin mobil oyunlarla ilgili metin verilerinin duygu sınıflandırmasında
kayda değer bir başarı gösterdiğini ortaya koymuştur.

This paper presents an overview based on comparison of different machine and deep learning methods applied
to perform the sentiment analysis of tweets related to mobile games. The dataset, gathered from Twitter (X)
between 2020-2021, was preprocessed and vectorized using Count Vectorizer and TF-IDF methodology.
Traditional machine learning (ML) models such as Linear Support Vector Classifier (SVC), Logistic Regression
(LR), Ridge Classifier (RC), and Voting Classifier (VC) were benchmarked against a few deep learning (DL)
architectures such as the TEMSAP-CNNLSTM model stand-alone and BERT-enhanced versions. The results
revealed that DL models outperformed traditional ML classifiers, with these models achieving the highest
classification performance of 97,10% and achieving impressive success in minimizing false negatives and false
positives. The Ridge Classifier exhibited the lowest performance, correctly classified twitter reviews at an
accuracy of 76,76%, indicating its limitations in sentiment classification. In addition, ensemble learning
techniques like the Voting Classifier performed much better than individual machine learning models, thus re-
establishing the benefits of model aggregation. This study demonstrated that transformer-based models such as
BERT have shown remarkable success in sentiment classification of text data related to mobile games.