Bulanık Kümeleme ve Sınıflandırma Teknikleri ile Müşteri Davranış Segmentasyonu


Kutlu F., Göleli K.

Yüzüncü Yıl Üniversitesi Fen Bilimleri Enstitüsü Dergisi, cilt.30, sa.3, ss.990-1008, 2025 (TRDizin)

Özet

Öz: Bu çalışmada, pazarlama kampanyalarına yönelik müşteri yanıt davranışlarının sınıflandırılması ele

alınmıştır. Analizlerde, Kaggle çevrimiçi veri paylaşım platformunda açık erişimli olarak sunulan Customer

Personality Analysis (CPA) veri seti kullanılmıştır. Veri setindeki hedef değişken Response, müşterinin son

kampanya teklifini kabul etme durumunu ifade etmektedir (1 = kabul etti, 0 = kabul etmedi). Pozitif sınıfın toplam

gözlem sayısına oranının yaklaşık %15 düzeyinde olması, belirgin bir sınıf dengesizliği problemine işaret

etmektedir. Bu nedenle, model başarımının değerlendirilmesinde yalnızca doğruluk ölçütü yerine, azınlık sınıfını

daha dengeli biçimde temsil eden makro-F1 metriği dikkate alınmıştır. Yöntemsel çerçevede ilk olarak bulanık c-

Ortalamalar (FCM) algoritması uygulanarak her örnek için kümelere ilişkin üyelik dereceleri elde edilmiştir. Daha

sonra bu üyelik dereceleri, FCM+FSVM yapısında örnek ağırlığı olarak sınıflandırma sürecine dahil edilmiş;

FCM+FKNN yapısında ise komşuluk katkı katsayısı olarak kullanılmıştır. FCM hiperparametreleri genetik

algoritma ile optimize edilirken, sınıflandırıcılara ilişkin hiperparametreler rastgele arama yöntemiyle

belirlenmiştir. Deneysel çalışmalarda lojistik regresyon, KNN, RBF-SVM, rastgele orman ve gradyan artırma gibi

yöntemlerle karşılaştırma yapılmış ve FCM+FSVM modelinin hem genel sınıflandırma başarımı hem de azınlık

sınıfını tanıma yeteneği açısından en yüksek performansı sergilediği görülmüştür

Abstract: This study focuses on the classification of customer response behavior toward marketing campaign

offers. The analysis utilizes the Customer Personality Analysis (CPA) dataset, which is publicly available on the

Kaggle online data-sharing platform. The target variable, Response, indicates whether the customer accepted the

most recent campaign offer (1 = accepted, 0 = not accepted). Since the proportion of positive responses is

approximately 15% of all observations, the dataset exhibits a pronounced class imbalance. For this reason,

performance evaluation prioritizes the macro-F1 metric rather than overall accuracy, as macro-F1 provides a more

balanced representation of the minority class. The methodological framework involves the application of the

Fuzzy C-Means (FCM) clustering algorithm to obtain membership degrees for each instance. These membership

values are subsequently integrated into two classification models. In the FCM+FSVM model, the membership

degrees are utilized as instance weights influencing the decision boundary. In the FCM+FKNN model, the same

membership degrees are incorporated as adaptive weighting factors in the neighborhood-based voting mechanism.

FCM hyperparameters are optimized using a genetic algorithm, while classifier hyperparameters are determined

through random search. Comparative experiments including logistic regression, KNN, RBF-SVM, random forest,

and gradient boosting demonstrate that the FCM+FSVM model achieves the highest performance in both overall

classification accuracy and minority class recognition.