Kategorik Temel Bileşenler Analizi ve Depresyon Veri Seti ile Uygulama


Creative Commons License

Demir C., Keskin S., Mirtagioğlu H., Demir Y.

Kocaeli Üniversitesi Sağlık Bilimleri Dergisi, cilt.8, sa.1, ss.25-31, 2022 (Hakemli Dergi)

Özet

Amaç: Kategorik Temel Bileşenler Analizi (KTBA), boyut indirgeme ve görselleştirmenin yanında bağımlı değişken üzerinde etkili olan bağımsız değişkenler arasındaki korelasyonları ortaya çıkarmak için kullanılan çok değişkenli bir istatistik analiz yöntemidir. Yapılan literatür incelenmesinde, konu ile ilgili Türkçe literatürün yok denecek kadar az olması nedeniyle bu çalışmada; depresyon veri seti ile yöntemin açıklanması ve bu tür veri setlerinde kullanılabilirliğinin bir uygulama ile gösterilmesi amaçlanmıştır Yöntem: Yöntemde çoklu nominal ve çoklu nominal olmayan değişkenlerde her boyut için bileşen yükleri belirlendikten sonra, özdeğerler ve toplam açıklanan varyans hesaplanır. Çalışmada 664 öğrenciden anket yolu ile elde edilen veriler kullanılmıştır. Bulgular: Depresyonla ilişkili olabileceği düşünülen değişkenlerin; boyut indirgeme ile iki boyuta indirgenmesi sonucunda; birinci boyuta ait varyans açıklama oranı %18,08 ve ikinci boyuta ait varyans açıklama oranı ise %16,58 olarak bulunmuştur. Sonuç: Kategorik Temel Bileşenler Analizinde kategorik değişkenler çeşitli dönüşümlerle sayısallaştırılmakta ve kayıp fonksiyonu ile çok değişkenli analiz yöntemlerinin uygulanmasına imkân sağlanmaktadır. Böylece minimum kayıpla gerçek uzaydaki ilişkiler daha düşük boyutlu bir uzayda gösterilebilmektedir. Bu çalışmada değişkenler arasındaki doğrusal ve doğrusal olmayan ilişkiler modellenebilmiştir. Buna göre depresyon ile cinsiyet, yaş, gelir ve bölüm değişkenleri arasında bir ilişki olduğu bulunmuştur. 

Objective: Categorical Principal Component Analysis (CATPCA) is a multivariate statistical analysis method used to reveal the correlations between independent variables that affect the dependent variable, as well as dimension reduction and visualization. In the literature review, in this study, since there is almost no Turkish literature on the subject; It is aimed to explain the method with depression dataset and to show its usability in such datasets with an application. Method: In the method, after determining component loads for each dimension in multiple nominal and multiple non-nominal variables, eigenvalues and total explained variance are calculated. In the study, data obtained from 664 students through questionnaires were used. Results: Variables thought to be associated with depression; As a result of reducing to two dimensions with dimension reduction; The variance explanation rate for the first dimension was found to be 18.08% and the variance explanation rate for the second dimension was found to be 16.58%. Conclusions: In Categorical Principal Component Analysis, categorical variables are digitized with various transformations and the loss function allows the application of multivariate analysis methods. Thus, relationships in real space with minimum loss can be shown in a lower dimensional space. In this study, linear and nonlinear relationships between variables are modeled. Accordingly, it was found that there was a relationship between depression and the variables of gender, age, income and department.