KATEGORİK TEMEL BİLEŞENLER ANALİZİ: GENEL ÖZELLİKLERİ VE UYGULAMASI


Keskin S., Keskin N.

ISPEC 8th INTERNATIONAL CONFERENCE on AGRICULTURE, ANIMAL SCIENCES and RURAL DEVELOPMENT, Bingöl, Türkiye, 24 - 25 Aralık 2021, ss.1246-1255

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Basıldığı Şehir: Bingöl
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1246-1255
  • Van Yüzüncü Yıl Üniversitesi Adresli: Evet

Özet

Bilimsel araştırmaların birçoğunda ilgilenilen değişkenler, sürekli kategorik veya sıralı değişken tipinde olmaktadır. Diğer yandan bu değişkenler arasındaki ilişkiler de doğrusal veya doğrusal olmayan yapıda olabilmektedir. Doğrusal olmayan ilişkilerin incelenmesi, hesaplama ve yorumlamadaki güçlükler nedeniyle, doğrusal ilişiklilere göre kısmen de olsa zordur. Diğer yandan, karışık değişken yapısındaki veri setlerinde doğrusal olmayan ilişkileri incelemeye yönelik istatistik yöntemler de sınırlıdır. Kategorik temel bileşenler analizi veya diğer adıyla Doğrusal olmayan temel bileşenler analizi, karışık (sürekli, kategorik, sıralı) yapıdaki değişkenleri içeren veri setlerinde; doğrusal ilişkilerin yanı sıra doğrusal olmayan ilişkileri de inceleyen Çok değişkenli analiz yöntemlerinden birisidir. Yöntemde genel olarak değişkenlerin kategorileri arasındaki ilişkiler belirlenir. Standart temel bileşenler analizi gibi bir boyut indirme yöntemi olan Kategorik temel bileşenler analizi, değişkenler arasındaki doğrusal ve/ya doğrusal olmayan ilişkileri, iki boyutlu uzayda görsel olarak sunmakta ve yorumlama kolaylığı sağlamaktadır. Veri setindeki tüm değişkenlerin sürekli değişken olması durumunda, Kategorik temel bileşenler analizi, Standart temel bileşenler analizi ile eşdeğer sonucu vermektedir. Kategorik ve sıralı değişkenleri içeren veri setlerinde, Kategorik temel bileşenler analizi, Optimal skorlama veya Optimal ölçekleme olarak bilinen sürece dayalı hesaplama yapmaktadır. Diğer bir ifade ile her kategorik değişkenin kategorilerine sayısal değer atamaktır. Böylece sayısal değişkenlere dönüştürülen kategorik değişkenlerle işlemler yürütülmektedir. Bu çalışmada, Kategorik temel bileşenler analizi, genel özellikleri ile açıklanmış ve bağcılık alanından sağlanan veri seti ile uygulama yapılarak elde edilen sonuçlar yorumlanmıştır. Veri seti; Elazığ ilinde yetiştirilen Köhnü, Şilfoni, Ağın Beyazı ve Kırmızı yerel üzüm çeşitlerinin şeker (glikoz ve früktoz) ve organik asit (tartarik asit, malik asit, sitrik asit) özelliklerini içermektedir. Çalışma sonucunda; yöntemin avantajlarından bahsedilmiş ve birçok alanda kullanılabileceği vurgulanmıştır.

In most scientific researches, the considered variables are continuous, categorical or ordinal type. On the other hand, the relationships between these variables can be linear or non-linear. Examination of nonlinear relationships is somewhat more difficult than linear relationships due to difficulties in calculation and interpretation. On the other hand, statistical methods for examining nonlinear relationships in mixed-variable data sets are also limited. Categorical principal components analysis or Nonlinear principal components analysis is one of the multivariate analysis methods that examine nonlinear relationships as well as linear relationships when data sets containing continuous, categorical or ordinal variables. In general, the relations between the categories of the variables are determined in the method. Categorical principal component analysis, which is a dimension reduction method like Standard principal component analysis, visually presents linear and/or nonlinear relationships between variables in two-dimensional space and provides ease of interpretation. If all the variables in the data set are continuous variables, Categorical principal component analysis gives the equivalent result with the Standard principal component analysis. On datasets containing categorical and ordinal variables, Categorical principal components analysis performs a process-based computation known as Optimal scoring or Optimal scaling. In other words, it is assigning numerical values to the categories of each categorical variable. Thus, operations are carried out with categorical variables converted into numerical variables. In this study, Categorical principal components analysis was explained with its general properties and the results obtained by applying the data set from the field of viticulture were interpreted. Data set; it contains sugar (glucose and fructose) and organic acid (tartaric acid, malic acid, citric acid) of Köhnü, Şilfoni, Ağın Beyazı and Kırmızı local grape varieties grown in Elazığ. In the results, the advantages of the method are mentioned and it is emphasized that it can be used in many areas.