Çok Değişkenli Varyans Analizi Çözümlemesi için Normal Olmayan ve Dengesiz Örneklemlerin Test İstatistiklerinin I. Tip Hata Oranları Bakımından Karşılaştırılması


Tekindal M. A., Kaymaz Ö., Kale H. E., Ateş C.

XIX. ULUSAL ve II. ULUSLARARASI BİYOİSTATİSTİK KONGRESİ, Antalya, Türkiye, 25 - 28 Ekim 2017, ss.57, (Özet Bildiri)

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: Antalya
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.57
  • Van Yüzüncü Yıl Üniversitesi Adresli: Hayır

Özet

Amaç: Varyansın çok değişkenli analizi, aynı zamanda MANOVA (Multivariate Analysis of Variance) olarak da bilinen iki veya daha fazla bağımlı değişkenin bulunduğu verileri analiz etmek için kullanılan bir yöntemdir. Tüm parametrik yöntemlerde olduğu gibi MANOVA yönteminde hataların normal dağılması, varyansların homojen olması ve hata terimlerinin birbirinden bağımsız olması varsayımları vardır. Ancak uygulamada normal olmayan dağılımlar, normal dağılıma göre daha yaygındır. Bu çalışmada MANOVA yönteminin normallik ve homojen varyans varsayımlarının sağlanmadığı durumlarda Wilks Lamda istatistiği (Wilks’ Lambda), Pillai iz istatistiği (Pillai’s Trace), Hotelling iz istatistiği (Hotelling’s Trace), Roy’un en büyük özdeğer (Roy’s Largest Root) test istatistiklerinin nasıl etkileneceği araştırılmıştır. Başka bir deyişle bu durumlarda testlerin güvenilir olup olmadığı (dayanıklılığı) incelenmiştir.
Yöntem: Bu amaçla, farklı senaryolarda simülasyon çalışması yapılmıştır. Farklı grup, değişken sayıları ve farklı örneklem hacimlerinde, grup varyanslarının sabit (σ12 = σ22=…= σg2) ve artan (σ12 <σ22…<σg2) olduğu durumları göz önünde bulundurularak Gamma(4-4-4; 0.5), Gamma(4-9-36;0.5), Student’s t(2) ve Normal(0;1) dağılımlardan rasgele sayılar üretilmiştir. Ayrıca gruplardaki gözlem sayılarının dengeli ve dengesiz olduğu durumlarda dikkate alınmıştır.. Simülasyon çalışmalarında 10000 tekrar yapılarak α =0.05 iken her bir test için birinci tip hata değerleri hesaplanmıştır. Simülasyon çalışması RStudio program dili (Mass (Modern Applied Statistics with S’-2017.04.21) ve lestat (A package for LEarning STATistics-20.02.2015) paketi) kullanılarak yapılmıştır.
Bulgular: Simülasyon çalışması sonuçlarına göre, Gamma Dağılımında sabit varyans ve artan varyans durumunda 2 değişkenli dengeli ve dengesiz örneklemlerde Pillai iz test istatistiğinin I. Tip hata oranlarının α =0.05 değerine en yakın sonuçlar verdiği görülmüştür. 3 değişkenli olduğu durumda ise en yakın sonuçları dengeli örneklemlerde Roy’un en büyük özdeğer test istatistiği, dengesiz örneklemlerde Pillai iz test istatistiği göstermiştir. Student’s t dağılımında ise belirlenen senaryolarda test istatistiklerinin I. Tip hata oranlarının α =0.05 değerine oldukça uzak sonuçlar verdiği görülmüştür. Normal dağılımın sabit varyans durumunda, 2 değişken için dengeli ve dengesiz örneklemlerde en yakın sonuçlar Roy’un en büyük özdeğer test istatistiği, 3 değişkenli dengeli ve dengesiz örneklemlerde ise en yakın sonuçlar Wilks Lamda test istatistiği göstermiştir. Normal dağılımın artan varyans durumunda ise 2 ve 3 değişkenli dengeli ve dengesiz örneklemlerde en yakın sonuçları Roy’un en büyük özdeğer test istatistiği göstermiştir.
Sonuç: Çalışmada belirlenen senaryolar sonucunda Gamma Dağılımının Student’s t dağılımına göre daha tutarlı sonuçlar verdiği görülmüştür. Normal dağılım ile karşılaştırıldığında ise yine Gamma dağılımı Student’s t dağılımına göre daha benzer sonuçlar vermiştir. Bu çalışma, farklı dağılım ve parametreler ile simülasyon çalışması yapılarak genişletilebilir.
Anahtar Sözcükler: MANOVA, Wilks’ Lambda, Pillai’s Trace, Hotelling’s Trace, I.tip hata, Robustness