Correlated Component Regression: Application On Model To Determination Of Dna Damage


Creative Commons License

Elasan S., Keskin S., Arı E.

Türkiye Klinikleri Biyoistatistik Dergisi, cilt.8, sa.1, ss.45-52, 2016 (Hakemli Dergi)

Özet

Amaç: Açıklayıcı değişken sayısının, örneklem büyüklüğü yaklaştığı veya örnek genişliğini geçtiği durumlarda, diğer bir ifade ile yüksek boyutlu veri setlerinde, regresyon modelleri ile tahminde, güvenilirliğin nasıl artırılacağı önemli sorunlardan birisidir. Bu amaçla kullanılabilecek yeni yöntemlerden birisi, İlişkili Bileşen Regresyonudur. Bu çalışmada, İlişkili Bileşen Regresyonu hakkında bilgi verilerek, bir uygulama ile birlikte tanıtılması amaçlanmıştır. Gereç ve Yöntemler: Regresyon analizi yapılması gereken bilimsel çalışmalarda, açıklayıcı değişken sayısı; örnek genişliğine yaklaştığında veya örnek genişliğini geçtiğinde (yüksek boyutlu veri setlerinde), standart regresyon analizi yöntemiyle yapılacak tahminlerde, tahmin edilen katsayılar, çoklu bağlantı (kovaryans matrisinin tekil olması) nedeniyle değişkenlik göstermektedir. Bunun için alternatif bir yöntem olarak, “İlişkili Bileşen Regresyonu” (İBR) problemin çözümüne yardımcı olabilir. Cevap değişkeninin sürekli olması durumunda, İBR-Doğrusal Regresyon ve ikili (binary) olması durumunda, İBR Logistik Regresyon kullanılabilirken, sağkalım verilerinde İBR-Cox Regresyonu kullanılabilir. Yöntem, K adet ilişkili bileşenleri kullanır. Bu ilişkili bileşenler, program tarafından belirlenebileceği gibi araştırıcı tarafından da belirlenebilir. Bulgular: Çalışmada örnek genişliğinin küçük, korelasyon katsayılarının orta düzeyde ve değişken sayısının fazla olması nedeniyle, doymuş regresyon modelinde aşırı uyum olduğundan m-kat çapraz geçerlilik testi yapılarak İBR modeliyle bu aşırı uyum elemine edilebilmiştir. Sonuç: Regresyon analizlerinde karşılaşılabilecek; çoklu bağlantı, uyum eksikliği veya aşırı uyum gibi sorunların çözümü için İBR’nin  kullanılabileceği ve daha yüksek gücü yakalayabileceği söylenebilir.