The Success of Restricted Ordination Methods in Data Analysis with Variables at Different Scale Levels


Creative Commons License

Huyut M. T., Keskin S.

Erzincan Üniversitesi Fen Bilimleri Enstitüsü Dergisi, cilt.14, sa.1, ss.215-231, 2021 (Hakemli Dergi)

Özet

Doğadaki olaylar, birbiriyle ilişkili birçok değişkenin ayrı ayrı veya birlikte etkisiyle meydana gelir. Değişkenler arası doğrusal ve doğrusal olmayan ilişki yapısı ile farklı ölçek düzeylerindeki veri setlerinin analizi için kullanılan yöntemlerin tanıtılması ve kullanılması önemlidir. Bu tür verilerin analizinde kullanılan yöntemler arasında Gereksizlik Analizi ve Kanonik Uyum Analizi yer almaktadır. Yukarıda belirtilen tekniklerle ilgili çalışmaların genellikle ekolojistler tarafından yapıldığı ve sağlık alanında sınırlı sayıda çalışma olduğu görülmüştür. Bu nedenle çalışmada, belirtilen yöntemlerin uygulamaları farklı ölçek düzeylerindeki değişkenleri içeren bir Kardiyoloji veri seti üzerinde gerçekleştirilmiş ve performansları karşılaştırılmıştır. Performans kriteri olarak Belirleme Katsayısı (R2) ve MAPE (Ortalama Mutlak Yüzde Hata) değeri hesaplandı. Elde edilen sonuçlara göre, farklı ölçek türlerindeki (kardiyolojik veri seti) değişkenler arasındaki ilişki yapılarını inceleyen CCA ve RDA'nın, varyasyonu yeterince açıkladığı görülmüştür. Ayrıca her iki yöntemin de düşük MAPE değeri (% 10'dan az) ile iyi sınıflandırıldığı ve koordinasyon diyagramı gerçekleştirdiği vurgulanmıştır. Ayrıca, kısıtlı koordinasyon diyagram modellerinin koroner kalp hastalığı verileri arasındaki ilişkilerin belirlenmesinde tatmin edici sonuçlar verdiği ve benzeri sağlık alanlarında da kullanılabilirliği görülmüştür.

Events in nature occur with the effect of many interrelated variables, either separately or together. It is important to introduce and use the methods used for the analysis of data sets at different scale levels with linear and nonlinear relationship structure between variables. Redundacy Analysis and Canonical Correspondence Analysis are among the methods used in the analysis of such data. Aforementioned techniques are generally carried out by ecologists and there are limited studies in the field of health. In the study, the application of the methods was performed with a data set in the field of Cardiology including variables at different scale levels and their performances were compared. Determination Coefficient (R2) and MAPE (Mean Absolute Percentage Error) value were calculated as performance criteria. According to the results, it was seen that CCA and RDA, which analyze the relationship structures between variables in different scale types (cardiological data set), explain the variation sufficiently. Also, it was emphasized that both methods classify well with low MAPE value (less than 10%) and perform ordination diagram. In addition, it has been observed that restricted ordination diagram models give satisfactory results in determining the relationships between coronary heart disease data and so that they can be used in the field of health too.