PISA 2018 Türkiye Örnekleminde Okuma Becerisini Etkileyen Değişkenlerin Boruta Algoritması ile Belirlenmesi


SEHRIBANOGLU S.

Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, cilt.57, sa.2, ss.655-701, 2024 (Hakemli Dergi) identifier

Özet

Bu çalışmanın amacı öğrencilerin okuma beceri düzeylerine göre sınıflandırma üzerinde etkisi olan değişkenlerin araştırılmasıdır. Bu amaçla öğrencilere ait okuma beceri testinden aldıkları puanlar (PV) dikkate alınmış, yüksek ve düşük okuma becerisine sahip olarak belirlenen sınıflandırma grupları oluşturulmuştur. Çok sayıda değişkene sahip olan çalışmalarda hangi değişkenin daha etkin olduğunu tespit etmek için kullanılan öznitelik seçimi verilerin boyutlarının azaltılmasını ve ilgisiz değişkenlerin çıkarılmasını sağlar. Bu çalışmada da öznitelik seçim yöntemlerinden biri olan Rastgele Ormanlar yöntemini temel alan Boruta algoritması kullanılmıştır. Z-skorları hesaplanan bu algoritmada değişkenler dikkate alınarak oluşturulan gölge öznitelikler referans olarak dikkate alınır. Sarmalayıcı algoritmalardan biri olan Boruta algoritması, büyük verilerde kısa sürede ve yüksek doğrulukla sınıflandırma becerisine sahiptir. PISA 2018 Türkiye verilerinin kullanıldığı bu çalışmada sınıflandırılmış okuma beceri değerini etkileyen 27 indis belirlenmiştir. Belirlenen bu değişkenler Okul türü, kariyer beklentisi, sosyo-ekonomik durum, BİT’e olan ilgi ve aşinalık, üst biliş stratejileri vb. konu başlıkları altında toplanmış ve değerlendirilmiştir.
This study is all about finding out what makes a difference to how students are grouped according to their reading skills. To do this, we looked at the scores from the reading skill test and put students into groups based on whether they have high or low reading skills. In studies with lots of different variables, feature selection helps us to decide which one is the most important. This means we can reduce the size of the data and remove any variables that don't really matter. In this study, we used the Boruta algorithm, which is based on the Random Forests method. This is one of the feature selection methods, and it's really useful because it can identify shadow features, which are created by taking into account the variables. The Boruta algorithm is one of the wrapper algorithms, which can classify large data in a short time and with high accuracy. In this study, we used the PISA 2018 Türkiye data to identify 27 factors that affect reading skills. These include things like school type, career expectations, socio-economic status, interest and familiarity with ICT, metacognition strategies, and more. We collected and evaluated these factors under subject headings.