FP-GROWTH ALGORİTMASI- WEKA UYGULAMASI


Creative Commons License

Sevimli Deniz S.

SOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL (SMARTJOURNAL), cilt.4, sa.14, ss.1186-1190, 2018 (Hakemli Dergi)

Özet

Veri madenciliği, farklı formatlarda saklanan büyük hacimli verilerdeki bilgi keşfine ilişkin çeşitli yaklaşımları nedeniyle araştırmacılar için geniş bir alandır. Veri madenciliği tekniklerini uygulanarak, bilinmeyen örüntülerin keşfi ve veriler arasındaki ilişkiler keşfedilir. Veri madenciliğinin farklı işlevleri temel alarak sınıflandırma, kümeleme, özellik seçimi ve birliktelik kuralı madenciliği olarak sınıflandırılmıştır. Birbirleriyle ilişkili verilerden özelliklerin çıkarılması ve aralarındaki ilişkilerin büyüklüğünün tespit edilmesine yönelik çalışmalar birliktelik kuralları olarak tanımlanır. En fazla kullanılan birliktelik kuralı algoritmaları Apriori ve FP-Growth algoritmalarıdır. Bu çalışmada amaç genel olarak sepet market analizlerinde kullanılan bu kural çıkarımı yöntemlerinin farklı çalışmalarda da kullanımını göstermektir. Bu amaçla yüksekokul öğrencilerinin sosyal medya kullanım eğilimleri araştırması için yapılan çalışma Fp-Growth algoritması ile modellenmiştir. Model sonucunda öğrencilerin mahremiyet sorunları olmasına rağmen, sosyal medya araçlarında paylaşım yapmaktan kaçınmadıkları görülmektedir. Öğrenciler üzerinde aile ve toplum baskısının hissedilir bir etkisi olduğu gözlenmiştir.

Data mining is a wide field for researchers because of their various approaches to information discovery in large volumes of data stored in different formats. By applying data mining techniques, the discovery of unknown patterns and the relationships between the data are discovered. It is classified as classification, clustering, feature selection and association rule mining based on different functions of data mining. The rules of association are aimed at identifying the characteristics of interrelated data and determining the magnitude of the relationships between them. The most commonly used association rule algorithms are Apriori and FP-Growth algorithms. The aim of this study is to show the usage of these rule extraction methods used in basket market analysis in different studies. For this purpose, the study of social media usage trends of high school students was modeled with Fp-Growth algorithm. As a result of the model, it is seen that although students have privacy problems, they do not refrain from sharing in social media tools. It was observed that family and community pressures had a significant effect on students.