Twitter Verilerini Kullanarak Makine Öğrenme Algoritmalarıyla Bitcoin Fiyat Tahmini


Creative Commons License

Kına E., Biçek E., İnan M., Karaca M.

2nd International Blockchain and Cryptocurrency Conference, Ankara, Türkiye, 29 - 31 Ağustos 2022, ss.18-19

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: Ankara
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.18-19
  • Van Yüzüncü Yıl Üniversitesi Adresli: Evet

Özet

Günümüzde dünyanın en değerli kripto para birimi olan Bitcoin, Kasım 2021’de 68.078 dolar ile en yüksek değerine ulaşmıştı. Yatırım için çok karlı olarak görünen Bitcoin, zaman içerisinde inişli çıkışlı dönemler geçirerek birçok yatırımcıyı bu piyasaya çekmeyi başardı. Bitcoin için fiyat tahmini yapmanın zorlaşmasının en büyük nedeni fiyatlardaki dalgalanmalardan kaynaklanmaktadır. Bu zorluğu aşabilmek için çeşitli makine öğrenme algoritmaları kullanılarak 120 dakika sonrası için en yüksek doğrulukta tahmine ulaşmak hedeflendi. Bitstamp adlı Bitcoin fiyat değişim verilerini tutan web sitesinden, 2020 yılından 2022 Haziran ayına kadar 1 dakika aralıklı ticaret verileri alındı. Scikit-Learn ve Keras kütüphaneleri kullanıldı. Kullanılan veri seti iki buçuk yıllık Bitcoin fiyatlarının 1 dakika aralıklı ticaret verilerini içermekte ve yaklaşık 1.300.000’in üzerinde veri girişine sahiptir. Veri setinin örneklem sayısı çalışma için yeterlidir. Lineer Regresyon, LSTM, CNN, RNN, Random Forest ve SVM algoritmaları karşılaştırılarak, SVM algoritmasının %92 ile 120 dakika sonrası için diğer makine öğrenme algoritmalarına göre daha iyi sonuçlar verdiği gözlenmiştir. CNN ve LSTM kullanıldığında verinin büyüklüğünden kaynaklı yavaşlık sorunuyla karşılaşıldı. RNN algoritmasında ise en düşük doğruluk değerlerine ulaşıldı. Gürültülü veriler temizlendikten sonra en iyi hiperdüzlem belirlenerek SVM algoritması ile en yüksek doğruluk değerlerine ulaşılmıştır. Bu çalışmada 10, 30 ve 60 dakikalık tahminler için kullanıldığında süre azaldıkça tahminlerdeki doğruluk değerinin düştüğü gözlemlenmiştir. SVM algoritması için, 60 dakikalık tahminde %71, 30 dakikalık tahminde %62 ve 10 dakikalık tahminde %51 doğruluk değerine ulaşılmıştır. Daha hızlı bilgisayarlarda yapılabilecek çalışmalar doğruluk değerini pozitif yönde etkileyecektir. Müşterilerin karlılıklarının artmasının amaçlandığı bu  çalışmada oylama sınıflayıcıları ve hibrit yöntemlerle yapılabilecek yeni çalışmaların elde edilebilecek doğruluk değerlerini arttırabileceği düşünülmektedir.

Bitcoin, currently the world's most valuable cryptocurrency, reached its highest value in November 2021 at $68,078. Bitcoin, which seems to be very profitable for investment, has managed to attract many investors to this market, going through ups and downs over time. The main reason why it is difficult to predict the price of Bitcoin is the price fluctuations. To overcome this difficulty, an attempt was made to use various machine learning algorithms to achieve the most accurate prediction for 120 minutes later. 1-minute interval trading data from 2020 to June 2022 was obtained from the website Bitstamp, which contains data on bitcoin price changes. Scikit-Learn and Keras libraries were used. The dataset used covers two and a half years of 1-minute trading data of bitcoin prices and has over 1,300,000 data entries. The sample size of the dataset is sufficient for the study. When comparing the Linear Regression, LSTM, CNN, RNN, Random Forest, and SVM algorithms, it was found that the SVM algorithm provided better results than the other machine learning algorithms for 92% to 120 minutes later. When using CNN and LSTM, a slowness problem occurred due to the size of the data. The lowest accuracy values were obtained with the RNN algorithm. After cleaning the noisy data, the best hyperplane was obtained and the highest accuracy values were obtained with the SVM algorithm. In this study, the accuracy of the predictions was found to decrease with decreasing time when used for predictions of 10, 30, and 60 minutes. For the SVM algorithm, the accuracy was 71% for the 60-minute prediction, 62% for the 30-minute prediction, and 51% for the 10- minute prediction. Studies that can be performed on faster computers have a positive effect on the accuracy value. In this study, which aims to increase client profitability, it is assumed that new studies that can be performed with voting classifiers and hybrid methods can increase the achievable accuracy values.