ÇIKARIMSAL METİN ÖZETLEMEDE MAKİNE ÖĞRENMESİ ALGORİTMALARININ PERFORMANSLARINI N KARŞILAŞTIRILMASI


Akay V., Uçkan T.

INTERNATIONAL CONGRESS ON SCIENTIFIC RESEARCH-VIII, Ankara, Türkiye, 9 - 11 Haziran 2023, sa.1, ss.769-781, (Tam Metin Bildiri)

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Basıldığı Şehir: Ankara
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.769-781
  • Van Yüzüncü Yıl Üniversitesi Adresli: Evet

Özet

Metin özetleme, uzun ve kapsamlı bir metni daha kısa bir formata dönüştürme işlemidir. Bu işlemde, orijinal metindeki önemli noktalar, ana fikirler ve bilgiler belirlenerek özete aktarılır. Metin özetleme, genellikle bilgiyi daha erişilebilir hale getirmek, gereksiz detayları atmak veya bir metnin temel içeriğini hızlı bir şekilde anlamak için kullanılır. Metin özetleme, hem otomatik algoritmalarla hem de insanlar tarafından gerçekleştirilebilir. Otomatik metin özetleme algoritmaları, doğal dil işleme ve makine öğrenme tekniklerini kullanarak metinleri analiz eder ve önemli noktaları tespit eder. Bu algoritmalar, önceden belirlenen kurallara veya istatistiksel modellere dayanabilir. Metin özetleme, birçok farklı uygulama alanında kullanılır. Haber özetleri, bilimsel makalelerin özetleri, kitap özetleri, pazarlama materyalleri ve web sayfaları gibi birçok farklı içerik türü için metin özetlemesi yapılabilir. Özetleme, metinlerin daha çekici hale getirilmesini, bilgi aşırısını önlemeyi ve okuyucuların önemli noktaları hızlıca anlamasını sağlamayı amaçlar. Bu çalışma, makine öğrenmesi algoritmaları SVM, RF, DT, KNN ve Naive Bayes algoritmalarının çıkarımsal özet performanslarını ve özet çıkarma sürelerini değerlendirmeyi amaçlamaktadır. Çalışma kapsamında, bu beş algoritma kullanılarak özetleme işlemi gerçekleştirilmiş ve elde edilen özetlerin ROUGE metrikleri kullanılarak değerlendirilmiştir. ROUGE metrikleri, özetlerin referans özetlerle benzerliklerini ölçen yaygın bir değerlendirme yöntemidir. SVM, RF, DT, KNN ve Naive Bayes algoritmalarının ROUGE metrikleri birbirine yakın sonuçlar vermiştir, bu da özetleme yeteneklerinin genel olarak benzer olduğunu göstermektedir. Ancak, özet çıkarma sürelerine odaklandığımızda, Naive Bayes algoritmasının diğer algoritmalara göre daha hızlı olduğu gözlemlenmiştir. Naive Bayes algoritması, özet çıkarma işlemini daha kısa sürede tamamlama avantajı sunmuştur. Diğer taraftan, SVM, RF, DT ve KNN algoritmaları da kabul edilebilir özetleme süreleri sunmuşlardır. Sonuç olarak, tüm algoritmaların ROUGE metrikleri kullanılarak yapılan değerlendirmesi, benzer özetleme yeteneklerine sahip olduklarını göstermektedir. Ancak, özet çıkarma süreleri göz önünde bulundurulduğunda, Naive Bayes algoritmasının diğerlerine göre daha hızlı olduğu gözlemlenmiştir. Bu çalışmanın sonuçları, özetleme algoritması seçiminde hem performans hem de işlem süresi faktörlerinin dikkate alınması gerektiğini vurgulamaktadır.