- Çukurova Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
- Volume:34 Issue:3
- Effects of Feature Extraction Techniques on Classification of Turkish Texts
Effects of Feature Extraction Techniques on Classification of Turkish Texts
Authors : Özge AKDOĞAN, Selma Ayşe ÖZEL
Pages : 95-108
Doi:10.21605/cukurovaummfd.637643
View : 17 | Download : 4
Publication Date : 2019-09-30
Article Type : Research Paper
Abstract :Nitelik çıkarımı metin sınıflamanın en önemli önişleme adımıdır. Önişleme tekniklerinin İngilizce metin sınıflandırma üzerindeki etkisi çok çalışılmış bir konu olmasına rağmen, Türkçe için bu konuda yapılmış çalışmalar oldukça sınırlı ve belirli bir problem alanına bağlıdır. Bu çalışmada nitelik çıkarımının haber sınıflama, spam e-posta tespiti, duygu analizi ve yazar tanımayı içeren dört farklı Türkçe metin sınıflandırma problemi üzerindeki etkisi araştırılmış ve problemler arasındaki benzerlik ve farklılıklar gözlenmiştir. Ayrıca yeni bir nitelik seçimi yöntemi önerilmiştir. Deneysel analizler sonucunda durak kelimelerin çıkarılmasının sınıflandırma performansını artırdığı görülmüştür. Ancak kelime köklerinin alınmasının sınıflandırma doğruluğu üzerinde olumlu bir etkisi gözlenmemiştir. En başarılı terim ağırlıklandırma yöntemlerinin tf ve tf*idf olduğu görülmüştür. Önerilen nitelik seçimi yöntemi sınıflandırma performansını iyileştirmiş ve sıklıkla kullanılan yöntemlerden daha yüksek doğruluk değerine sahip olmuştur.Keywords : Metin sınıflandırma, Önişleme yöntemleri, Nitelik çıkarımı, Türkçe metinler