- Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji
- Volume:9 Issue:4
- High Performance Classification of Cancer Types with Gene Microarray Datasets: Hybrid Approach
High Performance Classification of Cancer Types with Gene Microarray Datasets: Hybrid Approach
Authors : Yılmaz ATAY, Muhterem Oğuzhan YILDIRIM, Cuma Umur DOĞAN
Pages : 811-827
Doi:10.29109/gujsc.1000926
View : 16 | Download : 4
Publication Date : 2021-12-29
Article Type : Research Paper
Abstract :Günümüzde mikrodizi teknolojisi ile elde edilen gen mikrodizi veri setlerinden biyolojik anlamlılık tespiti yaklaşımı, hastalık tanısı ve kanser türlerinin ayırt edilmesi gibi pek çok alanda etkin bir şekilde kullanılmaktadır. Fakat bu teknoloji ile elde edilen veri kümeleri, gen ifade profillerini toplu olarak ölçtüğü için veri kümesindeki özellik sayısı oldukça fazla olabilmektedir. Gen mikrodizi veri kümelerindeki örnek sayılarının az olması, özellik sayısının fazla olması ve verilerin gürültülü olması bu veri kümelerinin ön hazırlık işlemlerini oldukça karmaşık hale getirmektedir. Makine öğrenmesi modellerinin sınıflandırmayı başarıyla yapabilmesi için özellik sayısının, yani veri kümesinin boyutunun azaltılması gerekmektedir. Önerilen yöntemde, gen mikrodizi verileri girdi olarak alınır ve öznitelik seçimi amacıyla Bilgi Kazancı, Fisher Korelasyon Skorlama, ReliefF ve Ki-Kare yöntemleri ayrı ayrı uygulanır. Bu aşamadan sonra yeni gen alt veri kümesi elde edilir ve Genetik Algoritmanın gen havuzu oluşturulur. Bu algoritmanın uygun adımlarda tekrar çalıştırılması sonrasında seçilen en başarılı kromozomun genleri ile oluşturulan alt veri kümesi kullanılarak Naive Bayes sınıflandırıcısı eğitilir. Böylece kanser verilerinin sınıflandırılması işlemi tamamlanır. Bu çalışmada önerilen model, literatürde sıklıkla kullanılan veri kümelerine uygulanmış ve sınıflandırmada yüksek başarı oranları elde edilmiştir. Sonuç olarak; uygun öznitelik seçim yöntemleri ve Genetik Algoritma temelli hibrit yöntem genel anlamda tüm test verileri üzerinde en uygun sonuçlara ulaşılmasını sağlamıştır.Keywords : ensemble metot, genetik algoritma, kanser, mikrodizi, naive bayes, öznitelik seçimi, sınıflandırma