- Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Dergisi
- Volume:23 Issue:69
- Kalp hastalık risk tahmini için Python aracılığıyla sınıflandırıcı algoritmalarının performans değer...
Kalp hastalık risk tahmini için Python aracılığıyla sınıflandırıcı algoritmalarının performans değerlendirmesi
Authors : Serdar GÜNDOĞDU
Pages : 1005-1013
Doi:10.21205/deufmd.2021236926
View : 10 | Download : 4
Publication Date : 2021-09-15
Article Type : Research Paper
Abstract :Kalp hastalıkları, günümüzün en büyük sağlık problemlerinden birisidir. Hastalık için erken teşhis, erken ölümlerin önüne geçilebilir. Bu amaçla Kaggle veri tabanından elde dilen veri setinde bulunan 13 bağımsız değişken kullanılarak kalp hastalığı olma olasılığı az (KHOA) ve fazla (KHOF) olan kişiler ayırt edilmeye çalışılmıştır. Çalışmada destek vektör makinaları (DVM), k-en yakın komşu (k-NN), karar ağaçları (KA), lineer diskriminant analiz (LDA), Gausian Naive Bayes (GNB), Gradient Boosting (GB) ve Random Forest (RF) olmak üzere 7 sınıflandırma algoritması kullanılmıştır. Random forest, özgüllük (%100), Matthews korelasyon katsayısı (0.90), Fowlkes-Mallows indeks (0.82), F1 skoru (%89.7) ve doğruluk (%90.2) değerlerine göre çalışmanın en iyi tahminini yapan algoritması olmuştur. Açlık kan şekeri, KHOA ve KHOF grupları arasında istatiksel olarak anlamlı fark saptanamamış ve özellikler arasında en az önemli olduğu bulunmuştur. Bu özellik çıkarılarak yapılan sınıflandırma işlemlerinde önemli bir performans değişikliği görülmemiştir. Sadece işlem zamanları, az da olsa kısalmıştır. Bu çalışma, erken teşhislere destek olacağından dolayı kalp hastalığının tahmininde fayda sağlayacaktır.Keywords : Kalp hastalığı, Tahmin, sınıflandırıcılar, Python