- Süleyman Demirel Üniversitesi Sağlık Bilimleri Dergisi
- Volume:13 Issue:3
- Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi
Genomik Veri Setlerinin LASSO ve Elastik Net Regresyon Yöntemleri ile Analizi
Authors : Merve VERGİLİ, Hikmet ORHAN
Pages : 485-496
Doi:10.22312/sdusbed.1201417
View : 8 | Download : 7
Publication Date : 2022-12-20
Article Type : Research Paper
Abstract :Amaç: Bu çalışmanın amacı büyük boyutlu genomik veri setlerinin değişken seçim yöntemleri kullanılarak daha küçük boyutlara indirgenip daha az maliyet ve zaman ile analizlerin gerçekleştirilebileceğini göstermektir. Gereç ve Yöntem: Bu çalışmada NCBI veri tabanından Bioconductor yardımı ile R programına aktarılan GDS4906 numaralı veri seti kullanılmıştır. Veri seti 10-katlı çapraz doğrulama ile LASSO ve Elastik Net regresyon yöntemleri kullanılarak analiz edilmiştir. Bulgular: Veri seti LASSO regresyon yöntemi ile analiz edildiğinde veri setinden 5 adet gen seçilmiş olup, sonrasında farklı iterasyonlarda seçilen değişkenler ve değişken sayılarında farklılık gözlendiğinden kararlılık seçimi yöntemi uygulanarak 2 adet gen seçilmiş ve modelin R2 değeri 0,85 olarak bulunmuştur. Aralıklı arama yöntemi kullanılarak uygulanan Elastik Net regresyon yönteminde 19 adet gen seçilmiş ve R2 değeri 0,92 olarak bulunmuştur. Sonuç: Elde edilen sonuçlara göre LASSO ve Elastik Net regresyon yöntemlerinin genomik veri setlerinde iyi bir performans gösterdiği anlaşılmıştır.Keywords : Çoklu bağlantı, Elastik Net, Genomik Veri, LASSO