- Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi
- Volume:14 Issue:1
- Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme
Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme
Authors : Dilara TORUNOGLU SELAMET, Gülşen CEBİROĞLU ERYİĞİT
Pages : 34-46
Doi:10.54525/tbbmd.835744
View : 9 | Download : 7
Publication Date : 2021-06-28
Article Type : Research Paper
Abstract :Yapay zekâ alanında son dönemlerde öne çıkan derin öğrenme mimarilerinin, doğal dil işleme konusunun önemli problemlerinden biri olan Anlam Belirsizliği Giderme insert ignore into journalissuearticles values(ABG); çalışmalarında kayda değer gelişmelere yol açtığı gözlemlenmektedir. Denetimli yöntemler rakiplerine göre daha yüksek performans sergilemektedirler. Bunun en büyük nedeni kullanılan eğitim verilerinin büyüklükleridir. ABG problemi için İngilizce dili üzerinde elle-etiketlenmiş çok miktarda veri çevrim içi olarak erişilebilir durumdadır. Ancak düşük-kaynaklı diller insert ignore into journalissuearticles values(DKD’ler); probleme uygun veri eksikliği yaşamaktadırlar. Yeterli derecede probleme uygun veri toplamak ve etiketlemek vakit alıcı ve yüksek maliyet gerektiren bir iştir. Bu probleme değinmek ve aşmak üzere, bu çalışmada yarı-denetimli bağlamsal anlam belirsizliği giderme yaklaşımının veri artırımı için insert ignore into journalissuearticles values(daha sonra denetimli öğrenmede eğitim verisi olarak kullanılmak üzere); kullanılabileceğinin gösterilmesi amaçlanmıştır. Bu bağlamda özellikle DKD’lerde ABG problemi için test verisi bulmanın zor olması nedeniyle yaklaşımın doğruluğunu ve ilerleyen dönemlerde DKD’lerde kullanılabilirliğini ispatlamak amacıyla çevrimiçi bulunan elle-etiketlenmiş İngilizce ABG verisi kullanılmıştır. Oluşturulan yarı-denetimli yöntemde öbek kümesi insert ignore into journalissuearticles values(seed set); ve bağlam vektörleri insert ignore into journalissuearticles values(context embeddings); kullanılmaktadır. Yapılan çalışma 9 farklı bağlamsal dil modelinde insert ignore into journalissuearticles values(ELMo, BERT, RoBERTa vb.); test edilmiş ve her bir dil modelinin ABG problemi üzerindeki etkileri raporlanmıştır. İlk temel yaklaşıma göre sonuçlar üzerinde %28 doğruluk oranında performans artışı sağlanmıştır. insert ignore into journalissuearticles values(ELMo ile ilk temel yaklaşım ile %50,39 ve ELMo Anlam Öbek Esaslı Ortalama Benzerlik Modeli ile %78,06);. Alınan ilk sonuçlara neticesinde, önerilen yaklaşımın özellikle DKD’ler yönelik ABG veri kümesi oluşturmak için gelecek vaat eden ettiği gösterilmiştir. Bu makale [18]’deki çalışmamızın genişletilmiş bir versiyonudur.Keywords : veri artırımı, anlam belirsizliği giderme, derin öğrenme, bağlam vektörü