- RumeliDE Dil ve Edebiyat Araştırmaları Dergisi
- Issue:Ã12 Special Issue
- Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi
Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi
Authors : Yasemin KUBİLAY, Meriç GÜVEN
Pages : 24-36
Doi:10.29000/rumelide.1330375
View : 71 | Download : 52
Publication Date : 2023-07-23
Article Type : Research Paper
Abstract :Son yıllarda bilişim teknolojileri alanındaki gelişmelere bağlı olarak dilleri, bilgisayarlı dilbilim ve doğal dil işleme insert ignore into journalissuearticles values(DDİ); yöntemleriyle incelemek, çözümlemek ve yapılandırılmış verilere dönüştürmek olanaklı hâle gelmiştir. Türkçenin tarihî dönemleri ile ilgili eş dizimlilik, birliktelik kullanımı, semantik prozodi ve semantik harita çalışmalarının azlığı bizi bu konuları hesaplamalı perspektifle inceleyen bir çalışma yapmaya sevk etmiştir. Araştırmamızda tarihî Türkçe ile yazılmış eserlerde de semantik ağları görüntülemek için münasip kelime hazinesinin mevcut olduğu görülmüştür. İki veya daha çok kelimenin alışkanlıktan kaynaklanan birlikte kullanımları şeklinde tanımlanan eş dizimlilik kavramına göre, bazı kelimeler yalnızca belirli sözcüklerle kullanılma temayülü gösterir. Birlikte sıkça kullanılan kelimeler zamanla aynı çağrışım özelliklerini kazanır, anlam ve biçim bakımından kalıplaşır. Bir biçime eş dizimlilikleri tarafından aşılanan kalıcı istikrarlı anlam aurası ise semantik prozodi olarak tanımlanır. Bu anlam aurası, incelememiz sırasında somut bir şekilde karşımıza çıkmıştır. Çalışmamızda seçilen her kavramın Python programlama dilinde, GraphViz Kütüphanesi ile oluşturulan semantik haritası üzerinde anlam aurası gösterilmiştir. Ayrıca “eş dizimli” ögeleri tespit etmek üzere makine öğrenmesinin bir alanı olan DDİ yöntemlerinden kelime yerleştirme insert ignore into journalissuearticles values(word embedding/vectorization); ile metin madenciliğinde, makine öğrenmede ve DDİ tekniklerinde yararlanılan GloVe kütüphanesi kullanılarak hazırladığımız yazılım ve Tensor Flow Kelime Yerleştirme Projektörü yazılımı kullanılmıştır. Metinler, bilgisayar ortamına düz metin dosyası insert ignore into journalissuearticles values(.txt); olarak aktarılmış, metinlerdeki eş dizimli kelime varlığı yazılımlara işlenmiş ve Log-likehood, MI değeri, T-skoru, Dice coefficient değeri gibi farklı istatistik analizleri ile de eş dizimlilikler incelenmiştir. Metinlerdeki eş dizimliliklere ait istatistikleri, kelime sıklıkları, vektörel temsillerinin DDİ’de kullanılan yazılımlar aracılığıyla genel olarak çıkarımları amaçlanmıştır. Sayısallaştırılan metin istatistikî değerleriyle işlenmiş ve ulaşılan veriler görsel olarak gösterilmiştir. Araştırmamız, özellikle Türkçenin tarihî dönem eserlerinin daha iyi anlaşılmasına katkı sağlayacak; eş dizimli yapıların tespiti sayesinde tarihî metinlerde satır arası sözcüklerin anlamlandırılması, anlam auralarının keşfi kolaylıkla yapılabilecektir. Gelişen bilgisayar teknolojileri sayesinde yeni yazılımlar ile anlam haritalarının, sözcüklerin vektörel şemalarının ve anlam auralarının somut gösterimi sağlanacaktır.Keywords : Doğal dil işleme, birliktelik kullanımı, eş dizimlilik, semantik prozodi, semantik harita