- Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi
- Volume:24 Issue:2
- Music emotion classification for Turkish songs using lyrics
Music emotion classification for Turkish songs using lyrics
Authors : Ahmet Onur DURAHİM, Abide COŞKUN SETİREK, Birgül BAŞARIR ÖZEL, Hanife KEBAPÇI
Pages : 292-301
View : 11 | Download : 6
Publication Date : 2018-04-30
Article Type : Research Paper
Abstract :Normal 0 false false false TR X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:`Normal Tablo`; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:``; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:10.0pt; mso-para-margin-left:0cm; line-height:115%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:`Calibri`,sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:`Times New Roman`; mso-bidi-theme-font:minor-bidi; mso-ansi-language:TR;} Müzik insanlık tarihinde önemli bir yere sahiptir. Özellikle dijital çağda kişiler tarafından her gün yaratılan ve ulaşılan müzik koleksiyonlarının büyüklüğü ile müziğin önemi daha da artmış ve insanlar m üzik içeren aktivitelere daha fazla zaman ayırmaya başlamışlardır . Bununla birlikte, müziğe bilgi geri getirim sürecini kolay ve etkin hale getirmek için yapılan katalog bazlı aramalar duygu tabanlı etiketlere göre aramalara dönüşmüştür. Bu araştırmada amacımız şarkı sözlerine göre bir şarkıdan algılanan duygunun otomatik olarak çıkarıldığı bir model geliştirmektir. Model metin bazlı sınıflandırma için kullanılan makina öğrenmesi algoritmaları ile oluşturulmuştur. Bu amaçla araştırmada 300 şarkı seçilmiş ve bu şarkılar kişiler tarafından hissedilen duygularına göre etiketlenmiştir. Devamında metin ön analizi ile şarkı sözleri Türkçe köklerine ayrıştırılarak Unigram, Bigram ve Trigram kelime özellikleri çıkartılmıştır. Ardından endeksleri terim sıklığı ve tf-idf değerleri olan doküman bazında terim matrisleri yaratılmıştır. Bu matris değerleri 5 farklı sınıflandırma algoritmasına girdi olarak verilerek en yüksek doğruluk sonuçları, hatırlama ve kesinlik metrikleri üzerinden araştırılmıştır. Araştırmanın sonucunda en yüksek kesinlik değeri Zemberek Uzun Kök Ayıştırma Metodu ile Unigram kelime özelliklerine göre ayrıştırılmış ve endeksi terim sıklığına göre belirlenmiş terim bazlı doküman matrisinin Katlıterim Naïve Bayes kümeleyicisinde verdiği görülmüştür. Bu kombinasyonda hatırlama metriği değeri 43.7 iken kesinlik metriği değeri 46.9’dur.Keywords : Metin madenciliği, Metin sınıflandırması, Duygu analizi, Müzik duygu geri getirim