An Application Of Neural Network-based Music Generation Models In The Context Of Modern And Contemporary Music

thumbnail.default.placeholder
Tarih
2019
Yazarlar
Akyol, Tuğrul Orkun
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Institute of Social Sciences
Sosyal Bilimler Enstitüsü
Özet
The purpose of this thesis is to test the performance of the artificial neural network- based music generation models in a different musical context and to determine if they can be used as composition assistance tools by the contemporary composer. A brief explanation of the working principles and recent history of ANNs are given before moving onto the conducted experiments. For the purposes of the thesis, a model called Performance RNN, developed by Project Magenta, is trained three times with different datasets and/or hyperparameters. The model is capable of creating performances with feeling: it is sensitive to time intervals as small as eight milliseconds and it can process dynamic information. The datasets are in MIDI format and they are compiled from audio files with the help of another neural network model called Onsets and Frames, which transcribes raw audio files of piano music into MIDI files. For the first experiment a dataset of Messiaen's complete piano works is used, which spans over six hours. Messiaen is chosen because of his relative consistent musical language and large output of solo piano works.
Bu tezin amacı nöral ağ bazlı müzik jenerasyon modellerini farklı bir müzikal bağlamda test etmek ve bu modellerin çağdaş besteciler tarafından kompozisyona yardımcı bir araç olarak kullanılıp kullanılmayacağını anlamaktır. Yapılan deneylerden önce nöral ağların çalışma prensipleri ve tarihleri ile ilgili kısaca bilgi verilmiştir. Bu doğrultuda Project Magenta tarafından geliştirilen Performance RNN isimli bir model değişik dataset ve/ya da hiperparametreler ile üç kez eğitilmiştir. Söz konusu model dinamik bilgileri dikkate aldığından ve sekiz milisaniyeye kadar zaman aralıklarına duyarlı olduğundan hissiyat içeren performanslar yaratabilmektedir. Modeli eğitmek için kullanılan datasetteki dosyalar MIDI formatındadır ve bu formata ses dosyalarından Onsets and Frames isimli başka bir nöral ağ tarafından dönüştürülmüştür. Birinci deney için Messiaen'in bütün piyano eserleri kullanılmıştır. Bu eserler yaklaşık altı saat sürmektedir. Messiaen yazdığı müziklerde nispeten tutarlı bir dil kullanması ve geniş bir piyano repertuarı olması nedeniyle seçilmiştir. Modelin ilk deneyde kullanılan konfigürasyonu dinamik bilgileri dikkate almaktadır. Bu deney sonucunda elde edilen müziklerde Messiaen'in müziğini andıran özellikler bulunsa da model eğitiminin doğruluk derecesi yüzde 40 gibi düşük bir rakamda kalmıştır. Modelin nota içeriği olarak başarılı müzikler ürettiğini söylenebilse de aynı şeyi ritmik içerik ve formal yapı olarak söylemek mümkün değildir.
Açıklama
Thesis (M.A) -- İstanbul Technical University, Institute of Social Sciences, 2019
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Sosyal Bilimler Enstitüsü, 2019
Anahtar kelimeler
Music, Müzik
Alıntı