Türkçe Metin Seslendirme

thumbnail.default.alt
Tarih
2009-10-23
Yazarlar
Güldalı, Kenan
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Bu çalışmada, ses birimi uzunluğu olarak heceyi kullanan, bağlamalı sentezleme tekniğine dayanan bir metin seslendirme sistemi gerçeklenmiştir. Bir metin sentezleyici gerçeklenirken, oluşturulan konuşma çıkışının kalitesinin yüksek olması, hafıza gereksiniminin düşük olması, uygulamanın karmaşıklığının çok fazla olmaması, dolayısıyla hesaplama hızının yüksek olması amaçlanır. Tasarlanan sistemde kayıtlı kelimelerden hecelerin kesilmesi ve bu hecelerin birleştirilmesi ile ilgili kurallar oluşturulmuştur. Bu kurallar kelimelerde hecelerin birleştirme yerlerindeki seslerin oluşum şekillerine(nefesli, nefessiz, patlamalı vb.) ya da üretim yerlerine bağlı olarak oluşturulmuştur. Bu kurallar daha sonra birleştirme yazılımına eklenmiştir. Gerçeklenen bu sözcük sentezleyici yazılımı için küçük bir hece veri tabanı oluşturulup denenmiştir. Sistem, girişte aldığı metin bilgisinden heceleri oluşturur. Daha sonra bu hecelere ait parametre dosyalarını kullanarak heceleri kayıtlı oldukları dosyalardan alır ve bunları birleştirmeye başlar. Bu aşamada hecelerin birleşme noktalarında seslerin türlerine göre belirlenen kurallar uygulanmış ve gerçek ses dosyalarındaki dalga şekillerine benzer doğallık oluşturulmaya çalışılmıştır.
In this MS thesis, a text to speech system which uses syllable as sound unit length and depends on concatenative synthesis method was developed. When developing a text to speech system, it should be aimed to have a high quality speech output, with small memory requirement using an application which is not complex. In this project, rules for cutting syllables from word database and concatenating these syllables were created. These rules were formed according to the formation and place of articulation of sound (e.g. voiced, unvoiced, plosive). While forming the rules, many tests were done on the sound files of the voice dictionary database of Turkish Language Association. The rules which were achived as the result of these tests were later added to the concatenation software. The rules which were developed according to the sound types at the concatenation points of syllables are used and natural sounds which are similar to the waveforms in real sound files are tried to be developed. It is tried to have this naturalness by putting extension or articulation at the beginning or end of the syllable in the required places.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2009
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2009
Anahtar kelimeler
Metin Seslendirme, Bağlamalı Sentezleme, Text to Speech, Concatenative Synthesis
Alıntı