Please use this identifier to cite or link to this item: http://hdl.handle.net/11527/348
Title: Türkçe Metin Seslendirme
Other Titles: Turkish Text To Speech System
Authors: Adalı, Eşref
Güldalı, Kenan
Bilgisayar Mühendisliği
Computer Engineering
Keywords: Metin Seslendirme
Bağlamalı Sentezleme
Text to Speech
Concatenative Synthesis
Issue Date: 23-Oct-2009
Publisher: Fen Bilimleri Enstitüsü
Institute of Science and Technology
Abstract: Bu çalışmada, ses birimi uzunluğu olarak heceyi kullanan, bağlamalı sentezleme tekniğine dayanan bir metin seslendirme sistemi gerçeklenmiştir. Bir metin sentezleyici gerçeklenirken, oluşturulan konuşma çıkışının kalitesinin yüksek olması, hafıza gereksiniminin düşük olması, uygulamanın karmaşıklığının çok fazla olmaması, dolayısıyla hesaplama hızının yüksek olması amaçlanır. Tasarlanan sistemde kayıtlı kelimelerden hecelerin kesilmesi ve bu hecelerin birleştirilmesi ile ilgili kurallar oluşturulmuştur. Bu kurallar kelimelerde hecelerin birleştirme yerlerindeki seslerin oluşum şekillerine(nefesli, nefessiz, patlamalı vb.) ya da üretim yerlerine bağlı olarak oluşturulmuştur. Bu kurallar daha sonra birleştirme yazılımına eklenmiştir. Gerçeklenen bu sözcük sentezleyici yazılımı için küçük bir hece veri tabanı oluşturulup denenmiştir. Sistem, girişte aldığı metin bilgisinden heceleri oluşturur. Daha sonra bu hecelere ait parametre dosyalarını kullanarak heceleri kayıtlı oldukları dosyalardan alır ve bunları birleştirmeye başlar. Bu aşamada hecelerin birleşme noktalarında seslerin türlerine göre belirlenen kurallar uygulanmış ve gerçek ses dosyalarındaki dalga şekillerine benzer doğallık oluşturulmaya çalışılmıştır.
In this MS thesis, a text to speech system which uses syllable as sound unit length and depends on concatenative synthesis method was developed. When developing a text to speech system, it should be aimed to have a high quality speech output, with small memory requirement using an application which is not complex. In this project, rules for cutting syllables from word database and concatenating these syllables were created. These rules were formed according to the formation and place of articulation of sound (e.g. voiced, unvoiced, plosive). While forming the rules, many tests were done on the sound files of the voice dictionary database of Turkish Language Association. The rules which were achived as the result of these tests were later added to the concatenation software. The rules which were developed according to the sound types at the concatenation points of syllables are used and natural sounds which are similar to the waveforms in real sound files are tried to be developed. It is tried to have this naturalness by putting extension or articulation at the beginning or end of the syllable in the required places.
Description: Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2009
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2009
URI: http://hdl.handle.net/11527/348
Appears in Collections:Bilgisayar Mühendisliği Lisansüstü Programı - Yüksek Lisans

Files in This Item:
File Description SizeFormat 
9933.pdf828.74 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.