Ötümlü Konuşma Sesi Kalıntı Sinyallerinin 1/f Özelliğinin İncelenmesi

thumbnail.default.alt
Tarih
Yazarlar
Baykut, Süleyman
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Bu çalışmada, İngilizce’deki ötümlü seslerin kalıntı sinyallerinin 1/f özelliği dalgacık tabanlı analiz ile incelenmektedir. Ele alınan ses üretim modelinde, ses yolu doğrusal bir sistem olarak modellenmiştir. Bu sistemi uyaran sinyal 1/f gürültüsüdür ve ses kalıntı sinyali olarak adlandırılmaktadır. Ünlü sesler en belirgin ötümlü sesbirimi grubunu oluştururlar. Bu sebeple incelemede erkek ve kadın konuşmacılar tarafından üretilen /IY/, /IH/, /EI/, /EH/, /AE/, /ER/, /AH/, /AW/, /OA/, /OO/, /UW/ ve /UH/ ünlü sesleri ele alınmıştır. Kalıntı sinyalini elde etme aşamasında, ilkin, sesin güç izgesi beyazlatılmakta ve beyazlatılmış izge üzerine doğrusal öngörü analizi uygulanarak ses yolu parametreleri elde edilmektedir. Daha sonra tersinir süzgeçleme ile süzgecin uyarıcısı olan kalıntı sinyaline ulaşılır. Kalıntı sinyaline dalgacık dönüşümü (wavelet transform) uygulanarak dalgacık katsayıları elde edilmektedir. Kalıntı sinyalinin 1/f davranışı gösterdiği varsayımıyla, bu sinyalin güç izgesinin “güç-yasası” ilişkisine sahip olduğu söylenebilir. Güç yasası ilişkisi dalgacık katsayılarının değişinti gelişimlerinde de görülmektedir. Bu çalışmada dalgacık katsayılarının değişinti gelişimleri kullanılarak öz-benzeşim parametreleri kestirilmiş, bu parametrelerin kadın ve erkeklere ait farklı seslerdeki davranışları incelenerek cinsiyet ayrımında etkin bir kıstas olup olamayacağı araştırılmıştır. Konuşma sesinin doğallığının ana etmeni, uyarıcı kalıntı sinyalinin rasgele öz-benzeşimli yapısında gizlidir. Ses kalıntı sinyalinin öz-benzeşimli yapısının bir parametre ile modellenebileceği gösterilmiş ve bu parametrenin kullanılabileceği alanlar incelenmiştir. Öz-benzeşimli yapı araştırılarak, gerçeğe daha yakın yapay ses üretiminde kullanılabilecek uyarıcı sinyalin ne şekilde olması gerektiği hakkında bilgi edinilmeye çalışılmıştır.
In this thesis, the 1/f nature of voiced speech residual signal is examined by wavelet based analysis method. Speech signals are generally classified as voiced or unvoiced. Voiced speech signals are considered to be generated by the vocal cords vibration signal exciting the vocal tract. In our model, the vocal tract is considered as a linear system. The excitation signal is the 1/f noise which is called the speech residual signal. Since the vowels are the largest and the most evident voiced phoneme group, we study some of these vowels, i.e., /IY/, /IH/, /EI/, /EH/, /AE/, /ER/, /AH/, /AW/, /OA/, /OO/, /UW/ and /UH/ which are generated by several men and women. To extract the speech residual, first, we force to whiten the power spectrum of the speech signal by using a preemphasize filter and then perform the linear predictive analysis on the whitened speech to obtain the vocal tract parameters. The speech residual signal is obtained by the inverse filter. A wavelet decomposition technique is applied to the residual signal to obtain the wavelet coefficients. The power-law relationship is observed in the progression of the variances of these coefficients along scales. The self-similarity parameters (the slope of the progression) are then estimated. We investigate and compare the behavior of the self-similarity parameters for the speeches of 40 men and 40 women. A speaker gender identification method is explored based on the self-similarity parameter. The random fractalness of the speech residual signals is considered to be a key factor in their naturalness. In this thesis, the random fractalness of the speech residual signal is explored in order to learn how to design more realistic source signals for speech synthesis.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2004
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2004
Anahtar kelimeler
1/f Süreçler, Rasgele Öz-Benzeşimlilik, Dalgacık Tabanlı Analiz, Kalıntı Sinyali Çıkarımı., 1/f Processes, Random Self-similarity, Wavelet Based Method, Residual Extraction.
Alıntı