Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma

dc.contributor.advisor Günsel, Bilge tr_TR
dc.contributor.author Kırbız, Serap tr_TR
dc.contributor.authorID 461428 tr_TR
dc.contributor.department Telekomünikasyon Mühendisliği tr_TR
dc.contributor.department Telecommunication Engineering en_US
dc.date 2013 tr_TR
dc.date.accessioned 2013-02-21 tr_TR
dc.date.accessioned 2015-07-13T10:30:06Z
dc.date.available 2015-07-13T10:30:06Z
dc.date.issued 2013-12-16 tr_TR
dc.description Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2013 tr_TR
dc.description Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2013 en_US
dc.description.abstract Bu tez çalışmasında, tek bir gözlem işaretinden karışımı oluşturan ses kaynaklarını ayrıştırmak için bir çerçeve sağlayan Negatif Olmayan Matris Ayrıştırma (NOMA) ve Negatif Olmayan Tensör Ayrıştırma (NOTA) yöntemleri kullanılarak, altuzay öğrenmeye dayalı modeller önerilmektedir. Çalışmada öncelikle, polifonik müzik karışımlarından müzik aletlerini ayrıştırmak amacıyla önerilen, algısal olarak ağırlıklandırılmış Negatif Olmayan Çarpan 2-B Ters Evrişimi ve algısal olarak ağırlıklandırılmış Öbeklenmiş NOMA yöntemleri sunulmaktadır. Polifonik müzik işaretlerinin ayrıştırılmasında NOMA-tabanlı yöntemlerde karşılaşılan permütasyon problemi, altuzay gösteriminin ötelenme-ile-değişmezlik özelliği kullanılarak aynı müzik aleti tarafından çalınan notaların öbeklenmesi ile çözülmektedir. Tez kapsamında geliştirilen bir diğer yaklaşımda, konuşma ve müzik işaretlerini ayrıştırmak için, uyarlamalı çözünürlüğe dayalı bir kaynak ayrıştırma yöntemi önerilmektedir. Ayrıştırma, NOTA kullanılarak gerçekleştirilmiş olup, farklı çözünürlüklerde ayrıştırılmış kaynaklar büyükçe enerji sıkıştırma ilkesi yöntemine dayalı olarak uyarlamalı bir şekilde birleştirilmektedir. Son olarak, kaynaklar hakkında önsel bilginin problemin çözümünde kullanılmasına olanak sağlayan Bayesci bir kaynak ayrıştırma yöntemi incelenmektedir. Literatürde kullanılan ölçütler kullanılarak yapılan başarım analizi sonuçları, önerilen altuzay öğrenmeye dayalı ses kaynak ayrıştırma yöntemlerinin, tek kanaldan ses ayrıştırma probleminde sistem başarımını ve ayrıştırılan seslerin algısal kalitesini arttırdığı göstermektedir. tr_TR
dc.description.abstract In this thesis, we propose models that provide a framework to separate audio signals from single observation based on subspace learning with Non-negative Matrix Factorization (NMF) and Non-negative Tensor Factorization (NTF). First, we introduce the perceptually weighted Non-negative Matrix Factor 2-D Deconvolution and the perceptually weighted Clustered NMF methods to separate musical instruments in polyphonic music mixtures. Permutation problem encountered in NMF-based separation of polyphonic music mixtures is eliminated by clustering the notes belonging to the same instrument based on shift-invariance property of subspace representations. In order to improve the separation quality we propose an NTF based method where each layer of the tensor represents the single channel mixture at a different time-frequency resolution. The separated sources obtained at various resolutions are then fused adaptively based on the maximal energy compaction principle. It is also evaluated whether Bayesian approach which opens up a way to incorporate prior information available about the sources into the separation scheme, improves the separation quality. Based on the comparisons performed with the existing methods, it is concluded that incorporation of the perceptual human auditory system model into the source separation increases the perceptual quality of the separated sources. en_US
dc.description.degree Doktora tr_TR
dc.description.degree PhD en_US
dc.identifier.uri http://hdl.handle.net/11527/7621
dc.publisher Fen Bilimleri Enstitüsü tr_TR
dc.publisher Institute of Science and Technology en_US
dc.rights İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. tr_TR
dc.rights İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. en_US
dc.subject Ses kaynak ayrıştırma tr_TR
dc.subject altuzay öğrenme tr_TR
dc.subject algısal maskeleme tr_TR
dc.subject algısal kalite. tr_TR
dc.subject Audio source separation en_US
dc.subject subspace learning en_US
dc.subject perceptual masking en_US
dc.subject perceptual quality en_US
dc.title Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma tr_TR
dc.title.alternative Perceptual Audio Source Separation By Subspace Learning en_US
dc.type Thesis en_US
dc.type Tez tr_TR
Dosyalar
Orijinal seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.alt
Ad:
13354.pdf
Boyut:
2.48 MB
Format:
Adobe Portable Document Format
Açıklama
Lisanslı seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.placeholder
Ad:
license.txt
Boyut:
3.14 KB
Format:
Plain Text
Açıklama