Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma
Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma
dc.contributor.advisor | Günsel, Bilge | tr_TR |
dc.contributor.author | Kırbız, Serap | tr_TR |
dc.contributor.authorID | 461428 | tr_TR |
dc.contributor.department | Telekomünikasyon Mühendisliği | tr_TR |
dc.contributor.department | Telecommunication Engineering | en_US |
dc.date | 2013 | tr_TR |
dc.date.accessioned | 2013-02-21 | tr_TR |
dc.date.accessioned | 2015-07-13T10:30:06Z | |
dc.date.available | 2015-07-13T10:30:06Z | |
dc.date.issued | 2013-12-16 | tr_TR |
dc.description | Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2013 | tr_TR |
dc.description | Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2013 | en_US |
dc.description.abstract | Bu tez çalışmasında, tek bir gözlem işaretinden karışımı oluşturan ses kaynaklarını ayrıştırmak için bir çerçeve sağlayan Negatif Olmayan Matris Ayrıştırma (NOMA) ve Negatif Olmayan Tensör Ayrıştırma (NOTA) yöntemleri kullanılarak, altuzay öğrenmeye dayalı modeller önerilmektedir. Çalışmada öncelikle, polifonik müzik karışımlarından müzik aletlerini ayrıştırmak amacıyla önerilen, algısal olarak ağırlıklandırılmış Negatif Olmayan Çarpan 2-B Ters Evrişimi ve algısal olarak ağırlıklandırılmış Öbeklenmiş NOMA yöntemleri sunulmaktadır. Polifonik müzik işaretlerinin ayrıştırılmasında NOMA-tabanlı yöntemlerde karşılaşılan permütasyon problemi, altuzay gösteriminin ötelenme-ile-değişmezlik özelliği kullanılarak aynı müzik aleti tarafından çalınan notaların öbeklenmesi ile çözülmektedir. Tez kapsamında geliştirilen bir diğer yaklaşımda, konuşma ve müzik işaretlerini ayrıştırmak için, uyarlamalı çözünürlüğe dayalı bir kaynak ayrıştırma yöntemi önerilmektedir. Ayrıştırma, NOTA kullanılarak gerçekleştirilmiş olup, farklı çözünürlüklerde ayrıştırılmış kaynaklar büyükçe enerji sıkıştırma ilkesi yöntemine dayalı olarak uyarlamalı bir şekilde birleştirilmektedir. Son olarak, kaynaklar hakkında önsel bilginin problemin çözümünde kullanılmasına olanak sağlayan Bayesci bir kaynak ayrıştırma yöntemi incelenmektedir. Literatürde kullanılan ölçütler kullanılarak yapılan başarım analizi sonuçları, önerilen altuzay öğrenmeye dayalı ses kaynak ayrıştırma yöntemlerinin, tek kanaldan ses ayrıştırma probleminde sistem başarımını ve ayrıştırılan seslerin algısal kalitesini arttırdığı göstermektedir. | tr_TR |
dc.description.abstract | In this thesis, we propose models that provide a framework to separate audio signals from single observation based on subspace learning with Non-negative Matrix Factorization (NMF) and Non-negative Tensor Factorization (NTF). First, we introduce the perceptually weighted Non-negative Matrix Factor 2-D Deconvolution and the perceptually weighted Clustered NMF methods to separate musical instruments in polyphonic music mixtures. Permutation problem encountered in NMF-based separation of polyphonic music mixtures is eliminated by clustering the notes belonging to the same instrument based on shift-invariance property of subspace representations. In order to improve the separation quality we propose an NTF based method where each layer of the tensor represents the single channel mixture at a different time-frequency resolution. The separated sources obtained at various resolutions are then fused adaptively based on the maximal energy compaction principle. It is also evaluated whether Bayesian approach which opens up a way to incorporate prior information available about the sources into the separation scheme, improves the separation quality. Based on the comparisons performed with the existing methods, it is concluded that incorporation of the perceptual human auditory system model into the source separation increases the perceptual quality of the separated sources. | en_US |
dc.description.degree | Doktora | tr_TR |
dc.description.degree | PhD | en_US |
dc.identifier.uri | http://hdl.handle.net/11527/7621 | |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.publisher | Institute of Science and Technology | en_US |
dc.rights | İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. | tr_TR |
dc.rights | İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. | en_US |
dc.subject | Ses kaynak ayrıştırma | tr_TR |
dc.subject | altuzay öğrenme | tr_TR |
dc.subject | algısal maskeleme | tr_TR |
dc.subject | algısal kalite. | tr_TR |
dc.subject | Audio source separation | en_US |
dc.subject | subspace learning | en_US |
dc.subject | perceptual masking | en_US |
dc.subject | perceptual quality | en_US |
dc.title | Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma | tr_TR |
dc.title.alternative | Perceptual Audio Source Separation By Subspace Learning | en_US |
dc.type | Thesis | en_US |
dc.type | Tez | tr_TR |