Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma

Kırbız, Serap

Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma

dc.contributor.advisor	Günsel, Bilge	tr_TR
dc.contributor.author	Kırbız, Serap	tr_TR
dc.contributor.authorID	461428	tr_TR
dc.contributor.department	Telekomünikasyon Mühendisliği	tr_TR
dc.contributor.department	Telecommunication Engineering	en_US
dc.date	2013	tr_TR
dc.date.accessioned	2013-02-21	tr_TR
dc.date.accessioned	2015-07-13T10:30:06Z
dc.date.available	2015-07-13T10:30:06Z
dc.date.issued	2013-12-16	tr_TR
dc.description	Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2013	tr_TR
dc.description	Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2013	en_US
dc.description.abstract	Bu tez çalışmasında, tek bir gözlem işaretinden karışımı oluşturan ses kaynaklarını ayrıştırmak için bir çerçeve sağlayan Negatif Olmayan Matris Ayrıştırma (NOMA) ve Negatif Olmayan Tensör Ayrıştırma (NOTA) yöntemleri kullanılarak, altuzay öğrenmeye dayalı modeller önerilmektedir. Çalışmada öncelikle, polifonik müzik karışımlarından müzik aletlerini ayrıştırmak amacıyla önerilen, algısal olarak ağırlıklandırılmış Negatif Olmayan Çarpan 2-B Ters Evrişimi ve algısal olarak ağırlıklandırılmış Öbeklenmiş NOMA yöntemleri sunulmaktadır. Polifonik müzik işaretlerinin ayrıştırılmasında NOMA-tabanlı yöntemlerde karşılaşılan permütasyon problemi, altuzay gösteriminin ötelenme-ile-değişmezlik özelliği kullanılarak aynı müzik aleti tarafından çalınan notaların öbeklenmesi ile çözülmektedir. Tez kapsamında geliştirilen bir diğer yaklaşımda, konuşma ve müzik işaretlerini ayrıştırmak için, uyarlamalı çözünürlüğe dayalı bir kaynak ayrıştırma yöntemi önerilmektedir. Ayrıştırma, NOTA kullanılarak gerçekleştirilmiş olup, farklı çözünürlüklerde ayrıştırılmış kaynaklar büyükçe enerji sıkıştırma ilkesi yöntemine dayalı olarak uyarlamalı bir şekilde birleştirilmektedir. Son olarak, kaynaklar hakkında önsel bilginin problemin çözümünde kullanılmasına olanak sağlayan Bayesci bir kaynak ayrıştırma yöntemi incelenmektedir. Literatürde kullanılan ölçütler kullanılarak yapılan başarım analizi sonuçları, önerilen altuzay öğrenmeye dayalı ses kaynak ayrıştırma yöntemlerinin, tek kanaldan ses ayrıştırma probleminde sistem başarımını ve ayrıştırılan seslerin algısal kalitesini arttırdığı göstermektedir.	tr_TR
dc.description.abstract	In this thesis, we propose models that provide a framework to separate audio signals from single observation based on subspace learning with Non-negative Matrix Factorization (NMF) and Non-negative Tensor Factorization (NTF). First, we introduce the perceptually weighted Non-negative Matrix Factor 2-D Deconvolution and the perceptually weighted Clustered NMF methods to separate musical instruments in polyphonic music mixtures. Permutation problem encountered in NMF-based separation of polyphonic music mixtures is eliminated by clustering the notes belonging to the same instrument based on shift-invariance property of subspace representations. In order to improve the separation quality we propose an NTF based method where each layer of the tensor represents the single channel mixture at a different time-frequency resolution. The separated sources obtained at various resolutions are then fused adaptively based on the maximal energy compaction principle. It is also evaluated whether Bayesian approach which opens up a way to incorporate prior information available about the sources into the separation scheme, improves the separation quality. Based on the comparisons performed with the existing methods, it is concluded that incorporation of the perceptual human auditory system model into the source separation increases the perceptual quality of the separated sources.	en_US
dc.description.degree	Doktora	tr_TR
dc.description.degree	PhD	en_US
dc.identifier.uri	http://hdl.handle.net/11527/7621
dc.publisher	Fen Bilimleri Enstitüsü	tr_TR
dc.publisher	Institute of Science and Technology	en_US
dc.rights	İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.	tr_TR
dc.rights	İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.	en_US
dc.subject	Ses kaynak ayrıştırma	tr_TR
dc.subject	altuzay öğrenme	tr_TR
dc.subject	algısal maskeleme	tr_TR
dc.subject	algısal kalite.	tr_TR
dc.subject	Audio source separation	en_US
dc.subject	subspace learning	en_US
dc.subject	perceptual masking	en_US
dc.subject	perceptual quality	en_US
dc.title	Altuzay Öğrenme İle Algısal Ses Kaynak Ayrıştırma	tr_TR
dc.title.alternative	Perceptual Audio Source Separation By Subspace Learning	en_US
dc.type	Doctoral Thesis	en_US

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1

Ad:: 13354.pdf
Boyut:: 2.48 MB
Format:: Adobe Portable Document Format
Açıklama

İndir

Lisanslı seri

Şimdi gösteriliyor 1 - 1 / 1

Ad:: license.txt
Boyut:: 3.14 KB
Format:: Plain Text
Açıklama

İndir

Koleksiyonlar

FBE- Telekomünikasyon Mühendisliği Lisansüstü Programı - Doktora