Dayanıklı ses HASH'leme ile içerik tanılama

Gürsoy, Ozan

Dayanıklı ses HASH'leme ile içerik tanılama

dc.contributor.advisor	Günsel, Bilge
dc.contributor.author	Gürsoy, Ozan
dc.contributor.department	Bilgisayar Mühendisliği
dc.contributor.department	Computer Engineering
dc.date	2006
dc.date.accessioned	2015-04-07T13:59:53Z
dc.date.available	2015-04-07T13:59:53Z
dc.description	Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2006
dc.description	Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2006
dc.description.abstract	Bu çalışmada, Phillips Research tarafından tanımlanan “Robust Audio Fingerprinting” yöntemi ile, bilinmeyen bir ses verisini tanılama sistemi gerçeklenmiştir. Ses tanılama sistemi, bilinmeyen bir ses verisinin ayırt edici algısal özelliklerinin bulunup, daha önceden oluşturulmuş bir veri tabanı içinde, model eşleme yöntemine dayalı karşılaştırılması sonucunda, ses verisini tanımlamaya yarayan bilgilerin elde edilmesidir. Ses hash’lemesi ile şarkının belli bir miktarını benzersiz olarak tanılamaya yarayan ses parmakizlerinin kodlanması sağlanır. Ses tanılama sistemi iki ana bölümden oluşur: ses parmakizleri çıkarma algoritması ve çıkarılan ses parmakizlerinin, çok sayıda şarkıya ait parmakizleri bulunan bir veri tabanında en etkin şekilde aranması. Ses parmakleri, ses verisinin her 11.6 milisaniyesi için oluşturulan 32 bitlik ses alt-parmakizlerinden (hash değerlerinden) oluşur. Bu, sesin 11.6 milisaniyelik bir çözünürlükle incelendiği anlamına gelir. Alt-parmakizleri zaman ve frekans uzayı boyunca hesaplanan enerji farklarından elde edilir. 256 hash değerinin oluşturduğu dizi bir ses parmakizine karşı düşer. Bu da ses verisinde yaklaşık 3 saniyelik bir bölümdür ve ses verisinin tanılanması için yeterli bilgiyi içerir. Ses parmakizi arama algoritmasının temel hedefi, bir parmakizi bloğunu mümkün olan en etkin şekilde veri tabanındaki parmakizleriyle karşılaştırmaktır. Bire bir eşleşmeden çok en benzeyen ses parmakizlerinin buılunması amaçlandığı için karşılaştırma basit bir işlem değildir. Aranacak ses parmakizleri genelde işlenmiş ya da bozulmuş ses verilerinden çıkarıldığı için bire bir eşleme kullanılamamaktadır.
dc.description.abstract	Audio hashing provides coding audio fingerprint, which is used for uniquely identification of a segment of music. An audio fingerprint system basically consists of two parts: a fingerprint extraction algorithm and an algorithm to efficiently search such a fingerprint in a fingerprint database containing the fingerprints of many recordings. Audio fingerprinting extraction is based on extracting bit sequences of 32 bits, so called sub-fingerprints (hash values), for every 11.6 ms of audio. This means audio is examined under a resolution of 11.6 ms. These sub-fingerprints are obtained from energy differences along both the time and the frequency axis. A sequence of 256 sub-fingerprints equals a fingerprint block, which corresponds to 3 seconds of audio, contains enough information to enable reliable identification. The basic aim of the audio fingerprint search algorithm is to compare a fingerprint block with the fingerprints in the database in an efficient way as possible. It is not an insignificant task, because the matter is not to find an exact copy but the most similar one. This is due to the fact that a fingerprint block that has to be identified is generally taken from an audio excerpt that has been processed or degenerated. The described audio fingerprint extraction algorithm is highly robust against audio signal degradations. Besides it needs only 3 seconds of audio to identify a song. The fingerprint search algorithm is highly efficient and fast.
dc.description.degree	Yüksek Lisans
dc.description.degree	M.Sc.
dc.identifier.uri	http://hdl.handle.net/11527/499
dc.publisher	Fen Bilimleri Enstitüsü
dc.publisher	Institute of Science and Technology
dc.rights	İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.
dc.rights	İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.
dc.subject	İçerik Tanılama
dc.subject	Ses Parmakizi
dc.subject	Ses Tanıma
dc.subject	Yakınlık Arama
dc.subject	Veri Tabanı
dc.subject	Content Identification
dc.subject	Audio Fingerprinting
dc.subject	Audio Recognition
dc.subject	Proximity Search
dc.subject	Database
dc.title	Dayanıklı ses HASH'leme ile içerik tanılama
dc.title.alternative	Robust Audio Hashing For Content Identification
dc.type	Master Thesis

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1

Ad:: 3748.pdf
Boyut:: 3.77 MB
Format:: Adobe Portable Document Format

İndir

Koleksiyonlar

FBE- Bilgisayar Mühendisliği Lisansüstü Programı - Yüksek Lisans