Dayanıklı ses HASH'leme ile içerik tanılama

dc.contributor.advisorGünsel, Bilge
dc.contributor.authorGürsoy, Ozan
dc.contributor.departmentBilgisayar Mühendisliği
dc.contributor.departmentComputer Engineering
dc.date2006
dc.date.accessioned2015-04-07T13:59:53Z
dc.date.available2015-04-07T13:59:53Z
dc.descriptionTez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2006
dc.descriptionThesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2006
dc.description.abstractBu çalışmada, Phillips Research tarafından tanımlanan “Robust Audio Fingerprinting” yöntemi ile, bilinmeyen bir ses verisini tanılama sistemi gerçeklenmiştir. Ses tanılama sistemi, bilinmeyen bir ses verisinin ayırt edici algısal özelliklerinin bulunup, daha önceden oluşturulmuş bir veri tabanı içinde, model eşleme yöntemine dayalı karşılaştırılması sonucunda, ses verisini tanımlamaya yarayan bilgilerin elde edilmesidir. Ses hash’lemesi ile şarkının belli bir miktarını benzersiz olarak tanılamaya yarayan ses parmakizlerinin kodlanması sağlanır. Ses tanılama sistemi iki ana bölümden oluşur: ses parmakizleri çıkarma algoritması ve çıkarılan ses parmakizlerinin, çok sayıda şarkıya ait parmakizleri bulunan bir veri tabanında en etkin şekilde aranması. Ses parmakleri, ses verisinin her 11.6 milisaniyesi için oluşturulan 32 bitlik ses alt-parmakizlerinden (hash değerlerinden) oluşur. Bu, sesin 11.6 milisaniyelik bir çözünürlükle incelendiği anlamına gelir. Alt-parmakizleri zaman ve frekans uzayı boyunca hesaplanan enerji farklarından elde edilir. 256 hash değerinin oluşturduğu dizi bir ses parmakizine karşı düşer. Bu da ses verisinde yaklaşık 3 saniyelik bir bölümdür ve ses verisinin tanılanması için yeterli bilgiyi içerir. Ses parmakizi arama algoritmasının temel hedefi, bir parmakizi bloğunu mümkün olan en etkin şekilde veri tabanındaki parmakizleriyle karşılaştırmaktır. Bire bir eşleşmeden çok en benzeyen ses parmakizlerinin buılunması amaçlandığı için karşılaştırma basit bir işlem değildir. Aranacak ses parmakizleri genelde işlenmiş ya da bozulmuş ses verilerinden çıkarıldığı için bire bir eşleme kullanılamamaktadır.
dc.description.abstractAudio hashing provides coding audio fingerprint, which is used for uniquely identification of a segment of music. An audio fingerprint system basically consists of two parts: a fingerprint extraction algorithm and an algorithm to efficiently search such a fingerprint in a fingerprint database containing the fingerprints of many recordings. Audio fingerprinting extraction is based on extracting bit sequences of 32 bits, so called sub-fingerprints (hash values), for every 11.6 ms of audio. This means audio is examined under a resolution of 11.6 ms. These sub-fingerprints are obtained from energy differences along both the time and the frequency axis. A sequence of 256 sub-fingerprints equals a fingerprint block, which corresponds to 3 seconds of audio, contains enough information to enable reliable identification. The basic aim of the audio fingerprint search algorithm is to compare a fingerprint block with the fingerprints in the database in an efficient way as possible. It is not an insignificant task, because the matter is not to find an exact copy but the most similar one. This is due to the fact that a fingerprint block that has to be identified is generally taken from an audio excerpt that has been processed or degenerated. The described audio fingerprint extraction algorithm is highly robust against audio signal degradations. Besides it needs only 3 seconds of audio to identify a song. The fingerprint search algorithm is highly efficient and fast.
dc.description.degreeYüksek Lisans
dc.description.degreeM.Sc.
dc.identifier.urihttp://hdl.handle.net/11527/499
dc.publisherFen Bilimleri Enstitüsü
dc.publisherInstitute of Science and Technology
dc.rightsİTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.
dc.rightsİTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.
dc.subjectİçerik Tanılama
dc.subjectSes Parmakizi
dc.subjectSes Tanıma
dc.subjectYakınlık Arama
dc.subjectVeri Tabanı
dc.subjectContent Identification
dc.subjectAudio Fingerprinting
dc.subjectAudio Recognition
dc.subjectProximity Search
dc.subjectDatabase
dc.titleDayanıklı ses HASH'leme ile içerik tanılama
dc.title.alternativeRobust Audio Hashing For Content Identification
dc.typeMaster Thesis

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
Ad:
3748.pdf
Boyut:
3.77 MB
Format:
Adobe Portable Document Format