Dayanıklı ses HASH'leme ile içerik tanılama
| dc.contributor.advisor | Günsel, Bilge | |
| dc.contributor.author | Gürsoy, Ozan | |
| dc.contributor.department | Bilgisayar Mühendisliği | |
| dc.contributor.department | Computer Engineering | |
| dc.date | 2006 | |
| dc.date.accessioned | 2015-04-07T13:59:53Z | |
| dc.date.available | 2015-04-07T13:59:53Z | |
| dc.description | Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2006 | |
| dc.description | Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2006 | |
| dc.description.abstract | Bu çalışmada, Phillips Research tarafından tanımlanan “Robust Audio Fingerprinting” yöntemi ile, bilinmeyen bir ses verisini tanılama sistemi gerçeklenmiştir. Ses tanılama sistemi, bilinmeyen bir ses verisinin ayırt edici algısal özelliklerinin bulunup, daha önceden oluşturulmuş bir veri tabanı içinde, model eşleme yöntemine dayalı karşılaştırılması sonucunda, ses verisini tanımlamaya yarayan bilgilerin elde edilmesidir. Ses hash’lemesi ile şarkının belli bir miktarını benzersiz olarak tanılamaya yarayan ses parmakizlerinin kodlanması sağlanır. Ses tanılama sistemi iki ana bölümden oluşur: ses parmakizleri çıkarma algoritması ve çıkarılan ses parmakizlerinin, çok sayıda şarkıya ait parmakizleri bulunan bir veri tabanında en etkin şekilde aranması. Ses parmakleri, ses verisinin her 11.6 milisaniyesi için oluşturulan 32 bitlik ses alt-parmakizlerinden (hash değerlerinden) oluşur. Bu, sesin 11.6 milisaniyelik bir çözünürlükle incelendiği anlamına gelir. Alt-parmakizleri zaman ve frekans uzayı boyunca hesaplanan enerji farklarından elde edilir. 256 hash değerinin oluşturduğu dizi bir ses parmakizine karşı düşer. Bu da ses verisinde yaklaşık 3 saniyelik bir bölümdür ve ses verisinin tanılanması için yeterli bilgiyi içerir. Ses parmakizi arama algoritmasının temel hedefi, bir parmakizi bloğunu mümkün olan en etkin şekilde veri tabanındaki parmakizleriyle karşılaştırmaktır. Bire bir eşleşmeden çok en benzeyen ses parmakizlerinin buılunması amaçlandığı için karşılaştırma basit bir işlem değildir. Aranacak ses parmakizleri genelde işlenmiş ya da bozulmuş ses verilerinden çıkarıldığı için bire bir eşleme kullanılamamaktadır. | |
| dc.description.abstract | Audio hashing provides coding audio fingerprint, which is used for uniquely identification of a segment of music. An audio fingerprint system basically consists of two parts: a fingerprint extraction algorithm and an algorithm to efficiently search such a fingerprint in a fingerprint database containing the fingerprints of many recordings. Audio fingerprinting extraction is based on extracting bit sequences of 32 bits, so called sub-fingerprints (hash values), for every 11.6 ms of audio. This means audio is examined under a resolution of 11.6 ms. These sub-fingerprints are obtained from energy differences along both the time and the frequency axis. A sequence of 256 sub-fingerprints equals a fingerprint block, which corresponds to 3 seconds of audio, contains enough information to enable reliable identification. The basic aim of the audio fingerprint search algorithm is to compare a fingerprint block with the fingerprints in the database in an efficient way as possible. It is not an insignificant task, because the matter is not to find an exact copy but the most similar one. This is due to the fact that a fingerprint block that has to be identified is generally taken from an audio excerpt that has been processed or degenerated. The described audio fingerprint extraction algorithm is highly robust against audio signal degradations. Besides it needs only 3 seconds of audio to identify a song. The fingerprint search algorithm is highly efficient and fast. | |
| dc.description.degree | Yüksek Lisans | |
| dc.description.degree | M.Sc. | |
| dc.identifier.uri | http://hdl.handle.net/11527/499 | |
| dc.publisher | Fen Bilimleri Enstitüsü | |
| dc.publisher | Institute of Science and Technology | |
| dc.rights | İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. | |
| dc.rights | İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. | |
| dc.subject | İçerik Tanılama | |
| dc.subject | Ses Parmakizi | |
| dc.subject | Ses Tanıma | |
| dc.subject | Yakınlık Arama | |
| dc.subject | Veri Tabanı | |
| dc.subject | Content Identification | |
| dc.subject | Audio Fingerprinting | |
| dc.subject | Audio Recognition | |
| dc.subject | Proximity Search | |
| dc.subject | Database | |
| dc.title | Dayanıklı ses HASH'leme ile içerik tanılama | |
| dc.title.alternative | Robust Audio Hashing For Content Identification | |
| dc.type | Master Thesis |
Dosyalar
Orijinal seri
1 - 1 / 1
