Gelişmiş Hareket Kestirimi Kullanarak Vıdeo Sıkıştırma İyileştirmesi

thumbnail.default.alt
Tarih
2012-06-28
Yazarlar
Bozoğlu, Kevser
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Tezin amacı, Scale Invariant Feature Transform (SIFT) algoritmasından yararlanarak Block Matching Algoritması (BMA) na göre daha iyi bir kestirim yöntemi geliştirmektir.Tezde önerilen algoritma, blok eşleme algoritmasının iyi sonuç vermediği yerlerde devreye girer. Eğer video içinde rotasyon hareketi yapan bir obje varsa blok eşleme algoritması iyi sonuç vermezken, tezde önerilen algoritma rotasyondan etkilenen blokları belirleyerek bu bloklara ters rotasyon uygulayıp tahmin edilen resme bu şekilde yerleştirmeyi hedefler. Sonuç olarak önerilen algoritma hem test resimlerinde hem de gerçek video resimler üzerinde test edilmiştir. Testler sonucunda, BMA ile karşılaştırma yapmak için elde edilen resimlerin PSNR değerleri hesaplanmıştır. Elde edilen verilere gore, önerilen algoritmanın sonuçları BMA sonuçları ile karşılaştırıldığında test frameler üzerinde ~1.4 dB’ye varan, gerçek video resimleri üzerinde ise 0.5 dB’ye varan yileştirmeler sağladığı gözlemlenmiştir. Bu iyileştirmeler, sonuçlar kısmındaki şekillerden de görsel olarak gözlemlenebilir.
In the digital age, almost all video storage and delivery systems depend heavily on compression technology. Video compression standards have been used and improved since 90s. There are many standards that use motion compensation to reduce unnecessary data and compress video. This thesis proposes an improved compression technique based on both block matching compensation and SIFT. This new technique reveals an improved motion compensation (IMC) which is achieved by using invariant features. SIFT finds local invariant features in a given image. It has been used in many implementations in the literature. Hovewer, none of them used invariant features to obtain a better motion compensation. In this thesis, SIFT is used to detect rotated regions and obtain better reconstruction with higher PSNR than classical block matching. To achieve this, invariant features are found in adjacent frames and then feature keypoints are matched. In conventional BMA, each non-overlapping 16x16-pixels block in current frame is predicted from previous frame by finding the block that gives minimum SAD value. However, if an object rotates from previous frame to the current, BMA cannot achieve an accurate prediction. In this case, the algorithm implemented in this thesis comes up with more accurate results because SIFT keypoints are utilized to detect and correct rotation between frames in the implemented algorithm. The proposed algorithm is tested on both test frames and real video frames. PSNR results are given for comparison of the proposed algorithm with classical BMA. It is seen that the proposed algorithm, which is called IMC in this thesis, caused an improvement of almost ~1.4 dB for the reconstructed test frame. This improvement is approximately 0.5 dB for real video frames. PSNR values are calculated for whole images. To see the block improvements, SAD values of blocks for compared algorithms are exhibited. These improvements may also be visually observed in the given reconstructed frame pictures.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2012
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2012
Anahtar kelimeler
video sıkıştırma, hareket kestirimi, SIFT, BMA, video compression, motion compensation, SIFT, BMA
Alıntı