Kırkayak modeline dayalı görüntü sıkıştırma

thumbnail.default.alt
Tarih
1997
Yazarlar
Kurt, Binnur
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Institute of Science and Technology
Özet
Görüntü boyutlarının gün geçtikçe artması onların sıkıştırılmasını daha çok gerekli kılmaktadır. Görüntü sıkıştırmada amaçlanan, bir görüntünün aynı düzeyde kalite ve anlaşılabirlik seviyesine sahip ancak daha az yer kaplayan bir yaklaşığını elde etmeye çalışmaktır. Bazı uygulamalarda (örneğin, tıbbi uygulamalar) sıkıştırılmış görüntü ile gerçek görüntünün birbirinin aynı olması istenir. Bu durumda sıkıştırma yönteminin kayıpsız sıkıştırma yöntemi olması gerekir. Bazı uygulamalarda ise sıkıştırılmış görüntüde belirli oranlarda bozulmalara izin verilebilir. Bu tür sıkıştırma yöntemleri ise kayıplı sıkıştırma yöntemi adını alır. Bu çalışmada, yeni bir ayrıt-tabanlı görüntü sıkıştırma yöntemi sunulmaktadır. Geliştirilen yöntem, bir kırkayak modeli yardımıyla ayrıtların yerlerini, kontrast bilgisini ve ayrıt ölçeği gibi bilgileri etkin bir biçimde kullanmakta ve bu gelişmiş model yardımıyla daha önceki ayrıt temelli yaklaşımlara kıyasla, özgün görüntüye daha yakın görüntü kurabilme olanağı sağlamaktadır. Bu yaklaşımda, önce görüntü ayrıtları, Canny ayrıt saptayıcıya kıyasla daha genel bir ayrıt saptayıcı olan ve değişik özelliklerde amaca uygun ayrıt üretebilen Genelleştirilmiş Ayrıt Saptayıcı (GAS) ile elde edilmiş ve daha sonra kırkayak modelini bu ayrıt parçaları üzerine yerleştirerek, görüntüdeki hızlı değişim bölgeleri kontrastları ve ölçekleri de göz önüne alınarak modellenmiştir. Bu model sayesinde, yalnız ayrıt yerleri ve yükseklikleri kullanıldığında ortaya çıkan bozulmaların yok edildiği gösterilmiştir. Çalışmada, GAS ile elde edilen ayrıtlar, uzunluk, çevrit boyunca ortalama benek değeri, ortalama kontrast ve ortalama eğrilik gibi özellikler göz önüne alınarak sıralanmış ve bunlardan belirli bir yüzdesinin seçilerek sıkıştırma oranının kontrol edilmesi sağlanmıştır. Ayrıt çevritleri üzerindeki benek değerleri, kontrast ve genişliklere sabit blok boyu ve değişken dereceli polinomlar uydurularak polinom katsayıları saklanmıştır. Bir görüntüde, nesne sınırlarına karşılık gelen ve görüntüdeki bölütleri birbirinden ayıran ayrıtlar, o görüntüyü tanımlayan en önemli özelliklerden biridir. Bu ayrıtların hem sayıca az olmaları hem de görüntünün içeriği hakkında önemli bilgileri sağlamaları ayrıt temelli sıkıştırma algoritmalarının hareket noktasını oluşturmaktadır. Görüntüdeki seyrek ayrıt noktalarında benek değerleri hızlı değişmesine karşın, ayrıt dışı noktalarında değişim yavaş olmakta ve böylece ayrıt bilgilerinden görüntünün tümünü oluşturabilmek olası olmaktadır. İkinci kuşak sıkıştırma yöntemlerinin temel ix özelliklerinden biri olan ayrıt temelli kodlamanın yararlarından biri, yüksek sıkıştırma oranlarında dahi görüntüye ilişkin önemli Özelliklerin kaybolmaması, görüntünün hızla bulanıklaşmamasıdır. Ne var ki, bu yaklaşımda yalnızca ayrıtların konumu (ayrıt haritası) ve ayrıt boyunca kontrast bilgisi kullanıldığında, kurulan görüntülerde yapaylıklar oluşmaktadır. Bu çalışmada bu bilgilere ek olarak, ayrıtların ölçeklerinin de kullanılmasına olanak sağlayan bir model geliştirilmiş ve daha başarılı sonuçların elde edildiği gösterilmiştir. Geliştirilen yaklaşımda, önce ayrıtlar GAS ile elde edilmekte ve ayrıt parçaları, uzunlukları, ortalama benek değerleri, ortalama kontrast ve eğrilik değerleri göz önüne alınarak önem sırasına göre sıralanırlar. Daha sonra seçilen ayrıt parçaları çevresindeki değişimler, kırkayak modeli yardımıyla modellenmektedir. Bu modele ilişkin bilgilerin kodlanması farksal zincir kodu, Huffman kodlama ve polinomla eğri uydurma yöntemleri kullanılarak gerçekleştirilmiştir. Daha sonra modelden görüntülerin kurulması karma enerji fonksiyoneli yardımıyla gerçekleştirilmiştir. Algoritmanın ilk aşamasında ayrıtlar GAS ile elde edilir. GAS, görüntüyü ölçek ve süreklilik özelliklerine bağlı olarak A,T-uzayında ifade etmeye olanak sağlayarak değişik amaçlar için istenen özellikte ayrıtlar üretir. Burada X ölçek eksenini ve t ise süreklilik eksenine karşı düşmektedir. Elde edilen ayrıtlardan, izleme algoritması ile bağlı çevrit bölütleri elde edilir. İzleme algoritması sonlanma noktalarından itibaren aynı yönde izlemeye devam etmeye zorlanır. Çevritlerin izlenmesi ile elde edilen farksal zincir kodu, Huffman yöntemi ile kodlandığından bu şekil bir izleme, ayrıtların etkin bir şekilde kodlanmasını sağlar. Bu yaklaşımda ayrıtlar ortalama 1.8 bit ile kodlanmaktadır. Segmanların başlangıç noktaları ise sözdisimsel biçimde sıralanan başlangıç noktaları.aralarındaki fark şeklinde kodlanmaktadır. Başlangıç noktaları yaklaşık homogen bir biçimde dağıldıklarından bu şekil bir kodlama (x,y) koordinaları şeklindeki kodlamaya göre sıkıştırma kazancını arttırmaktadır. Şekil l'de bir ayrıt kesiti verilmiştir. Ayrıtın genişliği (Wr,Wl), ayrıtın o noktadaki normali doğrultusundaki kesiti için benek değerlerindeki değişimin küçük olmaya başladığı noktalara olan uzaklık olarak tanımlanmaktadır. Kontrast değeri (Cr,Cl) ise ayrıt üzerindeki benek değeri (İl) ile ayrıtın genişliğinin belirlendiği noktadaki benek değeri arasındaki farktır. Kırkayak modeli ile her ayrıt noktası için (İl,Wr,Wl, Cr, Cl) bilgileri belirlenir ve kodlanır. Her ayrıt noktasında model parametrelerinin, (Wr,Wl, Cr, Cl), saklanması yerine bir blok pencere içindeki değerlerine değişken derecede polinomlar uydurulmuştur. Bu polinomların katsayıları eşiklendirilerek kodlanır. Uzunluk, çevrit boyunca benek değerlerinin standart sapması, ortalama kontrast, ortalama eğrilik gibi özelliklerine göre sıralamaya sokulan ayrıtların eşiklenmesi ile önemli nitelikler korunarak sıkıştırma oranı arttırılabilir. Bu özelliklere verilen ağırlıklara göre sıralanan ayrıtların %50-85'inin kullanılması durumunda dahi yüksek kalitede görüntüler ve 10:l-80:l'lik sıkıştırma oranları elde edilmiştir. (b) Şekil- 1 (a) Ayrıt Kesiti, (b) Ev görüntüsü üzerine bindirilmiş model. XI Seyrek ayrıt modeli parametrelerinden gerçek görüntünün bir yaklaşığı karma enerji fonksiyonelinin en aza indirgenmesi ile elde edilmiştir. Karma enerji fonksiyoneli üç bileşenden oluşmaktadır : E=D+Z+L d=SIpv^- (l-;.)2 +
Image coding is a process which produces an image identical to the original one in the sense of quality and intelligibility, but occupies less space. The goal of this dissertation is to produce an algorithm, which we call image compression based on "centipede" model, for lossy-coding of an image in the way that edges, contrast and scale through edges are utilized to produce a powerful and sparse representation of the image. Edges detected by using generalized edge detector (GED) constitute very sparse information. It has been shown that edge brightness and contrast calculated through edge segments are not adequate to produce a reliable and precise representation. The proposed algorithm produces a contour code which consists of position, brightness, contrast and an estimate of the scale in the form of width for each edge element in the image. The segments obtained by tracing connected edge elements are sorted with respect to weighted sum of their length, mean contrast, deviation and curvature. The edges are then thresholded to eliminate some of which has less priority in this order. Coding of all these parameters is a bit-consuming operation. Since they change smoothly in a small neighborhood, they can be approximated by polynomials, then the coefficients of the polynomials are coded. Edge locations are coded by constructing differential chain code followed by Huffman coding and starting points are coded in the form of difference between lexicographically ordered points. A reliable approximation to the original image from the sparse information is obtained via solving the hybrid energy functional which spans Ar-space, where X represents the smoothness of the image and x represents the continuity of the image. The proposed model and the algorithm has been tested on both real and synthetic images. Compression ratio is up to 180:1 for synthetic images and 10:1- 100:1 for real images. Reconstructed images are evaluated both quantitatively with NMSE (normalized mean square error), SNR (signal-to-noise ratio) and PSNR (peak- to-peak SNR) and qualitatively with visual appearance of artifacts. We have experimentally shown that the proposed model preserves perceptually important features even at the high compression ratios. V1U
Açıklama
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Social Sciences, 1997
Anahtar kelimeler
Görüntü sıkıştırma, Kırkayak modeli, Image compression, Centipede model
Alıntı