Hareket kestirimi

thumbnail.default.alt
Tarih
1995
Yazarlar
Çevik, Ayla
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Özet
Hareket kestirimi, hareketli görüntü ileten sistemlerde, kodlanarak iletilecek bilgi miktannı azaltmak için kullanılan bir tekniktir. Hareketli bir resim dizisinde ardışık iki çerçevedeki hareketi bulmak ve vektörler ile ifade etmek için kullanılan temel üç hareket kestirim yöntemi vardın Piksel geriye tekrarlı (recursive) veya gradyan yöntem, blok karşılaştırma yöntemi ve faz korelasyonu yöntemi. Tezde bu yöntemlerden blok karşılaştırma ve faz korelasyonu yöntemleri incelenmiştir. Blok karşılaştırma yönteminde, resimler (b*b) boyutlu alt bloklara bölünür ve birinci çerçevedeki her alt blok, ikinci çerçevede karşı düştüğü konumu içine alan, (2*dm+b)*(2*dm+b) boyutlu tarama alanı içinde aranır. Bu aramada, karşılaştırma kriteri olarak minimum karesel hata kriteri (MSE) veya minimum mutlak hata kriteri (MAE) kullanılır. Arama şu şekilde yapılın Birinci çerçevedeki seçilen blok (referans blok) ikinci çerçevede aynı konumdaki blokla, MAE veya MSE kriterine göre karşılaştırılır ve bir tahmin hatası (PE) bulunur. Bulunan tahmin hatası seçilen alt eşikten (T1) büyükse, blok seçilen yönteme göre tarama alanı içinde aranır. Arama tüm tarama alanı içinde yapılıyorsa buna tüm blokta arama yöntemi denir, ancak bu yöntem çok işlem gerektirdiği için aramayı belirli konumlarda yapanz. işlem sayısını azaltmak için geliştirilen yöntemlerden birisi üç adımda arama yöntemidir. Bu yönteme göre, blok önce üç piksel ötedeki 8 komşu blokla karşılaştırılır ve en küçük tahmin hatasını veren bloğun konumu yeni konum olarak belirlenir. İkinci adımda, yine aynı şekilde referans blok yeni konumdaki blok ve onun 2 piksel ötesindeki 8 blokla karşılaştırılır ve yeni konum belirlenir. Üçüncü adımda aynı işlemler bir piksel ötedeki bloklar için yapılır. Sonuçta bulunan blok ile referans blok arasındaki tahmin hatası seçilen ikinci eşikten (T2) küçükse bulunan blok, referans bloğun ikinci çerçevedeki eşidir. Yeni konumla referans bloğun konumlarının yatayda ve dikeyde farklan alınarak, referans blok için hareket vektörü bulunur. Faz korelasyonu yöntemi, diğer yöntemlerden farklı olarak iki ayn adım içerir. Birinci adımda, resimler (M*M) boyutlu bloklara bölünerek her blok için, bir sonraki çerçevedeki karşı düşen blok ile, korelasyon yüzeyi bulunur ve korelasyon yüzeyindeki tepelerin merkezden uzaklığı ölçülerek hareket vektörleri bulunur. Birinci adımda yalnızca olası hareket vektörleri bulunur. İkinci adımda, bulunan hareket vektörleri blok karşılaştırma yöntemindekine benzer bir karşılaştırma ile, doğru konumlara atanır. Faz korelasyonunda genlik bilgisinin kullanılmaması, yöntemin aydınlatmadaki değişimlerden etkilenmemesini sağlar. Büyük tarama alanı kullanıldığında faz korelasyonu yalnızca belli sayıda vektörü denediğinden, blok karşılaştırmaya göre daha etkili bir yöntemdir.
Motion considerations have become more and more important, specially for low bit-rate coding. The estimation of motion from a sequence of images is important for dynamic scene analysis. Applications include robot vision and medical applications, as well as digital video, which includes video coding, image (sequence) estimation and restoration, and video standard conversions. Motion estimation is a technique for measuring how objects in a television picture move from one frame to another. The movement is expressed as a series of motion vectors which have both direction and magnitude. Motion compensation is a process which uses derived motion vectors to perform some advantageous process. There are a number of different motion estimation techniques which have been developed for use in image processing. In general, only luminance needs to be considered. Different techniques have been developed by different organisations; the most common of these are; 1) Block matching, 2) Pel-recursive or spatio temporal gradient method, 3) Phase correlation. Although various approaches to motion estimation have been developed, most of them could not meet the requirements of real applications. The main reason for this is that the existing algorithms cannot deal with the ///- posedness or ill-conditioning of the estimation problems. (In the presence of little noise, the computational results obtained by using these algorithms vary enormously). There are some advantages or disadvantages of these techniques compared to each other. The most important criteria for the motion estimator are listed below 1) Velocity range: The range of speeds of motion that the estimator can measure. 2) Precision: The accuracy with which the horizontal and vertical components of the motion can be measured. 3) Resolution: The accuracy with which the boundaries of moving areas can be defined. 4) Number of vectors: The number of distinct motion measurement that can be made within an area of a picture. 5) Error rate: The number of incorrect motion measurements made. In real scenes, motion can be a complex combination of translation and rotation. Translational estimate is easy and has been used successfully for motion compensated coding. Most of algorithms for motion estimation in interframe coding make the following assumptions : 1) Objects move in translation in a plane that is parallel to camera plane ( i.e. the effects of camera zoom, and object rotation are not considered ). 2) Illumination is spatially and temporally uniform. 3) Occlussion of one object by another, and uncovered background are neglected. Under these assumptions the monochrome intensities f(z,t) and f(z,t-r) of two consequtive frames are related as f(z,t) =f(z-D, t-r) (1) where r is the time between two frames, D is the two dimensional translational vector of the object during the time interval [ t-r, t ] and z is the two dimensional vector [x,y]' of spatial position. Thus, in real scenes a very good prediction of f(z,t) is f = f(z-D, t-r). The problem then is to estimate D from the intensities of the present and previous frame. Let J(x,y,L]) and f(x,y, to) be the previous and current frames.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 1995
Anahtar kelimeler
Görüntü, Hareket, Image, Motion
Alıntı