Zaman Serilerinin Öngörüsü İçin GKA Tabanlı DVR Metodları

thumbnail.default.alt
Tarih
2014-06-20
Yazarlar
Bican, Bahadır
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Instıtute of Science and Technology
Özet
Zaman serileri, bir değişkene ait zamana bağlı gözlemlerin eşit zaman aralıklarında oluşturduğu serilerdir. Zaman serisi öngörüsü ise, geçmişe dair gözlem verileri bilinen bir olayın geleceğe dair ne olabileceği hakkında tahminde bulunmanın kavramsal modelidir. Tez kapsamında oluşturulan modellerde, Destek Vektör Regresyonu (DVR) algoritması kullanılmıştır. Zaman serisi özelliğine bağlı olarak öznitelik seçimi, çekirdek tipi ve parametre kullanımlarının tahmin başarımına etkisi incelenmiştir. DVR tahmin başarımını artırmak için Görgül Kip Ayrışımı (GKA) tabanlı DVR modelleri üzerinde çalışılmıştır. Literatürde önerilmiş GKA tabanlı DVR modellerinin çoğunun test kümesini de eğitim kümesi ile birlikte kullandığı ve GKA’nın son nokta problemini görmezden geldiği saptanmıştır. Gerçek uygulamalarda kullanılamayacak olan bu yöntem yerine GKA tabanlı DVR modeli üzerinde 2 yaklaşım önerilmiştir. Önerilen ilk modelde, GKA ile yinelemeli olarak elde edilen İçkin Mod Fonksiyonları (IMF) üzerinde birbirinden bağımsız olarak DVR ile tahminlemeler yapılmış, daha sonra bileşen tahminleri toplanarak genel tahmin elde edilmiştir. İkinci modelde ise veri kümesi GKA ile gürültüden arındırılmış ve elde edilen yeni veri kümesi asıl veri kümesi ile birlikte öznitelik olarak kullanılarak tahmin sonuçları alınmıştır. Önerilen modellerin tahminlemeleri farklı alanlardan, farklı büyüklükte ve özellikte 7 veri kümesi üzerinde Ortalama Karesel Hata (OKH), Ortalama Mutlak Hata Yüzdesi (OMHY), Yön Doğruluğu, Doğru Artan ve Doğru Azalan ölçütleri kullanılarak tekli DVR modeli tahminlemeleri ile karşılaştırılmıştır. İlk model olan yinelemeli GKA-DVR modelinin periyodiklik özelliği taşıyan veri kümeleri üzerinde yön tahminlerinde DVR’den daha başarılı sonuçlar verdiği, ikinci modelin ise bütün veri kümeleri için noktasal başarı ölçümlerinde (OKH, OMHY) DVR tahminlemesinden daha başarılı olduğu görülmüştür.
Time series are the series that belong to time dependent observations of a variable which are formed in equal time intervals. Time series prediction is the conceptual model of what might happen on the future for an event where the observation data about the past is known. In this thesis study, Support Vector Regression (SVR) algorithm is used. Depending on the properties of time series, the effect of feature selection, kernel type and parameter usage on time series prediction is analyzed. In this study, Empirical Mode Decomposition (EMD) based SVR models have been studied in order to improve the performance of the SVR predictions. EMD is a nonlinear signal processing method which divides the data into several simple components. It’s realized that the most of the previously proposed EMD based SVR algorithms use the test dataset with the training dataset and ignoring the end point problem of the EMD. Instead of this method, which can not be used for real applications, 2 approaches have been proposed. The prediction performance of proposed models are compared with single SVR model by using Mean Square Error (MSE), Mean Absolute Percentage Error (MAPE), Direction Accuracy, Correct Up and Correct Down performance citerias on 7 different datasets from different areas. In the first proposed model, the predictions with SVR on each component have obtained independently, and then they are summed to get the final prediction. It is observed that the proposed method outperforms the single SVR performance on direction measurements including Direction Accuracy, Correct Up and Correct Down trends for the datasets which have periodicity characteristics. In the second model, the noise reduction is performed with EMD, and final predictions are obtained with the noise-free data set which is used with the original dataset as a feature. In the second model, it’s seen that the proposed model has better performance than SVR on pointwise (MSE, MAPE) performance criterias for all data sets that have been used.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2014
Thesis (M.Sc.) -- İstanbul Technical University, Instıtute of Science and Technology, 2014
Anahtar kelimeler
Zaman Serileri, Tahmin, Regresyon, Görgül Kip Ayrışımı, Destek Vektör Makineleri, Time Series, Prediction, Forecasting, Regression, Empirical Mode Decomposition, Support Vector Machines
Alıntı