Yeni Zelanda GPS zaman serileri verisinin bayesci istatistik ile incelenmesi
Yeni Zelanda GPS zaman serileri verisinin bayesci istatistik ile incelenmesi
Dosyalar
Tarih
2023
Yazarlar
Özcan, Kubilay
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Lisansüstü Eğitim Enstitüsü
Özet
İstatistik dünyasında yıllar boyunca birçok veri işleme, stokastik süreçleri anlama yöntemleri gelişmiştir. Büyük veriler üzerinde kullanılması zor olan bu yöntemlere teknolojinin gelişimi sayesinde getirilen yaklaşımsal ek yöntemler, bu yöntemlerin büyük veriler üzerinde de kullanılmasına olanak sağlamıştır. Bu çalışmada Yeni Zelanda'dan alınan GPS (Küresel Konumlama Sistemi) zaman serisi veri seti bilgisayar tabanlı Bayesci istatistik yöntemleri ile incelenmiştir. Çalışma için Yeni Zelanda'nın Jeolojik ve Nükleer Bilimler Enstitüsü'nden (GNS Sciences) alınan, 2011-2021 yılları arasındaki, günlük mikrometre (mikron; 10-6 m) mertebesinde ölçüm yapılan 146 GPS istasyonlu GPS yer hareketleri veri seti kullanılmıştır. Bu veri seti üzerinde eksik veri noktaları Beklenti Maksimizasyonu algoritması ile doldurulmuştur. Zaman serilerinde mevcut olan trend bileşeni yüksek korelasyona neden olarak analizi zorlaştırdığı için zaman serileri de-trend edilmiştir. Çalışmada doğrusal regresyon yapılmak istenmiştir. Ancak veri setinin büyük olması nedeniyle olası 280 tane regresyon modeli olduğundan problem klasik regresyon analizi ile çözülememektedir. En makul regresyon modelinin teşhisi için Stokastik Arama ile Değişken Seçimi yapılmış bunun için Markov Zincirleri tabanlı bilgisayar Gibbs örneklemesi algoritması kullanılmıştır. Markov zinciri 30000 zincirden oluşacak şekilde tasarlanmıştır. Markov zincirinde potansiyel makul tahmin ettirici değişkenlerin regresyon modelindeki katsayıların, Bayesci istatistiğin de bir kavramı olan, önsel dağılım için "Spike-and-Slab Prior" olarak bilinen bir dağılım modeli önerilmiştir. Oluşturulan Markov zincirinin bütün sonsal dağılımları, bu önsel dağılımla çözümlenmektedir. R programlama dilinde yazılmış "BoomSpikeSlab" paketi bütün sonsal dağılımların girilmiş olduğu bir paket olup çalışmada bu paketten yararlanılmıştır. Çalışmada nihai hedefi Yeni Zelanda'nın tektonik birlikleri hakkında, GPS zaman serileri kullanılarak, yorumlar yapılmasıdır. Bu amaçla kümeleme analizi yapılmak istenmiştir. Bu çalışmada kümeleme analizi için özgün bir metot önerilmektedir. Bu metot, her bir tahmin ettirici değişkenin, yanıt değişkeninin Markov zincirindeki muhtemel 30000 regresyon modeline dahil olma oranlarını k-Ortalama kümeleme algoritmasında kullanılmasıdır. Burada k küme sayısını belirtmekte olup küme sayısını belirlemek için Dirsek Metodu (Elbow Method for k-Means Clustering) olarak bilinen bir metot kullanılmış, ideal küme sayısının 3 olduğu düşünülmüştür. Kümeleme analizi sonucu, bu çalışmada uygulanan tekniklerin, Yeni Zelanda'nın tektonik birlikleri ve yavaş depremler fenomeni ile ilgili anlamlı yorumlar yapılabileceği görülmüştür.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü, 2023
Anahtar kelimeler
Bayesci istatistik yöntemleri,
Yeni Zelanda,
GPS,
Küresel Konumlama Sistemi