Çok Değişkenli Ve Bulanık Yaklaşımlarla Trafik Akım Koşullarının Dinamik Sınıflandırılması

thumbnail.default.placeholder
Tarih
2015-10-23
Yazarlar
Silgu, Mehmet Ali
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Bu tez kapsamında; makroskopik  bir trafik akım modeliyle oluşturulmuş akım koşulu farklılaşmalarını belirlemek amacıyla çok değişkenli ve bulanık kümeleme yöntemlerinin başarımları araştırılmıştır. Veri toplama teknolojisindeki büyük gelişmelere rağmen ortaya çıkan gürültüyü gidermek ve geniş saçılımı kabul edilebilir düzeye getirmek amacıyla, ham trafik değişkenleri modelleme öncesi filtrelenmiştir. Trafik akımı, iki fazlı bir temel eğriyi baz alarak hesap yapan hücre geçişi modeliyle benzetilmiştir. Seçilen otoyol kesimindeki akım dinamikleri, varolan akım koşullarını belirlemek amacıyla irdelenmiştir. Temel eğri üzerinde akım koşullarının sınıflanması, kesim yoğunluk değişkeni gözetilerek kümeleme yöntemleriyle aranmıştır. Karar vericilerin kişisel görüşlerini yansıtan yoğunluk değerlerinin hizmet düzeyi belirlenmesinde ne derece doğru olduğu da tartışmalı bir konudur. Kümeleme analizi ,çok değişkenli istatistiksel analiz yöntemlerinden sınıflandırma işlemine çok benzemekle beraber, sınıflandırma işleminde sınıflar önceden belli iken kümeleme analizinde sınıflar önceden belli değildir. Verilerin hangi kümelere, hatta kaç değişik kümeye ayrılacağı eldeki verilerin birbirlerine olan benzerliğine göre belirlenir. Kümeleme analizi antropolojiden telekominikasyona kadar geniş bir yelpazede kullanım sağlar. Veri setini oluşturan her bir veri kümelere ayrılırken, uzaklık ve benzerlik kavramlarından yararlanılır. Bu, veri setindeki her bir verinin diğer bir veri ile olan benzerliği ya da her bir verinin veri setindeki diğer verilerden uzaklığı olduğu gibi oluşturulan gerçek ve aday kümeler arasındaki mesafe ve benzerliği de içerir.  Akım koşullarının karşılaştırılmasında her bir hizmet düzeyi seviyesinin bir kümeyi temsil ettiği kabul edilmiştir. Buradan yola çıkarak hizmet düzeyi seviyesini belirleyen sınır değerleri aynı zamanda küme sınırlarını belirleyen sınır değerler olarak kabul edilmiştir. Çok değişkenli istatistiksel analiz yöntemlerinden biri olan kümeleme analizinde hiyerarşik olmayan küme yaklaşımı ele alınmıştır. Hiyerarşik olmayan kümeleme  yöntemlerinde veri setini oluşturan veriler, önceden belirlenen küme sayısına göre ayrılır. Burada en önemli nokta, veri setini oluşturan veri sayısının belirlenen küme sayısından büyük olmasıdır. Hiyerarşik yöntemlerden en büyük farkı, küme sayısının önceden bilinmesidir.  Bununla birlikte, kümeler arası en büyük ve en küçük mesafe ile benzerlik ölçütleri önceden tanımlanmalıdır.  Hiyerarşik olmayan kümeleme yöntemleri, hiyerarşik olanlara göre daha hızlı çalışırlar. Çünkü hiyerarşik olmayan yöntemlerde benzerlik/ mesafe matrisi kullanımına gerek yoktur.Bundan dolayı da büyük veri setlerine hiyerarşik yöntemlere kıyasla daha uygundurlar. Çalışma kapsamında hiyerarşik olmayan kümeleme yönteminin, hiyerarşik kümeleme metoduna kıyasla tercih edilmesinin temel sebebi veri setinin büyüklüğü ve hesap süresinden tasarruftur. Hiyerarşik olmayan kümeleme yöntemlerinden biri olan ve tez kapsamında kullanılan K- ortalama yöntemi sürekli olarak kümelerin yenilendiği ve en uygun çözüme ulaşana kadar devam eden döngüsel bir yöntemdir. Çok değişkenli kümeleme analizinde, kümelerin merkezlerinin belirlenmesi için Manhattan Uzaklığı ve Öklidyen Kare uzaklığı kullanılmıştır. Aynı şekilde küme merkezi belirlenmesinde kullanılan Chebshyev uzaklığı literatürde benzer çalışma olmadığından tercih edilmemiştir. Bulanık c- ortalamalar yönteminde ise girdi ve çıktının nümerik olduğu varsayılmıştır. Bulanık c- ortalamalar yönteminde çok değişkenli istatistiksel analiz yöntemlerinin aksine küme merkezinin şekli konusunda kabul yapmak gerekmektedir.  Tez kapsamında tüm küme merkezlerinin yuvarlak olduğu kabulu yapılmıştır. Bulanık c- ortalamalar yönteminde ihtiyacı hasıl olan bulanıklaştırma parametresi, kümeleme işlemine son verme parametresi ve model belirleme matrisi gibi parametrelerde seçici davranılırak, diğer yöntemlere benzetimi sağlanmıştır. Küme merkezi kavramında, merkez kümenin ortasını temsil etmesine rağmen, aslında kümenin gerçekten tam ortasında böyle bir elemanın bulunmasına gerek yoktur. Elde edilen küme merkezlerinden yola çıkılarak herbir verinin hangi kümeye ait olduğu belirlenmiş ve hız-akım diyagramı oluşturulmuştur. Bahsi geçen hız-akım diyagramında değişikliği görmek amacıyla veri setine her 4 saatte bir yeni veri akışı sağlanmış ve “Yolların Kapasitesi El Kitabı”na, K- ortalama yöntemi Öklidyen Uzaklık yaklaşımı, K- ortalama yöntemi Manhattan yaklaşımı ve bulanık c- ortalama yaklaşımı kullanılarak kümeleme işlemi yapılmıştır. Kümeleme işlemleri sonucu elde edilen küme merkezlerinden yola çıkılarak küme sınırları belirlenmiştir. Küme sınırlarının belirlenmesinde veri setindeki en büyük yoğunluk değeri F hizmet düzeyinin son sınırı olarak kabul edilmiştir. A hizmet düzeyinin belirlenmesinde ise A hizmet düzeyini temsil eden küme merkezi iki ile çarpılmış ve elde edilen değer ile sıfır arasında kalan her veri A hizmet düzeyinde kabul edilmiştir. A ve F arasında kalan tüm diğer hizmet düzeylerinin sınırlarının belirlenmesi görselleştirilerek tez kapsamında sunulmuştur. Kümeleme işlemleri sonucunda özellikle E ve F hizmet düzeylerini temsil eden bölgelerde artma ve azalma gözlemlenmiştir. Küme merkezlerinin başarısının sınanması için iki farklı durum oluşturulmuştur. Bunlardan ilki, küme merkezlerinin “Yolların Kapasitesi El Kitabında” sınırlandırılmış hizmet düzeyi sınırları kullanılarak hesaplanan statik yöntemdir. Statik yöntemde, her bir hizmet düzeyi bir küme olarak kabul edilmiş ve küme sınırları önceden bilindiği için, küme sınırını oluşturan değerler arası farkın ortalaması bulunmuştur. İkincisi ve dinamik olduğu düşünülen yöntemde ise “Yolların Kapasitesi El Kitabında”ki sınırlar arasında kalan verilerin aritmetik ortalaması hesaplanmaktadır.  Veri seti büyüdükçe her seferinde tekrar hesap yapılarak küme merkezlerinin değerleri tekrar tekrar  bulunmuştur. Toplamda sistem 10 defa yüklenmiş ve küme merkezlerinin değişimlerini gösteren grafikler elde edlmiştir. Çok değişkenli ve bulanık kümeleme sistemlerinin, oluşturulan iki durum karşısında nasıl davrandığını görmek amacıyla hata değerleri hesaplanmıştır. Hem çok değişkenli hem de bulanık kümeleme yaklaşımları, örnek otoyol kesimi üzerindeki ani koşul değişimlerini tespit etmeye yarayan başarılı sınıflama sonuçları vermiştir.  Çok değişkenli ve bulanık kümeleme yöntemlerince izlenen prosedür, sistematik olarak dinamiktir ve temel eğri üzerinde statik bölütleme yöntemiyle elde edilen kümelere oldukça yaklaşık kümeler oluşturabilmektedir. K-ortalamalar ve bulanık c- ortalamalar yöntemiyle elde edilen sonuçlar üzerinden hesaplanmış belirlenim katsayıları, elde edilen sonuçları istatistik yönden karşılaştırmalı olarak değerlendirmek amacıyla kullanılmıştır. Çalışma kapsamında elde edilen bütün hata terimlerinde K- ortalama yöntemi Öklidyen yaklaşımı ile bulanık c- ortalamalar yönteminin birbirine yakın sonuçlar vermesinin sebebi olarak her iki yönteminde Öklidyen mesafeyi kullanarak çözüm yapması düşünülmektedir. Özellikle bulanık c-ortalamalar yönteminde bulanıklaştırıcı parametrenin uzaklık ölçütünü Öklidyen olarak ele alması için gerekli değer ortaya konmuştur. K- ortalama yöntemi Manhattan yaklaşımının bahsi geçen diğer kümeleme yaklaşımlarından özellikle ilk iki yükleme için farklılık göstermesinin temel sebebi olarak uzaklık ölçütü hesabında farklı davranması olduğu düşünülmektedir. Diğer yüklemelerde ise K- ortalama yöntemi Öklidyen yaklaşımına ve bulanık c- ortalama yöntemine benzer sonuçlar vermesinin veri seti büyüklüğüyle ilişkili olduğu düşünülmektedir. İlerleyen çalışmalarda, veri toplanmasından kümeleme işleminin sonuna kadar olan bütün işlemlerin dinamik olarak yapılabileceği öngörüsünde bulunulmaktadır. Ardışık trafik ölçüm sensörlerinden elde edilen ölçümlerin dinamik olarak filtrelenmesi, trafik akımının yine dinamik olarak, iki fazlı bir temel eğriyi baz alan ve buna göre hesap yapan hücre geçişi modeliyle benzetilmesi ve son olarak kümelenmesi işlemi düşünülmektedir. Kümeleme işleminde küme sayısının dinamik olarak belirlenmesi ve “Yolların Kapasitesi El Kitabı”na göre kıyaslanması ilerleyen çalışmaların temelini oluşturmaktadır.  Küme sınırlarının belirlenmesinde farklı algoritmaların geliştirilerek geçerliliğinin belirlenmesi, kümeleme analizindeki en temel ölçüt olarak uzaklık parametrelerinin farklılaştırılması da gelecek çalışmalarda irdelenebilir.Bulanık kümeleme yönteminde girdinin sözel, çıktının ise nümerik olduğu yöntemlerin de incelenebileceği düşünülmektedir. Var olan hizmet düzeylerinin belirlenmesinde ( A ve D hizmet düzeyleri dahil olmak üzere, A’dan D’ye ) kişisel tecrübelere dayanıldığı göz önünde bulundurulursa, girdinin sözel olduğu bir durumun daha iyi sonuçlar verme ihtimali göz ardı edilmemelidir. Bütün bahsi geçen yöntemler dışında yapay sinir ağları ve genetik algoritmalar ile oluşturulacak dinamik bir sistemin performansının diğer yöntemlere kıyaslanması da gelecek çalışmaların konusu olabilir. Tez kapsamında kümeleme işleminde kullanılan MATLAB programının bu dinamik öngörüye uygun olup olmadığı da ilerleyen çalışmalarda cevabını bekleyen bir soru olarak karşımızda durmaktadır.  Sonuç olarak, yapılan çalışmanın tekrarsız kaza olaylarında ve kırılmalar sonucu oluşan akımdaki anlık değişimlerin bulunmasında ne derece etkili olduğunu zaman gösterecektir. Yükleme süresinin azaltılarak sistemin tekrar tekrar yüklenmesinin ve elde edilen küme merkezlerinin “Yolların Kapasitesi El Kitabı” değerlerine yakınlığı, benzerliğinin bulunması ve yorumlanması da oldukça önem arz etmektedir.
In this thesis, performances of multivariate and fuzzy clustering methods in specifying flow state variations reconstructed by a macroscopic flow model are sought. In order to remove the noise in and the wide scatter of traffic data, raw flow measures are filtered prior to modeling process. Traffic flow is simulated by the cell transmission model adopting a two phase fundamental diagram. Flow dynamics specific to the selected freeway test stretch are used to determine prevailing traffic conditions. The classification of flow states over the fundamental diagram are sought utilizing the methods of multivariate and fuzzy cluster analyses by considering the stretch density. The fundamental diagram of speed-density is plotted to specify the current corresponding flow state. Both multivariate and fuzzy clustering analyses returned promising results on state classification which in turn helps to capture sudden changes on test stretch flow states.  The perfomance analyses are focused explicitly on the application of clustering for partitioning states of traffic flow, using three clustering algorithms: K-means clustering by Square Euclidean Distance, K-means clustering by City Block Distance and fuzzy C-means. Clustering algorithms have the flexibility to specify the number of clusters. Categorization has been based on similarities and dissimilarities of traffic flow variables without specifying arbitrary values to bound states. Clustering methods are processed in a time-varying fashion to partition the fundamental diagrams at selected temporal resolutions. In order to comparatively evaluate the clustering performances of multivariate and fuzzy methods on lane-based densities relative to deterministic clustering, a number of statistical criteria, including the root mean squared error, the mean square error , the mean absolute error , the mean absolute percentage error and the coefficient of determination. The performances of K- means clustering and fuzzy c- means clustering, using both the Square Euclidean and City Block Distance measures, are evaluated in two cases, with two assumptions.The procedures followed by multivariate and fuzzy clustering methods are systematically dynamic that enables the partitions over the fundamental diagram match approximately with the flow states derived by the static partitioning method. It is shown that the comprasions presented that the K-means clustering by Square Euclidean Distance and fuzzy c-means methods perform better and appear to yield to classifications consistent with two types of level of service, which are calculated by using HCM-defined level of service.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2015
Thesis (M.Sc.) -- İstanbul Technical University, Instıtute of Science and Technology, 2015
Anahtar kelimeler
Ulaştırma, Trafik, Kümeleme, Bulanık C- Ortalama, K- Ortalama, Transportation, Traffic, Clustering, Fuzzy C- Means, K- Means
Alıntı