Yüksek Boyutlu Model Gösterilimi İle Veri Bölüntüleme Yönteminin Koşutlaştırılması

thumbnail.default.placeholder
Tarih
Yazarlar
Kanal, M. Engin
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Bilişim Enstitüsü
Institute of Informatics
Özet
Yalnızca uzaydaki belli noktalardaki degerleri verilmiş çok de ğişkenli bir f(x1,x2,··· ,xN) işlevine alışılagelmiş yöntemlerle içdegerbiçim işlemi yapılması boyut sayısı arttıgında birer başbelası durumuna gelir. Bu tür işlevler için do ğrudan bilgisayar programcılıgı ile çözüm aramak yerine ilk olarak bu işlevleri bilgisayar programlaması açısından daha kolay ele alınacak, matematiksel olarak, etkili bir yapıya getirmek gerekir. Bu amaçla bu işleve yaklaştırım yapan bir böl–ve–yönet algoritması geliştirilmiştir. Bu yaklaştırım sayesinde çok degişkenli ˘ f işlevi çok daha düşük boyutlu terimlerle ifade edilebilmektedir. Bu yaklaştırıma Yüksek Boyutlu Model Gösterilimi (YBMG) adı verilmektedir. Bu yöntem çeşitli çalışmalarla başarılı bir şekilde uygulanmıştır. Fakat bu yöntem bu haliyle büyük veri hacmine sahip problemler üzerinde uygulanamaz. Problemdeki boyut sayısı ve boyutlardaki dügüm noktaları sayıları arttıgında veri hacmi öyle büyür ki alışılagelmiş PC’ler verinin gereksinim duydugu yüksek RAM sığasını karşılayamaz. Diğer bir önemli problem de YBMG terimlerini hesaplamakta kullanılan eşitliklerin yapılarıdır. Eşitlikler için yazılmış algoritmadaki döngü sayıları problemdeki boyut sayısına bagımlıdır. Bu çalışmada ilk olarak YBMG terimlerini hesaplamakta kullanılan eşitlikler iyileştirilmiştir. Bu iyileştirme sonucunda eşitliklerin problemdeki boyut sayısına bagımlılı ğı ortadan kaldırılmıştır. İyileştirilmiş eşitlikler sayesinde yöntem koşutlaştırmaya uygun bir hale getirilmiştir. Son olarak da yöntemin koşutlaştırmasının başarımı çözümlenmiştir.
If the values of a multivariate function f(x1,x2,··· ,xN) are given at only a finite number of points in the space of its arguments and an interpolation which employs continuous functions is considered standard multivariate routines may become cumbersome as the dimensionality grows. This urges us to develop a divide–and–conquer algorithm which approximates the function. The given multivariate data is partitioned into low-variate data. This approach is called High Dimensional Model Representation (HDMR). However the method in its current form is not applicable to problems having huge volumes of data. With the increasing dimension number and the number of the corresponding nodes, the volume of data in question reaches such a high level that it is beyond the capacity of any individual PC because huge volume of data requires much higher RAM capacity. Another aspect is that the structure of equalities used in the calculation of HDMR terms varies according to the dimension number of the problem. The number of loops in the algorithm increases with the increasing dimension number. In this work, as a first step, the equations used are modified in such a way that their structure does not depend on the dimension number. With the newly obtained equalities, the method becomes appropriate for parallelization. Due to the parallelization, the RAM problem arising from problems with high volume of data is solved. Finally, the performance of the parallelized method is analyzed.
Açıklama
Tez (Doktora) -- İstanbul Teknik Üniversitesi, Bilişim Enstitüsü,
Thesis (PhD) -- İstanbul Technical University, Institute of Informatics,
Anahtar kelimeler
Differential equations, Differential equations, Differential equations, Diferansiyel denklemler, Partial differential operators, Kısmi diferansiyel operatörler, Approximation theory, Yaklaşım kuramı, Numerical analysis, Sayısal analiz, Mathematical models, Matematiksel modeller
Alıntı