Yüksek Boyutlu Model Gösterilimi İle Veri Bölüntüleme Yönteminin Koşutlaştırılması
Yüksek Boyutlu Model Gösterilimi İle Veri Bölüntüleme Yönteminin Koşutlaştırılması
Dosyalar
Tarih
Yazarlar
Kanal, M. Engin
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Bilişim Enstitüsü
Institute of Informatics
Institute of Informatics
Özet
Yalnızca uzaydaki belli noktalardaki degerleri verilmiş çok de ğişkenli bir
f(x1,x2,··· ,xN) işlevine alışılagelmiş yöntemlerle içdegerbiçim işlemi yapılması
boyut sayısı arttıgında birer başbelası durumuna gelir. Bu tür işlevler için do ğrudan
bilgisayar programcılıgı ile çözüm aramak yerine ilk olarak bu işlevleri bilgisayar
programlaması açısından daha kolay ele alınacak, matematiksel olarak, etkili bir yapıya
getirmek gerekir. Bu amaçla bu işleve yaklaştırım yapan bir böl–ve–yönet algoritması
geliştirilmiştir. Bu yaklaştırım sayesinde çok degişkenli ˘ f işlevi çok daha düşük
boyutlu terimlerle ifade edilebilmektedir. Bu yaklaştırıma Yüksek Boyutlu Model
Gösterilimi (YBMG) adı verilmektedir. Bu yöntem çeşitli çalışmalarla başarılı bir
şekilde uygulanmıştır. Fakat bu yöntem bu haliyle büyük veri hacmine sahip problemler
üzerinde uygulanamaz. Problemdeki boyut sayısı ve boyutlardaki dügüm noktaları
sayıları arttıgında veri hacmi öyle büyür ki alışılagelmiş PC’ler verinin gereksinim
duydugu yüksek RAM sığasını karşılayamaz. Diğer bir önemli problem de YBMG
terimlerini hesaplamakta kullanılan eşitliklerin yapılarıdır. Eşitlikler için yazılmış
algoritmadaki döngü sayıları problemdeki boyut sayısına bagımlıdır. Bu çalışmada
ilk olarak YBMG terimlerini hesaplamakta kullanılan eşitlikler iyileştirilmiştir. Bu
iyileştirme sonucunda eşitliklerin problemdeki boyut sayısına bagımlılı ğı ortadan
kaldırılmıştır. İyileştirilmiş eşitlikler sayesinde yöntem koşutlaştırmaya uygun bir hale
getirilmiştir. Son olarak da yöntemin koşutlaştırmasının başarımı çözümlenmiştir.
If the values of a multivariate function f(x1,x2,··· ,xN) are given at only a finite number of points in the space of its arguments and an interpolation which employs continuous functions is considered standard multivariate routines may become cumbersome as the dimensionality grows. This urges us to develop a divide–and–conquer algorithm which approximates the function. The given multivariate data is partitioned into low-variate data. This approach is called High Dimensional Model Representation (HDMR). However the method in its current form is not applicable to problems having huge volumes of data. With the increasing dimension number and the number of the corresponding nodes, the volume of data in question reaches such a high level that it is beyond the capacity of any individual PC because huge volume of data requires much higher RAM capacity. Another aspect is that the structure of equalities used in the calculation of HDMR terms varies according to the dimension number of the problem. The number of loops in the algorithm increases with the increasing dimension number. In this work, as a first step, the equations used are modified in such a way that their structure does not depend on the dimension number. With the newly obtained equalities, the method becomes appropriate for parallelization. Due to the parallelization, the RAM problem arising from problems with high volume of data is solved. Finally, the performance of the parallelized method is analyzed.
If the values of a multivariate function f(x1,x2,··· ,xN) are given at only a finite number of points in the space of its arguments and an interpolation which employs continuous functions is considered standard multivariate routines may become cumbersome as the dimensionality grows. This urges us to develop a divide–and–conquer algorithm which approximates the function. The given multivariate data is partitioned into low-variate data. This approach is called High Dimensional Model Representation (HDMR). However the method in its current form is not applicable to problems having huge volumes of data. With the increasing dimension number and the number of the corresponding nodes, the volume of data in question reaches such a high level that it is beyond the capacity of any individual PC because huge volume of data requires much higher RAM capacity. Another aspect is that the structure of equalities used in the calculation of HDMR terms varies according to the dimension number of the problem. The number of loops in the algorithm increases with the increasing dimension number. In this work, as a first step, the equations used are modified in such a way that their structure does not depend on the dimension number. With the newly obtained equalities, the method becomes appropriate for parallelization. Due to the parallelization, the RAM problem arising from problems with high volume of data is solved. Finally, the performance of the parallelized method is analyzed.
Açıklama
Tez (Doktora) -- İstanbul Teknik Üniversitesi, Bilişim Enstitüsü,
Thesis (PhD) -- İstanbul Technical University, Institute of Informatics,
Thesis (PhD) -- İstanbul Technical University, Institute of Informatics,
Anahtar kelimeler
Differential equations,
Differential equations,
Differential equations,
Diferansiyel denklemler,
Partial differential operators,
Kısmi diferansiyel operatörler,
Approximation theory,
Yaklaşım kuramı,
Numerical analysis,
Sayısal analiz,
Mathematical models,
Matematiksel modeller