Gpu Üzerinde Yüksek-mertebe Kompakt Şema Kullanılarak Hesaplamalı Akışkanlar Dinamiği Analizi

thumbnail.default.placeholder
Tarih
2014-02-21
Yazarlar
Tutkun, Bülent
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Bu çalışmada, bir altıncı-mertebe kompakt sonlu fark şeması, akışkanlar mekaniği problemlerinin sayısal çözümü için GPU ortamına uygulanmıştır. GPU üzerinde koşacak kodları oluşturmak için CUDA mimarisinden yararlanılmıştır. Ayrıca, bir onuncu-mertebe alçak geçiren filtreleme şeması da kullanılmıştır. Zaman integrasyonu için dördüncü-mertebe Runge-Kutta ve ikinci-mertebe Adams-Bashforth yöntemle-rinden yararlanılmıştır. Bu sayısal yöntemler üç adet test probleminin GPU üzerinde çözülmesi için kullanılmıştır. Çözülen test problemleri bir girdapsal bozuntunun taşınımı, zamansal karışma tabakası ve bir kare silindir etrafındaki akıştır. Bu problemler için sırasıyla, iki boyutlu taşınım denklemleri, üç boyutlu sıkıştırılabilir ve üç boyutlu sıkıştırılamaz Navier-Stokes denklemleri çözülmüştür. Sıkıştırılamaz akış probleminde kare silindir, gömülü sınır yöntemi kapsamında momentum denklemine eklenen uygun kuvvet terimleri aracılığı ile temsil edilmiştir. Bu sayede çözüm basit bir kartezyen sayısal ağ üzerinde yapılabilmiştir. Hesaplamalar için bir adet NVIDIA Tesla C1060 GPU’su kullanılmıştır. GPU üzerinde elde edilen sonuçlar performans açısından CPU (AMD Phenom 2.5 GHz) çözümleri ile karşılaştırılmıştır. Kompakt ve filtreleme şemasının ürettiği periyodik üç-bant matris sistemleri CPU kodunda LAPACK/BLAS kütüphanesi kullanarak çözülürken, GPU kodunda ise katsayı matrisinin tersi kullanılarak CUBLAS kütüphanesi yardımıyla çözülmüştür. Sıkıştırılamaz akışın çözümünde ortaya çıkan Poisson denkleminin çözümü, GPU ortamına uygulanan bir konjuge gradyan iteratif yöntemi ile sağlanmıştır. İlk iki test probleminde GPU hesaplamasının farklı sayısal ağ büyüklükleri için CPU’ya göre 9 - 16.5 kat arasında bir performans artışı sağladığı görülmüştür. Sıkıştırılamaz akış için ise karşılaştırma, performans üzerinde oldukça belirleyici olan Poisson denkleminin çözümü açısından yapılmıştır. Burada sunulan GPU çözümü başka GPU ve CPU çözümleriyle karşılaştırılmış ve sırasıyla 3 ve 24 katlık perfromans artışları görülmüştür.
In this study, a high-order compact finite difference scheme for the solution of fluid flow problems is implemented to run on a Graphical Processing Unit (GPU) using Compute Unified Device Architecture (CUDA). Besides the compact scheme, a high-order low pass filter is also employed. For time integration, the classical fourth-order Runge–Kutta method and second-order Adams-Bashforth method are used. These numerical methods are utilized for the solutions of three test problems on a GPU. Test problems are advection of a vortical disturbance, a temporal mixing layer and flow around a square cylinder. 2D advection equations, 3D compressible and 3D incompressible Navier-Stokes equations are solved for the test problems respectively. In incompressible flow case, immersed boundary method is exploited. That is, square cylinder is represented by suitable forcing terms added to the momentum equations. Thus, computations are performed on a simple Cartesian mesh. For the computations, a Tesla C1060, one of NVIDIA’s scientific computing GPUs, is utilized. Results obtained on the GPU are compared with those obtained on a single core CPU (AMD Phenom 2.5 GHz) in terms of calculation time. The CPU code exploits LAPACK/BLAS library to solve cyclic tridiagonal systems generated by the compact solution and filtering schemes, whereas the GPU code uses the inverse of the coefficient matrix to solve the same linear systems by utilizing the CUBLAS library. Solution of the Poisson equation in the incompressible flow case is performed by using a conjugate gradient iterative method implemented on the GPU. For the first two test problems, speedups between 9x–16.5x are achieved for different mesh sizes in comparison to CPU computations. In the case of incompressible flow, comparisons are made for solution of the Poisson equation which is the decisive part for performance. Present GPU performance achieves 3x and 24x speedups over other GPU and CPU results respectively.
Açıklama
Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2013
Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2013
Anahtar kelimeler
High-order kompakt şema, GPU hesaplama, Gömülü sınır yöntemi, High-order compact scheme, GPU computing, Immersed boundary method
Alıntı