Destek Vektör Regresyonu İle Pıd Kontrolör Tasarımı

thumbnail.default.alt
Tarih
2012
Yazarlar
Uçak, Kemal
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
İlk olarak 1979 yılında Rus Matematikçi Vladimir VAPNIK tarafından önerilen DestekVektör Makineleri(DVM)’nin temelleri, 20. yüzyılın başlarında 1909 yılında yayınlanan James MERCER’ın makalesine kadar dayanmaktadır. 20. Yüzyılda Nöroloji biliminde meydana gelen nörolojik gelişmeler Yapay Sinir Ağları(YSA)’nın ortaya çıkmasını sağlarken aynı yüzyıldaki matematiksel gelişmeler de DVM’nin bilim dünyasındaki bu günkü yerini almasını sağlamıştır. Mercer, günümüzde Mercer teoremi olarak bilinen teoriyi içeren ve “Pozitif ile Negatif Fonksiyonlar ve Bunların İntegral Eşitlikler Teorisine Bağlantısı” adı ile yayımlanan makalesinde, DVM’nin temel kavramı olan çekirdek kavramını ortaya koymuştur. Daha sonraki yıllarda yayımlanan “Kernel Hilbert Uzayı’nın Yeniden Türetimi” makalesi de DVM’nin temelini oluşturmaktadır. İstatistiksel öğrenme teorisi bilim dalı 1974 yılında Vapnik ve Chernovenkis ile Rusyada başlamıştır. DVM’nin, Vapnik’in istatistiksel öğrenme kuramını daha da geliştirmesiyle ortaya çıktığı söylenebilir. DVM’nin bugünkü şekline çok yakın hali ilk olarak 1992 yılında COLT(Conference on Computational Learning Theory) 1992 isimli konferansta sunulmuştur. Cortes ve Vapnik tarafından 1995 yılında esnek marjin sınıflandırıcı algoritması ortaya konmuş ve aynı yılda bu algoritma regresyon problemleri için genişletilmiştir. Geleneksel YSA yaklaşımında veriye uygun bir model yaratılması ve genellenmesi konusunda ciddi sorunlar ortaya çıkmaktadır. YSA için kullanılan parametrelerin belirlenmesi için deneysel ve istatiksel ölçümler gerekmektedir. Viladimir VAPNIK tarafından 1995 yılında ortaya atılan DVM ile ise deneysel araştırmalar üzerinde ciddi bir performans artışı gözlenmiştir. YSA ve DVM üstün doğrusal olmayan genelleme yeteneklerinden dolayı son yıllarda sıklıkla sistem tanıma problemlerinde kullanılmaktadırlar. YSA’da, modelin başarısı ağ yapısına ve seçilen eğitim verilerine bağlıdır. YSA’da seçilen öğrenme algoritması ve konveks olmayan amaç fonksiyonu problemin çözümünün yerel minimuma takılmasına neden olabilmektedir. Genel anlamda tüm bu problemler DVM’de karşılaşılmamaktadır. DVM, istatistiksel öğrenme teorisine ve yapısal risk minimizasyonu prensiplerine dayanmaktadır. DVM’nin üstünlüğü, sınıflandırma ve regresyon problemlerini yerel minimuma takılmadan çözebilmeleridir. Konveks olmayan problem karesel programlama problemine dönüştürülerek global minimum garantilenmektedir. Üstün genelleme yeteneklerinden dolayı, DVM, sınıflandırma ve regresyon problemlerinin çözümünde başarılı bir şekilde kullanılmaktadır. Kanser hücreleri için gen seçme, yüz tanıma, kanser teşhisi ve internette saldırı algılama DVM’ nin örüntü tanıma problemlerinde uygulama alanlarından bazılarıdır. Mikrodalga iletimin modellenmesi, robot manipülatörün kontrolü, model öngörülü kontrol ve kontrolör parametrelerinin uyarlanması DVM’nin tanılama problemlerinde kullanıldığı bazı uygulama alanlarıdır. DVM’ler model tabanlı uyarlamalı PID kontrolörlerin parametrelerinin uyarlanmasında jakobiyen bilgisinin kestirimi için de kullanılabilmektedir. Bu tezde, Bölüm 2‘de DVM’nin temelleri hakkında ayrıntılı bilgi verilerek, sınıflandırma ve regresyon problemlerinin oluşturulması ve global çözümün nasıl garanti edildiği hakkında ayrıntılı olarak açıklanmıştır. İlk olarak iki sınıf için doğrusal sınıflandırma problemi ele alınmış ve doğrusal sınıflandırma formülasyonları inşa edilmiştir. Doğrusal sınıflandırmanın mümkün olmadığı durumlarda kullanılan, DVM’nin temelini oluşturan çekirdek kavramından bahsedilmiştir. Çekirdek fonksiyonu giriş uzayında doğrusal olarak sınıflandırılamayan verilerin, doğrusal olarak sınıflandırılabilmelerine olanak sağlayan öznitelik uzayına haritalanmalarını sağlamaktadır. Bölüm 3’te DVM’nin üstün genelleme yeteneğinden faydalanıldığı alanlardan biri olan sistem tanıma ve kontrolör tasarımı hakkında bilgi verilmiş ve bu konularda yapılan uygulamaların sonuçları aktarılmıştır. Sistem tanıma problemi, sistemin girişi ile çıkışı arasındaki haritalama fonksiyonunun bulunması problemidir. Sistem tanıma problemlerinin özelliği tanılama probleminin regresyon problemine dönüştürülmesidir. Yapay sinir ağı, bulanık mantık ve uyarlanabilir bulanık sinir ağları temelli modeller sistem dinamiklerinin kestirimi için başarılı modeller elde edilmesine olanak sağlamaktadır. Son yıllarda global minimumu garanti ettikleri için destek vektör makineleri temelli modeller sıklıkla kullanılmaktadır. Yapay sinir ağı, bulanık mantık ve uyarlanabilir bulanık ağların ortak özelliği, öğrenme algoritmaları ve konveks olmayan amaç fonksiyonlarından dolayı lokal minimuma takılabilmeleri sonucunda lokal model oluşmasına neden olmalarıdır. Destek Vektör Makinelerinde amaç fonksiyonu konveks, optimizasyon problemi kısıtlı optimizasyon problemidir. Bu nedenle sistem dinamiklerinin kestirimi için çok iyi bir tanılama aracı olarak kullanılabilmektedirler. Model tabanlı uyarlamalı kontrolörlerin başarısı doğrudan modelin başarısına bağlıdır. Bu nedenle, DVM’nin sistem tanımadaki başarısından yararlanarak, DVM temelli kontrolör yapılarından son zamanlarda sıklıkla faydalanılmaktadır. Veri örneklemeye dayalı sistem tanıma problemlerinde amaç öncelikli olarak sistemin mümkün olan bütün dinamiklerinin ortaya çıkarılmasıdır. Doğrusal olmayan sistemlerde sistemin dinamiklerinin ortaya çıkarılması için farklı genlik ve genişliklere sahip, sistemin giriş işaretinin sınırları içinde rastgele değişen basamak işaretleri kullanılmaktadır. Amaç iyi bir modelleme için sistemin mümkün olduğunca bütün frekans bileşenlerinde uyarılmasıdır. Bölüm 3.2’de DVR ile sistem modelleme ele alınmıştır. DVR’nin başarımını test etmek için 4’lü tank sisteminin dinamikleri kestirilmiştir. Izgaralama yöntemi kullanılarak en iyi çekirdek parametresi araştırması yapılmıştır. Sonuçlar DVR’nin oldukça az eğitim verisiyle başarılı modeller elde edilmesine olanak sağladığını göstermektedir. Bölüm 3.3’te önceden literatürde önerilen -DVR model tabanlı kontrolör tasarımı sunulmuştur. Literatürde önerilen kontrolör 5 parçadan oluşmaktadır. Bunlar; 1-Klasik PID Kontrolör 2-Sistemin DVR Modeli 3-Çizgi arama Bloğu(Altın Bölme vb.) 4-Kontrol İşareti düzeltme bloğu 5-Kontrolör Parametresi ayarlama bloğu Burada -DVR model, PID kontrolörün parametrelerinin uyarlanması için gerekli olan sistem jakobiyen bilgisinin kestirimi için kullanılmaktadır. PID kontrolör parametreleri Levenberg Marquard algoritması kullanılarak uyarlanmıştır. Jakobiyen Matrisi zincir kuralı kullanılarak 2 tane bloğa bölünmüştür. Bu bloklardan biri kontrol işaretini düzeltme için kullanılırken diğeri kontrolör parametrelerinin kestirimi için kullanılmıştır. Sistemin geçici hal davranışında üretilen kontrol sinyali sistemi istenilen cevaba süremeyebileceği için kontrol işareti düzeltme bloğu kullanılmıştır. Öğrenme oranın belirlenmesi için altın bölme yöntemi kullanılmıştır. Çalışmamızda bu kontrolör yapısını kullanarak kararsız ve doğrusal olmayan manyetik askı sisteminin kontrol edilmesi amaçlanmıştır. -DVR çevrimdışı bir tanılama aracıdır ve -DVR’de regresyon probleminin çözümü için kullanılan karesel problem çözümleyici oldukça büyük bir işlemsel yük getirir. Bu sorunları çözmek için En Küçük Kareler Destek Vektör Makineleri(EK-DVM) kullanılabilir. Bölüm 3.4’de EK-DVM’nin tanılama probleminde kullanılması ile ilgili ayrıntılı bilgi verilmiştir. Daha sonra çevrimdışı bu algoritmanın çevrimiçi tanılamaya uyarlanması anlatılmıştır. Çevrimiçi En Küçük Kareler Destek Vektör Regresyonun (ÇEK-DVR) başarımı, 3. dereceden doğrusal olmayan bir sistem olan sürekli karıştırmalı tank reaktör sistemi üzerinde denenmiştir. ÇEK-DVR sistem tanılama aracı kullanılarak sistemin doğrusal olmayan dinamiklerinin başarılı bir şekilde modellendiği gözlemlenmiştir. Çevrimdışı modeller sistem ve ortam belirsizliklerinden etkilenebileceği için kontrolör tasarımında gerekli olan jakobiyen bilgisinin yanlış kestirilmesine neden olabilirler. Bu dezavantajı ortadan kaldırmak için ÇEK-DVR kullanılarak tasarlanan uyarlamalı PID kontrolör hakkında geniş bilgi verilmiştir. ÇEK-DVR kullanılarak uyarlamalı PID kontrolörün başarımı sürekli karıştırmalı tank reaktörü üzerinde test edilmiştir. Kontrolörün gürültülü koşulardaki performansı için ölçme gürültüsü altında çalışması incelenmiştir. Bölüm 4’de bu çalışmanın ana fikrini oluşturan, DVM’nin ana tasarım bileşeni olan, giriş uzayı ile öznitelik uzayı arasındaki doğrusal olmayan haritalamayı sağlayan çekirdek fonksiyonu parametresinin çevrimiçi uyarlanması hakkında bilgi verilmiştir. Çekirdeğin ana fonksiyonu düşük dereceden giriş uzayında doğrusal olarak ayrıştırılamayan sınıflandırma problemini, doğrusal olarak sınıflandırmanın yapılabileceği daha yüksek dereceden öznitelik uzayına haritalamaktır. Böylece doğrusal regresyon ve sınıflandırma tekniklerinin doğrusal olmayan problemler için kullanımı mümkün olabilecektir. Haritalamada kullanılan çekirdek fonksiyonlarının nümerik parametreleri regresyon ve sınıflandırma performasını doğrudan etkilemektedir. Bundan dolayı, çekirdek fonksiyonu ve ona ait parametrelerin seçimi modelleme ve kontrol performansı açısından büyük öneme sahiptir. Gauss çekirdek için, band genişliği ana nümerik parametredir. Band genişliği çok küçük seçildiğinde, öznitelik uzayında benzer öznitelikler farklı lokasyonlara haritalanacak ve model için büyük bir öneme sahip öznitelikler, öznitelik uzayına aktarılamayabilecektir. Eğer çok büyük seçilirse, model için önemsiz farklı öznitelikler, öznitelik uzayında çok yakın lokasyonlara haritalanacaktır. Sonuç olarak, çekirdek parametresinin çok küçük veya çok büyük seçilmesi durumunda çekirdeğin doğrusal olmama özelliğini kaybolacaktır. En iyi regresyon performansı model için gereksiz özniteliklerin filtrelenmesi ile elde edilebilir. Bu gibi etkenlerden dolayı, optimal çekirdek parametresinin seçimi, çekirdek makinesinin eğitim ve test performansı açısından büyük bir öneme sahiptir. Teknik literatürde, çekirdek parametresinin uyarlanması ‘çekirdek polarizasyonu’ olarak adlandırılmaktadır ve sınıflandırma problemlerinde optimal parametreyi belirlemek için çeşitli yaklaşımlar önerilmiştir. Bu yaklaşımlardan bazıları; ızgaralama (grid search), çapraz doğrulama (cross validation), birini dışarıda bırakma (leave one out), logaritmik konveks konkav prosedür (LCCP (log convex concave procedure)), ve evrimsel arama algoritmalarıdır. Genetik algoritmalar (genetic algorithms), sürü optimizasyonu (swarm optimization), benzetilmiş tavlama (simulated annealing), kuantum- esinlenmiş savunma sistemleri (quantum-inspired immune systems) ve yapay savunma sistemleri (artificial immune systems) çekirdek parametresinin hesaplanmasında kullanılan evrimsel algoritmalardan bazılarıdır. Bu yaklaşımlardaki ortak özellik çekirdek parametresinin çevrimdışı uyarlanmasıdır. Bu çalışmada literatürdeki yaklaşımlardan farklı olarak ÇEK-DVM’ye ait çekirdek parametresi çevrimiçi uyarlanmıştır. Çekirdeğe katılan adaptasyon yeteneğinin sistem tanılama ve model tabanlı uyarlamalı kontrolör tasarımındaki başarımını değerlendirmek için sürekli karıştırmalı tank reaktör sistemi (CSTR) üzerinde benzetimler yapılmıştır. Öncelikli olarak Bölüm 4.2 de çekirdek parametresinin öznitelik uzayındaki etkileri incelenmiş ve çekirdek parametresinin doğru belirlenememesi durumunda problemin doğrusal olmama özelliğini nasıl yitirdiği anlatılmıştır. Çekirdek parametresinin optimal olarak seçilmesinin regresyon performansı açısından önemi ifade edilmiştir. Çekirdeğe çevrimiçi uyarlama yeteneğinin katılması sonucunda çekirdek matrisindeki değişimler hakkında açıklayıcı bilgiler verilmiştir. Bölüm 4.3’de eğim düşümü metodu ile çekirdek parametresinin uyarlanması anlatılmıştır. Önerilen metodun tanılama problemi üzerindeki etkilerini incelemek için farklı ilk koşullara sahip çekirdek değerleri için benzetimler yapılmıştır. En küçük eğitim hatası iken elde edildiği için bu değer kontrol sürecinde de ilk değer olarak kullanılmıştır. Bölüm 4.4’te yöntemin kontrolör tasarımındaki etkileri incelenmiş, ayrıca çekirdeğe katılan uyarlama özelliğinin ölçme gürültüsü ve bozucu olması durumunda ve sistem parametreleri değiştiğinde kontrolör dayanıklılığını nasıl etkilediği araştırılmıştır. Bölüm 5’de yöntemin tanılama ve kontrol performansı açısından etkileri hakkında kısaca bir tartışma yapılmış ve gelecek çalışmalar hakkında bilgiler verilmiştir.
The basics of the SVM, firstly proposed by Vladimir VAPNIK in 1979, are based on the article of the James MERCER owing to kernel notion. While the developments of neurological science in 20th century provided the emergence of the Neural Network, develeopments in mathematics at the same century have led to its present position in the world of science. Mercer, now known for Mercer’s Theorem published with the name of “Functions of Positive and Negative Type and their Connection with the Theory of Integral Equations ”, revealed the kernel notion, the basic concept of the SVM. The article, published with the name of “ Reproducing Kernel Hilbert Space” in later years, underlied the fundamentals of the SVM. Statistical learning theory emerged with Vapnik and Chervonenkis in 1974. However, it is possible to say that SVMs came about when Vapnik integrated further developments to statistical learning theory in 1979. Vapnik suggested the first form of SVMs close to their current form with a paper at the COLT (Conference on Computational Learning Theory) conference in 1992. The soft margin classifier was proposed in 1995 by Cortes and Vapnik and the algorithm was developed for regression by Vapnik in the same year. Traditional ANN approach poses serious problems about the composition and generalization of an appropriate model. Experimental and statistical measurements are required to determine the parameters of ANN. Significant improvement was observed on the experimental research in SVM proposed by Vapnik. Data sampled modelling techniques based on Artificial Neural Network (ANN) and Support Vector Machines(SVM) are popularly applied in recent years owing to their non-linear prediction ability. The performance of models based on ANNs depends on the network’s structure and the selection of training samples. The possibility of convergence to a local minima is the persistent problem in ANNs(such as multilayer perceptrons). These problems are generally avoided in SVMs. The SVMs rely on the statistical learning theory and the principle of structural risk minimization. The superiority of SVMs is that they can solve classification and regression problems without getting stuck at local minima.The global minima is ensured by transforming the nonconvex objective function in primal form into a convex one in dual form. Owing to their eximious generalization ability, SVMs have been successfully used to solve both classification and regression problems.Gene selection for cancer cells , face recognition , and intrusion detection are some of the areas where SVMs are used as pattern classifiers. Modeling of microwave transition, robot manipulator control, model predictive control and PID controller tuning are examples of applications where Support Vector Regression technique has been employed for identification. SVMs can be utilized so as to approximate the jacobian of the system to tune PID controller parameters. In this thesis, the basics of SVM and how SVMs ensure global minima has been explained in section 2. Firstly, linear classification for two classes has been persued and the formulation for linear classification problem has been constructed. The kernel, employed for the case where linear classification is not possible, has been mentioned. The kernel functions to map the training data, not separable by a linear plane in the input space, to a high dimensional feature space where linear classification or regression can be successfully performed. In Section 3, System Identification and Controller Design, the application area where SVMs are succesfully employed, has been presented and results of these applications are given. The system identification problem deals with finding the mapping function from input to ouput. The main feature of the system identification problem is to convert the identification problem to a regression problem. The dynamics of nonlinear systems has been identified with artificial intelligence methods such as ANN, ANFIS and SVM. Models based on SVM, have recently been preferred to update controller parameters over Neural Network (NN) and ANFIS Models due to their apparent strength of ensuring global minima. The common feature of ANN, FL(Fuzzy Logic) and ANFIS is that they get stuck at local minima because of their non-convex objective functions. The objective function of SVM in dual form is convex and the optimization problem is a constrained optimization problem. Because of this, they can be utilized as an identification tool to approximate the dynamics of systems. The achievements of the model based controllers directly depend on the performance of the model. Therefore, controller structures based on SVM have often been utilized in recent times. The aim in data sampled modeling technique is to reveal all possible dynamics of the system. An input varying between the limits of the input signal is applied to reveal the dynamics of the nonlinear systems. The aim is to stimulate the systems with all possible frequencies. System modeling has been explained in Section 3.2. The identification performance of SVR has been evaluated on a quadruple tank system as an example of MIMO modeling. The kernel parameters play a crucial role in the modeling performance, so a grid search analysis has also been carried out to find the best kernel parameter set. The results indicate that SVR allows to obtain better models with very few training data. An adaptive PID Controller based on -SVR, proposed in technical literature formerly, has been presented. The controller consists of 5 parts. These are ; a) Classical PID controller b) SVR Model of the plant, c) Line search block d) Control signal correction block e) Controller parameter tuner. -SVR model has been utilized to approximate the system jacobian information. PID parameters has been tuned using Levenberg Marquard algorithm. Jacobian matrix is separated into two blocks using chain rule. One block is for control signal correction and the other is for parameter tuning. The updated controller parameters may not be optimal enough to force the plant output toward the desired trajectory. Therefore, control signal correction block has been employed. Optimum step size has been obtained via golden section method. The Magnetic Levitation system has been controlled using this controller type as an example of a nonlinear and unstable system. -SVR is an offline identification tool and it uses quadratic programming solver to seek global minima in -SVR which presents a computational load. Least Square Support Vector Machines(LSSVM) can be employed in order to eliminate this drawback. In section 3.4, detailed information about LSSVM in identification has been given. Then, conversion of this offline algorithm to an online algorithm is explained. The identification performance of the Online LSSVR has been evaluated by simulations carried out on a CSTR system. It has been observed that nonlinear dynamics can be succesfully modelled when OLSSVR is used as an identification tool. Since the offline model can be affected by model and system uncertainities, it may result in erroneous jacobian information. Adaptive PID Controller based on OLSSVR can be utilized to come over this complication. The dynamics of the CSTR system has been controlled using an adaptive controller based on OLS-SVR. The performance of the controller with respect to measurement noise has been evaluated. In section 4, online tuning of kernel parameter, the main idea of this study, is explained. Kernel function allows a nonlinear mapping between input and feature space. The main function of the kernel is to map the training data, not separable by a linear plane in the input space, to a high dimensional feature space where linear classification or regression surface can be successfully carried out. Thus, linear techniques can be utilized in the high dimensional feature space. The numerical values of the kernel effects directly the classification and regresion performance. The regression performance of a SVM depends on the chosen kernel function which is generally parametric and the numerical values of these parameters are important in determining the location of the features mapped onto the feature space, however there is no theoretical method to determine them numerically. Because of this, the selection of the kernel function and the numerical values of its parameters are very crucial in terms of modeling and control performance. For a gaussian kernel, the bandwidth is the main numerical parameter. When it is chosen to be very small, similar features are mapped to distant locations in feature space and some features significant for the model may be discarded. If it is chosen very large, different features are mapped very close to each other in feature space and redundant or irrelevant features may also be mapped. Consequently, kernel may lose its nonlinearity. Better regression performance can be obtained by discarding redundant features. Due to such factors, the selection of optimal kernel parameter is crucial in terms of training and testing performance of the kernel machine. In technical literature tuning the kernel parameter is named as “kernel polarization” and various approaches have been proposed to find an optimal solution to it for classification problems. Gradient descent, grid search algorithm, cross validation, leave one out, log convex concave procedure (LCCP), and evolutionary search algorithms have been used to seek optimal kernel parameter. Evolutionary algorithms like genetic algorithms, swarm optimization, simulated annealing, quantum-inspired immune systems and artificial immune systems have been employed to compute the kernel parameter. The common aim in all these approaches is to compute the kernel parameter offline. In this study, unlike different approaches in literature, the kernel parameter has been adapted online. The simulations have been carried out on a continuously stirred tank reactor(CSTR) so as to examine the effects of the interfused flexibility to the kernel in terms of system identification and controller design. Firstly in section 4.2, the impacts of the kernel parameter in feature space for a gaussian kernel have been analysed. How a non-optimal kernel parameter leads to the loss of problem nonlinearity, is explained. The significance of the selection of kernel parameter regarding regression performance has been expressed. The discriptive information about changes in the kernel matrix as a result of online adaptation ability has been given. The tuning of the kernel parameter via gradient descent has been presented in section 4.3. In order to examine the effects of kernel bandwidth adaptation in comparison with the fixed bandwidth case, various simulations have been performed with different initial values of bandwidth. Since the smallest modeling error is obtained with this value has been used in control procedure as the initial value of the kernel bandwidth. In section 4.4, influence of the method in controller design has been examined. Besides, how the controller performance is affected under measurement noise and disturbance as well as under system parameter changes has been investigated. A brief discussion on the effects of the method in terms of identification and control performance and future study prospects are given in section 5.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2012
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2012
Anahtar kelimeler
Destek Vektör Makineleri, PID Kontrolör, Uyarlamalı Kontrol, Eğim Düşümü, Çekirdek Uyarlama, Support Vector Machines, PID Controller, Adaptive Controller, Gradient Descent, Kernel Tuning
Alıntı