Destek Vektör Regresyonu Yöntemi İle İlerleme Hızı Optimizasyonu

thumbnail.default.alt
Tarih
2015-07-01
Yazarlar
Kor, Korhan
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science And Technology
Özet
Günümüzde enerji kaynaklarına olan talep artışı nedeniyle petrol, gaz ve jeotermal kaynak arayışları önemini daha da arttırarak korumaktadır. Bu talep artışını karşılamak amacıyla daha önce araştırma yapılmamış yeraltı derinliklerinde ve su derinliğinin 3000 metreyi bulduğu açık denizlerde yeni kaynak araştırmaları devam etmektedir. Bu araştırma giderlerinin büyük bir çoğunluğunu sondaj operasyonları oluşturmaktadır. Doğası gereği, sondaj esnasında kulenin ve sondaj dizisinin en çok aşınmaya uğrayan, çabuk eskiyip değiştirilmesine ihtiyaç duyulan elemanı matkaptır. Sondajın metraj veya perfornas maliyetini düşürmek için bir matkabın hem uzun süre çalışması, hem de iyi iş yapması istenir. Matkap çalıştıkça aşınacağı için ilerleme hızı azalır ve sondaj maliyeti artmaya başlar. Bu sebepten dolayı, matkabın aşınma durumunun dikkatle takip edilmesi gerekmektedir. Eğer matkap zamanından önce kuyudan çıkarılırsa, başka kuyularda tekrar kullanılma özelliğini çoğunlukla kaybeder. Eğer matkap fazla aşınır ve bu durum fark edilmezse, bazı kısımları (diş, kon, vs.) parçalanarak kuyunun içinde kalır. Bu kalan parçalar çıkarılıp kuyu temizlenmeden sondaja devam edilemeyeceği için tahlisiye olarak adlandırılan kurtarma operasyonlarının yapılmasını zorunlu kılar. Bu durum, zaman ve para kaybına yol açtığı gibi tahlisiye operasyonunun yüzde yüz başarı ile gerçekleşeceğinin garantisi de yoktur. Sondaj esnasındaki ilerleme hızı birçok parametreye bağlıdır. Bu sebeple, ilerleme hızını tahmin veya optimize etmek oldukça karışıktır. Ancak yaygın optimizasyon yöntemleri kullanılarak, oyma dişli matkaplar için en iyi parametre kombinasyonlarının seçilmesiyle en düşük maliyeti oluşturan matematiksel modeller türetilmiştir. Bu matematiksel modellerden en kapsamlı ve en yaygın olanı Bourgoyne ve Young (BY) yöntemidir. BY yönteminde en iyi ilerleme hızını tahmin edebilmek için sekiz parametre içeren en az otuz girdi veri setine ihtiyaç vardır. Bu otuz veri seti, ya bir sahadaki otuz farklı kuyudan ayrı ayrı şeyl zonlarından alınmış olmalı ya da bir kuyuda otuz farklı derinlikteki şeyl noktalarından elde edilmiş olmalıdır. Herhangi bir sebeple elde yeterli veri olmadığı durumlarda BvY yönteminin doğruluğu azalmakta ve önemli hatalara yol açmaktadır. Bu nedenle, verinin yetersiz olduğu durumlarda alternatif yöntemler kullanılması zorunludur. Bu alternatif yöntemlerden en yaygın olanı, yapay öğrenme yöntemlerinin en etkililerinden biri olan Destek Vektör Regresyonu (DVR)'dur. DVR'nin ilerleme hızı tahmini problemine uygulanabilirliği literatürde ilk kez bu çalışma ile gösterilecektir. Bu çalışmada, ilerleme hızını tahmin etmek için iki farklı regresyon tekniği kullanılmıştır. İlk teknik, BvY'nin uyguladığı çoklu regresyon analizidir. İlerleme hızı probleminde bir bağımlı parametreyi tek bir bağımsız parametre ile bağdaştırmak mümkün değildir. Ayrıca, bu parametreler aynı zamanda birbirlerini de etkilemektedir. Bu nedenle, bu şekilde birden çok parametrenin bulunduğu durumlarda tekli regresyon analizi yapmak mümkün olmamaktadır. Çoklu regresyon analizi, parametrelerin birbirleri ile olan ilişkilerini çeşitli yöntemlerle belirleyip, her bir parametre için korelasyon katsayısı hesaplar. Daha sonra bu korelasyon katsayıları sayesinde tahmin modeli oluşturulur. Tahmin modeli oluşturulduktan sonra uygunluk katsayısı adı verilen R2 değeri hesaplanır. Bu sayede katsayıların geçerliliği ve modelin uygunluğu gözlemlenir. R2 değeri 1'e ne kadar yakınsa oluşturulan model o kadar geçerlidir. Çalışmada irdelenmiş olan ilerleme hızı probleminde birbiriyle ilişkili sekiz parametre bulunmaktadır. Her bir sekiz parametre için ise otuz adet veri seti vardır. Bu otuz veri seti, en küçük kareler yöntemi kullanılarak modellenir ve sekiz adet korelasyon katsayısı bulunur. İkinci teknik ise güçlü bir yapay öğrenme yöntemi olan Destek Vektör Makinesi (DVM)'nin regresyon modelidir. Büyük miktarlardaki verilerin elle işlenmesi ve analizinin yapılması mümkün değildir. Bu tür problemlere çözüm olması amacıyla yapay öğrenme (makine öğrenmesi) yöntemleri geliştirilmiştir. Bu yöntemler, eldeki (geçmiş) verileri kullanarak, bu verilere en uygun modeli bulmaya çalışırlar. Bu işleme, öğrenme işlemi adı verilir. Model oluşturulduktan sonra yeni gelen (gelecek) veriler, bu modele göre analiz edilip sonuç üretilir. Yapay öğrenme yöntemleri farklı uygulamalara, analizlere ve beklentilere göre gruplara ayrılır. Bu gruplardan en yaygın olanları sınıflandırma, kümeleme ve regresyondur. DVM, sınıflandırma konusunda kullanılan oldukça etkili ve basit yöntemlerden birisidir. DVM'de sınıflandırma işlemi için aynı düzlemde bulunan iki grup, aralarına bir sınır çekilerek birbirinden ayrılır. Sınırın çekileceği yer ise iki grubun da elemanlarına en uzak olan yer olması gerekmektedir. Bu işlem, iki gruba da yakın ve birbirine paralel iki sınır çizgisi çekilerek yapılır. Daha sonra bu sınır çizgileri birbirlerine yaklaştırılarak ortak sınır çizgisi üretilir. DVM'de sınıflandırma işlemi iki grup arasında yapılabileceği gibi ikiden çok grup arasında da yapılabilir. DVM'de regresyon ile sınıflandırma arasında matematiksel olarak çok fark bulunmamaktadır. İki yöntem de yapısal risk minimizasyonu ve istatistiksel öğrenme teorisi ile çalışır. Çıktı olarak sınıflandırma bir çeşit etiket (label) verirken, regresyon bir sayı verir. Bu çalışmada, tahmin edilmesi istenen değer ilerleme hızı, yani sayısal bir değer olduğu için DVM'nin regresyon modeli kullanılmıştır. Bu model Destek Vektör Regresyonu (DVR) olarak adlandırılır. Yöntem, kullanılmak istenen veri setinin öğrenme (train) ve test olmak üzere iki alt veri setlerine bölünmesi ile uygulanır. Öğrenme veri seti kullanılarak, ilgili parametreler ve gözlemler arasındaki ilişki belirlenerek bir regresyon modeli oluşturulur. Daha sonra test veri seti, oluşturulan bu model üzerine uygulanarak hedef değer tahmin edilir. Bu çalışmada DVR'nin yaygın modellerinden biri olan Epsilon-duyarsız kayıp fonksiyonu ve nü kontrol parametreli model kullanılmıştır. Bu modelde, öğrenme veri setindeki her bir gözlem değerinden en fazla Epsilon kadar sapma yapacak ve mümkün olduğunca düz olacak şekilde bir fonksiyon bulunur. Diğer bir deyişle, Epsilon'dan küçük olan hatalar göz ardı edilir; fakat Epsilon'dan büyük sapmalar kabul edilmez. Belirlenen epsilon bandı civarında da gevşek değerlerin tolare edilebilirliğini belirleyen bir penaltı parametresi belirlenir. υ parametresi ise epsilon bandını kontrol edebilen kullanıcı tarafından belirlenen bir parametredir. Bu tez çalışmasında DVR yöntemi kullanılarak ilerleme hızı tahminleri BvY çalışmasındaki veri seti kullanımıyla gerçekleştirilmiştir. Veriler sekiz parametre kapsamında tanımlandığı için genel bir yaklaşım olarak parametre sayısının iki katı olan 16 veri, üç katı olan 24 veri ve tamamı girdi verisi olarak kullanılmıştır. Geri kalan veriler ise test seti olarak kullanılmıştır. Veri seçimi rastgele olabildiği için çok sayıda analiz kombinasyonu ortaya çıkmaktadır. Veri seçiminde tercih edilen yaklaşıma bağlı olarak DVR yönteminin uygulanması farklı durumlar ve senaryolar için incelenmiştir. Farklı yöntemler ile elde edilen sonuçlar, her bir senaryo için ait olduğu durum altında irdelenmiştir. Sonuçlarda en iyi tahmin yapan yöntemin seçilen veri setine bağlı olduğu görülmüştür. Öğrenme veri setinin az olduğu durumlarda ilerleme hızı tahmini yapmak için DVR'nin çoklu regresyon yerine alternatif olarak kullanılabileceği belirlenmiştir. Makine öğrenmesi yöntemlerinin en etkililerinden biri olan DVR, ilerleme hızı optimizasyonu için literatürde ilk kez bu tez çalışmasında kullanılmıştır. Böylelikle, DVR'nin ilerleme hızı optimizasyonu problemine genelleştirilmiş bir çözüm sunabileceğinin araştırılması gibi yeni araştırma alanı ortaya çıkmıştır.
Drilling operations constitute the major part of the exploration costs. During operations, drill bits are the primary part needs to be changed frequently due to its quick wearing nature. In order to reduce the drilling cost, the optimum bit pulling time must be determined. To determine the optimum bit pulling time, either rate of penetration or the tooth wearing parameter must be estimated. The most common method that developed for estimating the optimum time for bit change is "Bourgoyne and Young" method. In this method, eight parameter coefficients are needed. To obtain these coefficients, thirty different data which can be taken from either different shale zones inside thirty different wells in a field or thirty different shale points from one well is needed. However, when there is not enough data taken from thirty different shale sections, the accuracy of "Bourgoyne and Young" method decreases. To construct the functional relationship with the data and parameter coefficients, a regression analysis must be performed. In this study, two kind of regression technique is used and the results are compared to each other. First technique is the multiple regression analysis, which is also used in "Bourgoyne and Young" method. This analysis applies least-squares-principled-regression to the data and calculates the parameter coefficients in order to estimate the target function. The second technique is one of different types of machine learning algorithms, called Support Vector Regression. In this technique, first, the data is divided into train and test datasets. Then, the regression model is constructed by using train datasets. At last, the model is applied to test datasets in order to predict the target values for the function. For the calculations, the selection of training and testing data sets are divided into cases with different scenarios. The results of different predictor methods for each scenario are compared with each other in the corresponding case. The results show the significant effect of data selection on the accuracy of penetration rate prediction. One of the most powerful methods in machine learning, Support Vector Regression, is used for rate of penetration optimization for the first time in the literature with this thesis study. In this way, the chance for further investigations and studies on the practicability of Support Vector Regression on penetration rate optimization is created.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2015
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2015
Anahtar kelimeler
İlerleme hızı optimizasyonu, Yapay öğrenme, Destek vektör regresyonu, Penetration rate optimization, Machine learning, Support vector regression
Alıntı