Short term load forecasting by using artificial neural networks

thumbnail.default.alt
Tarih
2020-05-15
Yazarlar
Ghadiriasl Nobari, Ali
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Institute of Science And Technology
Fen Bilimleri Enstitüsü
Özet
Load forecasting is considered as one of the most essential tools for managing power systems. It accommodates the system to maintain reliable power for consumers. Forecasting is the first step for investigating power system planning. Electrical energy injections and withdrawals/losses on the power system must be balanced at all times and the cost of generating electrical energy changes with demand. Electricity must be provided while it is being consumed because saving this valuable energy is not affordable. These most crucial characteristics of electricity has made the managing of power systems much more complicated. Since this topic is quite significant, numerous researchers have used different methods for achieving greater results. All those methods could be classified into two groups, the Artificial Intelligence Approach, and the Statistical Approach. Artificial intelligence (AI) is an attempt to imitate the human brain functions of thinking and decision making. Artificial intelligence is highly practical in load forecasting for investigating the relationships between different features. Knowing the forthcoming consumption is extremely necessary for power companies. The short term forecasting could be used for anticipating the load ranging from an hour to several days. In this thesis, a forecasting model was made by utilizing Artificial Neural Networks (ANN) and other methods. The ANN is a strong machine-learning method that processes the data with non-linear and complex functions. This algorithm is not so new, but it has become more popular these recent years. There are various types of ANN, each suitable for a particular case. Feed-Forward (FF) was applied as an ANN in this thesis. The neural networks are suitable methods for both classification and regression cases which forecasting is a regression problem. The linear activation function is the best choice for the last layer. Different combination of features was used to find out which one has the best results. The calendar features were used in the first study and the second one utilized the weather features. Finally, both of them were used in the last study. The errors of these three studies show that it is more beneficial to use all of the features in one model. The correlation methods were used for determining weather features. Some of the weather features like the cloudiness of the sky had such little correlation, so they were excluded from train data. The main goal of this thesis is to forecast the load in the short term, but the model could also be used for longer periods. The model was prepared by using more than five years of data from Gebze city. The goal of this thesis is estimating the average load of the consuming amount. The weather data consists of information gathered from two different stations. It facilitated filling the missing values properly. There are four steps in the load forecasting model. The first step is data preprocessing and the second step is defining the model. A large number of parameters and hyper-parameters must be tuned in defining the model. Not only these elements have a very crucial impact on accuracy, but they could also prevent the model from under-fitting and over fitting. The third and fourth steps are fitting the data into the model and validating the accuracy. Three different validation functions were applied, RSQ, Mean absolute error (MAE), and Mean squared error (MSE). The RSQ is a number between zero and one; one being the best value for these criteria. The best value for MAE is zero. The MSE is a non-negative value that measures the quality of an estimator in which it must be a small value. The thesis uses K-Nearest Neighbors, Linear Registration, and Decision Tree for comparing the results and finding the best algorithm. The best solution is the neural network algorithm result. The accuracy could be increased by using more data with more features and also by designing a better architecture for the neural network's model.
Elektrik endüstrisi bir ülkenin altyapı endüstrilerinden biridir ve günümüz toplumlarının büyüme ve gelişmesinde çok önemli bir ayağıdır. Elektrik sektöründeki projeler bir yandan büyük yatırımlar ve uzun süreler gerektirdiği için diğer yandan mevcut teknoloji ile bu enerjiyi büyük ölçekte depolamak hala mümkün değildir. Bu nedenle elektrik talebini karşılayacak şekilde üretim planlaması yapılmalıdır. Bu nedenle yük tahmini, güç sistemlerinin geliştirilmesinde ve çalıştırılmasında önemli bir faktör olarak kabul edilir ve aslında karar vermeyi iyileştirmek için kullanılabilecek bir araçtır. Kaynak tahsisi sürecini tahmin etmek, elektrik şebekesinin geliştirilmesi için çok önemlidir. Gelecekteki geliştirme planlamasında, bir yük tahmini güç sistemi çok önemlidir ve planlama çalışmalarının temelini oluşturur.Yük tahmin hatalarının miktarı özel bir önem taşır. Bu durumda karar verme sorunları, bir yandan sınırlı bütçeler ve bir yandan maliyetleri en aza indirme hedefi, diğer yandan da güç uzmanları ve mühendislerinin gelişmiş ve pahalı ekipman satın alma baskısı ile elektrik kullanımının kontrolsüz bir şekilde genişlemesi ile karşılaşıldığında daha da kötüleşir. Tahmin edilen yük, gerçek yükten daha az ise, güvenilirlik ve dolayısıyla hizmet kalitesi azalır ve bu, zorunlu kapatmalara bile yol açabilir. Bu, kendi başına sistem analistlerinin işini biraz zorlaştırır ve diğer yandan, bir sonraki sefer gerekli miktardan önce tahmin edilirse, çok fazla yatırım boşa harcanır ve finansal ihtiyaçlara yol açar. Gerçek şu ki, elektrik tüketimi sabit değildir ve her zaman çeşitli zamansal, çevresel, ekonomik ve dalgalanan parametrelerin doğrusal olmayan bir fonksiyonudur. Elektrik tüketimindeki değişiklikler, enerji şirketlerinin farklı zamanlarda güç sistemlerindeki enerjiyi daha iyi yönetmek için gereken bilgileri önceden tahmin etmesini gerektirmiştir. Elektrik sektöründe güvenilirliğin ve verimliliğin artırılması, elektrik sektöründe maliyetlerin ve işlem maliyetlerinin düşürülmesi, tüketicilere daha fazla seçenek sunulması vb. Ekonomik, sosyal, politik teşvikler kaçınılmaz olarak elektrik sektörünün yönetimini dönüştürmüştür. Elektrik endüstrisinin yeniden yapılandırılması olarak anılır. Elektrik sektörünün yeniden yapılandırılmaya başlaması ve rekabetçi elektrik piyasalarına girmesi ile üretim, iletim ve dağıtım kısımları büyük ölçüde özel sektöre devredilmiştir. Yük tahmini güç sistemlerini planlamak için en önemli araçlardan biridir. Sistemin tüketiciler için güvenilir güç sağlamasına yardımcı olur. Tahmin, güç sistemi planlamasının araştırılması için ilk adımdır. Elektrik sistemindeki elektrik enerjisi enjeksiyonları ve geri çekilmeleri kayıpları her zaman dengelenmeli ve elektrik enerjisi üretme maliyeti talebe göre değişmelidir. Elektrik tüketildiğinde sağlanmalıdır, çünkü bu enerjiden tasarruf etmek uygun değildir. Elektriğin bu önemli özellikleri, güç sistemlerinin yönetimini çok karmaşık hale getirdi. Bu konu çok önemli olduğu için, birçok araştırmacı daha iyi sonuçlar elde etmek için farklı yöntemler kullandı. Tüm bu yöntemler Yapay zeka yaklaşımı ve İstatistiksel yaklaşım olmak üzere iki gruba ayrılabilir. Yapay zeka (AI), insan beyni işlevini düşünme ve karar vermede taklit etmeye çalışmaktır. Yapay zeka, farklı özellikler arasındaki ilişkilerin araştırılmasında yük tahmininde çok pratiktir. Ertesi günün tüketimini bilmek güç şirketleri için çok yararlıdır. Kısa vadeli tahmin, yükü bir saatten birkaç güne kadar tahmin etmek için kullanılabilir. Bu tez Yapay Sinir Ağları (YSA) ve diğer yöntemleri kullanarak bir tahmin modeli oluşturmuştur. YSA, verileri doğru olmayan ve karmaşık işlevlerle işleyen güçlü bir makine öğrenme yöntemidir. Bu algoritma yeni bir algoritma değildir, ancak son yıllarda popüler hale gelmektedir. Buna bağlı olarak nedenlerini şöyle açıklayabiliriz, birinci nedeni bilgisayarların işleme gücünün artmasıdır ve ikinci nedeni ise veri bankasının genişlemesidir. Günümüzde elektrik ağının çoğu elemanları ölçme ve kayıt işlemlerini yapma özelliğine sahiptir. Tüm bunlar bizim için çok önemli veri tabanı hazırlamaktadır. Her birinin özel bir durum için uygun olduğu çeşitli YSA türleri vardır. Bu tez YSA olarak kullanmak için İleri Beslemeyi (FF) kullanmıştır. Bir ileri beslemeli sinir ağı, birimler arasındaki bağlantıların bir döngü oluşturmadığı bir yapay sinir ağıdır. Bu nedenle, tekrar eden sinir ağlarından farklıdır. İleri beslemeli sinir ağı, geliştirilen yapay sinir ağının ilk ve en basit türüdür. Bu ağda, bilgi, girdi düğümlerinden, gizli düğümler (varsa) aracılığıyla, sadece bir yönde ileri çıkış düğümlerine doğru gider. Ağda döngü yoktur. Sinir ağları hem sınıflandırma hem de regresyon vakaları için uygun bir yöntemdir ve tahmin bir regresyon problemidir. Doğrusal etkinleştirme işlevi son katman için en iyi seçimdir. Hangi kombinasyonun en iyi sonuçları verdiğini bulmak için farklı özelliklere sahip kombinasyonlar kullanıldı. İlk çalışmada takvim özellikleri, ikincisinde ise hava özellikleri kullanılmıştır. Son olarak, bu çalışmada her iki özellik de son çalışmada kullanılmıştır. Bu üç çalışmanın hatası, tüm özelliklerin bir modelde kullanılmasının daha iyi olduğunu göstermektedir. Hava özelliklerini seçmek için kullanılan korelasyon yöntemleri. Gökyüzünün bulanıklığı gibi bazı hava özellikleri arasında çok az korelasyon vardır, bu nedenle öğretim verilerinden çıkarılmıştır. Bu tezin temel amacı kısa vadede yükün tahmin edilmesidir, ancak model daha uzun süre de kullanılabilir. Model, Gebze şehri için beş yıldan fazla veri kullanılarak eğitildi. Hedef değer ortalama yük tüketen miktardır. Hava durumu verileri iki farklı istasyondan gelen bilgilerden oluşur. Eksik değerlerin düzgün bir şekilde doldurulmasına yardımcı olur. Bu veriler Türkiye Meteoroloji Genel Müdürlüğü tarafından sağlanmaktadır. Tahmin modelinin dört adımı vardır. Veri ön işleme, ikinci adımın modeli tanımladığı ilk adımdır. Modeli tanımlarken birçok parametre ve hiper parametre ayarlanmalıdır. Bu elemanların doğruluk üzerinde çok önemli bir etkisi vardır, aynı zamanda modelin yetersiz oturmasını ve aşırı takılmasını önleyebilirler. Üçüncü ve dördüncü adımlar, verileri modele uydurmak ve model doğruluğunu doğrulamaktır. Bu makalede üç farklı doğrulama fonksiyonu kullanılmıştır: RSQ, Ortalama mutlak hata (MAE) ve Ortalama kare hatası (MSE). RSQ sıfır ile bir arasında bir sayıdır ve bu miktar bir ne kadar yakın olursa iyidir. MAE için en iyi değer sıfırdır. MSE, bir tahmin edicinin kalitesini ölçen negatif olmayan bir değerdir. Daha iyi modeller küçük MSE değerlerine sahiptir. Tez, sonuçları karşılaştırmak ve en iyi algoritmayı bulmak için diğer üç algoritmayı kullanır. Bu algoritmalar K Yakın Komşular, Doğrusal Kayıt ve Karar Ağacıdır. Sinir ağları en iyi sonuçları verir. Daha fazla özelliğe sahip daha fazla veri kullanılarak ve sinir ağının modeli için daha iyi mimari tasarlanarak doğruluk artırılabilir. Karar Ağacı , ağaç yapısı şeklinde basit bir sınıflandırma algoritmasıdır. Data modelimizin dinamiklerine göre skorlama yöntemlerini kullanarak basit karar ağaçları oluşturabilir. Bu sayede giriş değerine göre çok hızlı sınıflandırma yaparak karar alabilir, hatta tahminlerde bulunabilir.
Açıklama
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2020
Tez (Yüksek Lisans)-- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2020
Anahtar kelimeler
Artificial neural networks, Yapay sinir ağları
Alıntı