Borsa İstanbul (bıst) 100 Endeksi Yönünün Ekonomi Haberleri İle Tahmin Edilmesi
Borsa İstanbul (bıst) 100 Endeksi Yönünün Ekonomi Haberleri İle Tahmin Edilmesi
dc.contributor.advisor | Çataltepe, Zehra | tr_TR |
dc.contributor.author | Gündüz, Hakan | tr_TR |
dc.contributor.authorID | 10010673 | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |
dc.contributor.department | Computer Engineering | en_US |
dc.date | 2013 | tr_TR |
dc.date.accessioned | 2013-07-31 | tr_TR |
dc.date.accessioned | 2015-04-07T13:59:41Z | |
dc.date.available | 2015-04-07T13:59:41Z | |
dc.date.issued | 2013-09-13 | tr_TR |
dc.description | Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2013 | tr_TR |
dc.description | Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2013 | en_US |
dc.description.abstract | Yapılan tez çalışmasında internet sitelerinde yayınlanan ekonomi haberleri kullanılarak Borsa İstanbul (BIST) 100 endeksi günlük açılış fiyatının yönü tahmin edilmiştir. Çalışmada kullanılan haber metinleri Borsa İstanbul?daki şirketlerin resmi bildirimlerinin yayınladığı Kamu Aydınlatma Platformu (KAP) internet sitesinden ve iki finansal internet sitesinden elde edilmiştir. Haber metinlerine metin madenciliği teknikleri uygulanarak, her işlem gününe ait öznitelik vektörleri oluşturulmuştur. BIST 100 endeksine ait günlük açılış fiyatlarındaki anlamlı değişiklikler sınanarak değişim yönünü gösteren sınıf etiketleri oluşturulmuş ve bu etiketler öznitelik vektörlerine atanmıştır. Öznitelik vektörlerinin boyutunun yüksek olması ve örnek sayısının az olması nedeniyle, haber metinlerinde bulunan kelimeler üzerinde öznitelik seçimi gerçekleştirilmiştir. Öznitelik seçiminde veri kümesindeki sınıf dengesizliği ile başa çıkabilmek için, karşılıklı bilgi öznitelik seçme yöntemi ile birlikte yeniden örneklemeyi temel alan yeni bir öznitelik seçme yöntemi ortaya konmuştur. Dengeli dağılımlı karşılıklı bilgi yöntemi olarak isimlendirilen bu yöntem kullanılarak BIST 100 endeksinin anlamlı yön değişimleri %74 doğruluk ve %68,4 Makro-ortalama F-Ölçütü oranlarıyla tahmin edilmiştir. Kullanılan bu yöntem, karşılıklı bilgi, bilgi kazanımı ve Ki-kare istatistiği öznitelik seçme yöntemleri ile karşılaştırılmış ve dengesiz dağılımlı bilgi kazanımının daha az sayıda öznitelik kullanarak daha başarılı sınıflandırma sonuçları elde ettiği görülmüştür. Ayrıca kullanılan haber metinlerinin alındığı kaynaklar ve BIST 100 endeksinin günlük geçmiş açılış, kapanış ve hacim fiyatları da göz önünde bulundurularak tahmin gerçekleştirilmiştir. | tr_TR |
dc.description.abstract | In this thesis, we predicted the direction of Borsa Istanbul (BIST) 100 Index (XU 100) open price using the news articles released the day before. News articles were provided by Public Disclosure Platform of BIST and two financial websites. Text mining techniques were applied on the news articles to form feature vectors for each trading day. The significant changes of BIST 100 index open price were examined to create the class labels and these labels were assigned to input vectors available for each day. Due to the high dimensionality of inputs and small number of instances for training, feature selection on the words of the news articles was needed. In order to deal with the data imbalance problem, a mutual information and resampling based feature selection method was devised. The method considered the fact that classes were imbalanced for the stock market data and computed the MI after balancing the data, therefore we called this method of relevance computation Balanced Mutual Information (BMI). Experimental results showed that, with BMI, the significant changes in the BIST 100 Index could be predicted, with an accuracy of 74% and a Macro Averaged F-Measure of 68,4%. This balanced feature selection method were compared with three other methods, a basic Mutual Information based, Information Gain and Chi-Square feature selection and it was found out that balanced feature selection results in higher performance using a smaller number of features. Also, the effects of the news sources and the previous days price information on prediction were examined. | en_US |
dc.description.degree | Yüksek Lisans | tr_TR |
dc.description.degree | M.Sc. | en_US |
dc.identifier.uri | http://hdl.handle.net/11527/419 | |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.publisher | Institute of Science and Technology | en_US |
dc.rights | İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. | tr_TR |
dc.rights | İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. | en_US |
dc.subject | Borsa yön tahmini | tr_TR |
dc.subject | Bilgi erişim | tr_TR |
dc.subject | Performans değerlendirme | tr_TR |
dc.subject | Metin erişim | tr_TR |
dc.subject | Metin sınıflandırma | tr_TR |
dc.subject | Metinden öğrenme | tr_TR |
dc.subject | Veri madenciliği | tr_TR |
dc.subject | Örüntü tanıma | tr_TR |
dc.subject | Öznitelik seçimi | tr_TR |
dc.subject | Doğal dil işleme | tr_TR |
dc.subject | Stock market direction prediction | en_US |
dc.subject | Information retrieval | en_US |
dc.subject | Text retrieval | en_US |
dc.subject | Text categorization | en_US |
dc.subject | Performance evaluation | en_US |
dc.subject | Text learning | en_US |
dc.subject | Data mining | en_US |
dc.subject | Pattern recognition | en_US |
dc.subject | Feature selection | en_US |
dc.subject | Natural language processing | en_US |
dc.title | Borsa İstanbul (bıst) 100 Endeksi Yönünün Ekonomi Haberleri İle Tahmin Edilmesi | tr_TR |
dc.title.alternative | Prediction Of Borsa Istanbul (bist) 100 Index Direction Using Financial News Articles | en_US |
dc.type | Master Thesis | en_US |