Kolektif Sınıflandırma Yöntemleri İçin Öznitelik Ve Düğüm Seçimi
Kolektif Sınıflandırma Yöntemleri İçin Öznitelik Ve Düğüm Seçimi
Dosyalar
Tarih
2010-07-13
Yazarlar
Şenliol, Barış
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Institute of Science and Technology
Özet
Bu çalışmada, kolektif sınıflandırma yöntemlerinin öznitelik ve/veya düğüm seçme yöntemleri ile birlikte kullanılmasının sınıflandırma performanslarında oluşturacağı değişim normal ve özniteliksel olarak zenginleştirilmiş ağ yapısına sahip veri kümeleri üzerinde araştırılmıştır. Öznitelik seçme yöntemleri olarak mRMR ve geliştirilen FCBF# yöntemi kullanılırken, düğüm seçmek için derece ve komşuluk tutarlılık oranı gibi yeni kıstaslar önerilmiştir. Yapılan deneyler sonucunda öznitelik ve düğüm seçme yöntemlerinin kullanılmasının homofili ve otokorelasyonu arttırdığı, bu nedenle de veri kümelerinden alınan doğruluk performansında iyileşme sağladığı gözlenmiştir. Öznitelik seçme yöntemleri sadece gürültü veri kümelerinde değil gürültü olmadığı durumlarda bile belirgin performans artışlarına neden olurken, düğüm seçme yöntemlerinin komşuluk sayısı çok olduğu durumlarda oluşan gürültülü ilişkilerden veri kümesini kurtararak çok az sayıda düğüm seçildiği durumlarda bile performansı arttırdığı görülmüştür. Ayrıca geliştirilen öznitelik zenginleştirme yönteminin içerik tabanlı sınıflandırıcıların performanslarını kolektif sınıflandırma yöntemlerinin performanslarına yakınlaştırdığı hatta bazı deneylerde geçtiği gözlenmiştir.
In this study, effects of using feature and node selection methods are examined with collective classification algorithms on network data with normal and enriched content to show how much improvement can be made on these classification method’s performances. mRMR and proposed FCBF# methods are used for feature selection while for node selection, some new approaches, such as degree based, neighborhood consistency, are proposed and their results were compared. Experiments showed that using feature and node selection methods on datasets with network structure increases homophily and autocorrelation therefore performances of collective classification algorithms can be increased using selection methods. Feature selection methods improve classification results significantly not only with noisy features also with non-noisy content information. In network structures with too many noisy links, node selection methods decrease the noise by eliminating noisy nodes and even when using low number of nodes, an improvement on performance of classification is achieved. In addition, it is shown that proposed feature enrichment method increases content only classification performances and makes them perform as much as collective classification algorithms.
In this study, effects of using feature and node selection methods are examined with collective classification algorithms on network data with normal and enriched content to show how much improvement can be made on these classification method’s performances. mRMR and proposed FCBF# methods are used for feature selection while for node selection, some new approaches, such as degree based, neighborhood consistency, are proposed and their results were compared. Experiments showed that using feature and node selection methods on datasets with network structure increases homophily and autocorrelation therefore performances of collective classification algorithms can be increased using selection methods. Feature selection methods improve classification results significantly not only with noisy features also with non-noisy content information. In network structures with too many noisy links, node selection methods decrease the noise by eliminating noisy nodes and even when using low number of nodes, an improvement on performance of classification is achieved. In addition, it is shown that proposed feature enrichment method increases content only classification performances and makes them perform as much as collective classification algorithms.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2010
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2010
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2010
Anahtar kelimeler
öznitelik seçimi,
kolektif sınıflandırma,
öznitelik zenginleştirmesi,
düğüm seçimi,
feature selection,
collective classification,
feature enrichment,
node selection