Please use this identifier to cite or link to this item: http://hdl.handle.net/11527/366
Title: Kolektif Sınıflandırma Yöntemleri İçin Öznitelik Ve Düğüm Seçimi
Other Titles: Feature And Node Selection For Collective Classification
Authors: Çataltepe, Zehra
Şenliol, Barış
Bilgisayar Mühendisliği
Computer Engineering
Keywords: öznitelik seçimi
kolektif sınıflandırma
öznitelik zenginleştirmesi
düğüm seçimi
feature selection
collective classification
feature enrichment
node selection
Issue Date: 13-Jul-2010
Publisher: Fen Bilimleri Enstitüsü
Institute of Science and Technology
Abstract: Bu çalışmada, kolektif sınıflandırma yöntemlerinin öznitelik ve/veya düğüm seçme yöntemleri ile birlikte kullanılmasının sınıflandırma performanslarında oluşturacağı değişim normal ve özniteliksel olarak zenginleştirilmiş ağ yapısına sahip veri kümeleri üzerinde araştırılmıştır. Öznitelik seçme yöntemleri olarak mRMR ve geliştirilen FCBF# yöntemi kullanılırken, düğüm seçmek için derece ve komşuluk tutarlılık oranı gibi yeni kıstaslar önerilmiştir. Yapılan deneyler sonucunda öznitelik ve düğüm seçme yöntemlerinin kullanılmasının homofili ve otokorelasyonu arttırdığı, bu nedenle de veri kümelerinden alınan doğruluk performansında iyileşme sağladığı gözlenmiştir. Öznitelik seçme yöntemleri sadece gürültü veri kümelerinde değil gürültü olmadığı durumlarda bile belirgin performans artışlarına neden olurken, düğüm seçme yöntemlerinin komşuluk sayısı çok olduğu durumlarda oluşan gürültülü ilişkilerden veri kümesini kurtararak çok az sayıda düğüm seçildiği durumlarda bile performansı arttırdığı görülmüştür. Ayrıca geliştirilen öznitelik zenginleştirme yönteminin içerik tabanlı sınıflandırıcıların performanslarını kolektif sınıflandırma yöntemlerinin performanslarına yakınlaştırdığı hatta bazı deneylerde geçtiği gözlenmiştir.
In this study, effects of using feature and node selection methods are examined with collective classification algorithms on network data with normal and enriched content to show how much improvement can be made on these classification method’s performances. mRMR and proposed FCBF# methods are used for feature selection while for node selection, some new approaches, such as degree based, neighborhood consistency, are proposed and their results were compared. Experiments showed that using feature and node selection methods on datasets with network structure increases homophily and autocorrelation therefore performances of collective classification algorithms can be increased using selection methods. Feature selection methods improve classification results significantly not only with noisy features also with non-noisy content information. In network structures with too many noisy links, node selection methods decrease the noise by eliminating noisy nodes and even when using low number of nodes, an improvement on performance of classification is achieved. In addition, it is shown that proposed feature enrichment method increases content only classification performances and makes them perform as much as collective classification algorithms.
Description: Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2010
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2010
URI: http://hdl.handle.net/11527/366
Appears in Collections:Bilgisayar Mühendisliği Lisansüstü Programı - Yüksek Lisans

Files in This Item:
File Description SizeFormat 
10642.pdf1.44 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.