Yönlü Bağlantılar, Öznitelik Zenginleştirme Ve Sınıflandırıcı Birleştirme Ile Kolektif Sınıflandırma Başarımının İyileştirilmesi

dc.contributor.advisorÇataltepe, Zehra
dc.contributor.authorSönmez, Abdullah
dc.contributor.authorID10036060
dc.contributor.departmentBilgisayar Mühendisliği
dc.contributor.departmentComputer Engineering
dc.date2014
dc.date.accessioned2014-05-26
dc.date.accessioned2015-04-08T11:50:00Z
dc.date.available2015-04-08T11:50:00Z
dc.date.issued2014-05-29
dc.descriptionTez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2014
dc.descriptionThesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2014
dc.description.abstractBu çalışmada, ağ bilgisi olan veri kümelerinde sınıflandırma başarımının arttırılması amacıyla bir dizi çalışma gerçekleştirilmiştir. Öncelikle çizge özellikleri ve çizge özellikleri arasındaki ilişkiler irdelenmiştir. Bu kapsamda literatürde yer alan çizge özelliklerine ek olarak, eğitim kümesindeki komşuların ortalama homofilisi ve başarımı gibi yeni çizge özellikleri de kullanılmıştır. Çizge özelliklerinin birbirleri ile ilişkileri görselleştirilmiş ve aralarındaki korelasyonlar hesaplanmıştır. Sonrasında içerik ve bağlantılar için ayrı sınıflandırıcıların eğitilmesi ve genetik algoritma tabanlı bir seçme algoritması ile bu heterojen sınıflandırıcıların birleştirilmesine yönelik yeni bir algoritma tanıtılmıştır. Tanıtılan bu yeni yöntem ile kullanılan bütün veri kümelerinde en iyi baz sınıflandırıcının başarımından daha yüksek başarım elde edilmiştir. Bundan sonra kolektif sınıflandırmada yön bilgisinin kullanılmasının sınıflandırıcı başarımı üzerine etkisi araştırılmıştır. Yön bilgisinin kullanılması ile özellikle ilişkisel sınıflandırıcının başarımında ciddi bir artış kaydedilmiştir, ayrıca kolektif sınıflandırma başarımında da bir miktar artış görülmüştür. Ardından kolektif sınıflandırma için farklı nitelik zenginleştirme ve seçme yöntemleri araştırılmıştır. Zenginleştirilmiş niteliklerle gerçekleştirilen sınıflandırmada elde edilen başarımın, orijinal özniteliklerle gerçekleştirilen içerik sınıflandırma ve kolektif sınıflandırma ile elde edilen başarımdan çok daha yüksek olduğu gösterilmiştir. Son olarak da sınıf homofilileri heterojen, çoklu sınıflı veri kümeleri üzerinde bire-karşı-hepsi metodunun kolektif sınıflandırmada kullanılabilmesi için yeni bir algoritma tanıtılmıştır. Bire-karşı-hepsi sınıflandırma ile elde edilen sonuçların hem içerik sınıflandırıcısında hem de kolektif sınıflandırmada elde edilen sonuçlardan daha iyi olduğu gösterilmiştir.
dc.description.abstractIn this study, with the purpose of improving test classification accuracy, a number of different directions for collective classification are investigated. First of all, graph properties and their correlations are investigated. Not only the graph properties existing in the literature are used, but also some new graph properties such the average homophily and classifier accuracy on the training set neighbors of a node. Visualization of these properties with respect to each other and correlations between graph properties are presented. Next, a new method for training separate classifiers for content and link views and combining these heterogeneous classifiers with a genetic algorithm based selection algorithm, is introduced. The experiments on the datasets used show that the proposed method outperforms best of the base classifiers. Next, the effect of using link direction information on collective classification performance is explored. It has been shown that by using directed graphs, significant performance increase is obtained when link only classifier is used. This useful information also results in better accuracies for collective classification. Different feature enrichment and selection methods for collective classification are also investigated. Experimental results on three different network datasets show that classification accuracies obtained using network enriched and selected features are comparable or better than content only or collective classification. At last, a new algorithm for utilization of one against all collective classification for multi-class datasets with heterogeneous class homophilies is introduced. Experimental results show that one-against-all content only and collective classification is better than single classifier content only and collective classification.
dc.description.degreeDoktora
dc.description.degreePhD
dc.identifier.urihttp://hdl.handle.net/11527/541
dc.publisherFen Bilimleri Enstitüsü
dc.publisherInstitute of Science and Technology
dc.rightsİTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.
dc.rightsİTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.
dc.subjectÇizge özellikleri
dc.subjectKolektif sınıflandırma
dc.subjectİlişkisel sınıflandırma
dc.subjectHeterojen sınıflandırıcı birleştirme
dc.subjectYönlü kolektif sınıflandırma
dc.subjectÖznitelik zenginleştirme
dc.subjectBire-karşı-hepsi kolektif sınıflandırma.
dc.subjectGraph properties
dc.subjectCollective classification
dc.subjectRelational classification
dc.subjectHeterogeneous classifier combination
dc.subjectDirected collective classification
dc.subjectFeature Enrichment
dc.subjectOne-against-all collective classification.
dc.titleYönlü Bağlantılar, Öznitelik Zenginleştirme Ve Sınıflandırıcı Birleştirme Ile Kolektif Sınıflandırma Başarımının İyileştirilmesi
dc.title.alternativeImproving Collective Classification By Incorporating Directed Links, Feature Enrichment And Classifier Combination
dc.typeDoctoral Thesis

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
Ad:
14489.pdf
Boyut:
7.21 MB
Format:
Adobe Portable Document Format

Lisanslı seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
Ad:
license.txt
Boyut:
3.14 KB
Format:
Plain Text
Açıklama