Yönlü Bağlantılar, Öznitelik Zenginleştirme Ve Sınıflandırıcı Birleştirme Ile Kolektif Sınıflandırma Başarımının İyileştirilmesi

dc.contributor.advisor Çataltepe, Zehra tr_TR
dc.contributor.author Sönmez, Abdullah tr_TR
dc.contributor.authorID 10036060 tr_TR
dc.contributor.department Bilgisayar Mühendisliği tr_TR
dc.contributor.department Computer Engineering en_US
dc.date 2014 tr_TR
dc.date.accessioned 2014-05-26 tr_TR
dc.date.accessioned 2015-04-08T11:50:00Z
dc.date.available 2015-04-08T11:50:00Z
dc.date.issued 2014-05-29 tr_TR
dc.description Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2014 tr_TR
dc.description Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2014 en_US
dc.description.abstract Bu çalışmada, ağ bilgisi olan veri kümelerinde sınıflandırma başarımının arttırılması amacıyla bir dizi çalışma gerçekleştirilmiştir. Öncelikle çizge özellikleri ve çizge özellikleri arasındaki ilişkiler irdelenmiştir. Bu kapsamda literatürde yer alan çizge özelliklerine ek olarak, eğitim kümesindeki komşuların ortalama homofilisi ve başarımı gibi yeni çizge özellikleri de kullanılmıştır. Çizge özelliklerinin birbirleri ile ilişkileri görselleştirilmiş ve aralarındaki korelasyonlar hesaplanmıştır. Sonrasında içerik ve bağlantılar için ayrı sınıflandırıcıların eğitilmesi ve genetik algoritma tabanlı bir seçme algoritması ile bu heterojen sınıflandırıcıların birleştirilmesine yönelik yeni bir algoritma tanıtılmıştır. Tanıtılan bu yeni yöntem ile kullanılan bütün veri kümelerinde en iyi baz sınıflandırıcının başarımından daha yüksek başarım elde edilmiştir. Bundan sonra kolektif sınıflandırmada yön bilgisinin kullanılmasının sınıflandırıcı başarımı üzerine etkisi araştırılmıştır. Yön bilgisinin kullanılması ile özellikle ilişkisel sınıflandırıcının başarımında ciddi bir artış kaydedilmiştir, ayrıca kolektif sınıflandırma başarımında da bir miktar artış görülmüştür. Ardından kolektif sınıflandırma için farklı nitelik zenginleştirme ve seçme yöntemleri araştırılmıştır. Zenginleştirilmiş niteliklerle gerçekleştirilen sınıflandırmada elde edilen başarımın, orijinal özniteliklerle gerçekleştirilen içerik sınıflandırma ve kolektif sınıflandırma ile elde edilen başarımdan çok daha yüksek olduğu gösterilmiştir. Son olarak da sınıf homofilileri heterojen, çoklu sınıflı veri kümeleri üzerinde bire-karşı-hepsi metodunun kolektif sınıflandırmada kullanılabilmesi için yeni bir algoritma tanıtılmıştır. Bire-karşı-hepsi sınıflandırma ile elde edilen sonuçların hem içerik sınıflandırıcısında hem de kolektif sınıflandırmada elde edilen sonuçlardan daha iyi olduğu gösterilmiştir. tr_TR
dc.description.abstract In this study, with the purpose of improving test classification accuracy, a number of different directions for collective classification are investigated. First of all, graph properties and their correlations are investigated. Not only the graph properties existing in the literature are used, but also some new graph properties such the average homophily and classifier accuracy on the training set neighbors of a node. Visualization of these properties with respect to each other and correlations between graph properties are presented. Next, a new method for training separate classifiers for content and link views and combining these heterogeneous classifiers with a genetic algorithm based selection algorithm, is introduced. The experiments on the datasets used show that the proposed method outperforms best of the base classifiers. Next, the effect of using link direction information on collective classification performance is explored. It has been shown that by using directed graphs, significant performance increase is obtained when link only classifier is used. This useful information also results in better accuracies for collective classification. Different feature enrichment and selection methods for collective classification are also investigated. Experimental results on three different network datasets show that classification accuracies obtained using network enriched and selected features are comparable or better than content only or collective classification. At last, a new algorithm for utilization of one against all collective classification for multi-class datasets with heterogeneous class homophilies is introduced. Experimental results show that one-against-all content only and collective classification is better than single classifier content only and collective classification. en_US
dc.description.degree Doktora tr_TR
dc.description.degree PhD en_US
dc.identifier.uri http://hdl.handle.net/11527/541
dc.publisher Fen Bilimleri Enstitüsü tr_TR
dc.publisher Institute of Science and Technology en_US
dc.rights İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. tr_TR
dc.rights İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. en_US
dc.subject Çizge özellikleri tr_TR
dc.subject Kolektif sınıflandırma tr_TR
dc.subject İlişkisel sınıflandırma tr_TR
dc.subject Heterojen sınıflandırıcı birleştirme tr_TR
dc.subject Yönlü kolektif sınıflandırma tr_TR
dc.subject Öznitelik zenginleştirme tr_TR
dc.subject Bire-karşı-hepsi kolektif sınıflandırma. tr_TR
dc.subject Graph properties en_US
dc.subject Collective classification en_US
dc.subject Relational classification en_US
dc.subject Heterogeneous classifier combination en_US
dc.subject Directed collective classification en_US
dc.subject Feature Enrichment en_US
dc.subject One-against-all collective classification. en_US
dc.title Yönlü Bağlantılar, Öznitelik Zenginleştirme Ve Sınıflandırıcı Birleştirme Ile Kolektif Sınıflandırma Başarımının İyileştirilmesi tr_TR
dc.title.alternative Improving Collective Classification By Incorporating Directed Links, Feature Enrichment And Classifier Combination en_US
dc.type Thesis en_US
dc.type Tez tr_TR
Dosyalar
Orijinal seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.placeholder
Ad:
14489.pdf
Boyut:
7.21 MB
Format:
Adobe Portable Document Format
Açıklama
Lisanslı seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.placeholder
Ad:
license.txt
Boyut:
3.14 KB
Format:
Plain Text
Açıklama