Kararlı Ve Başarımı Yüksek Öznitelik Seçimi

dc.contributor.advisorÇataltepe, Zehra
dc.contributor.authorGülgezen, Gökhan
dc.contributor.departmentBilgisayar Mühendisliği
dc.contributor.departmentComputer Engineering
dc.date2009
dc.date.accessioned2009-06-19
dc.date.accessioned2015-04-07T13:59:29Z
dc.date.available2015-04-07T13:59:29Z
dc.date.issued2009-06-19
dc.descriptionTez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2009
dc.descriptionThesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2009
dc.description.abstractBu çalışmada, öncelikle MRMR (Minimum Redundancy Maximum Relevance) ve FCBF (Fast Correlation-Based Filter) öznitelik seçme algoritmaları tanıtılarak başarım yönünden karşılaştırılmaları yapılmıştır. Ardından iki öznitelik kümesi arasındaki kararlılık değerini ölçen yeni bir kararlılık ölçütü ortaya konulmuştur. MRMR algoritmasının kullandığı iki seçim kriteri olan MID (Mutual Information Difference) ve MIQ (Mutual Information Quotinent) yöntemleri hem başarım hem de kararlılık yönünden karşılaştırılmıştır. Bu iki metodun başarım yönünden yakın sonuçlar verdiği görülmüştür. Diğer taraftan özellikle küçük veri kümeleri için MID yöntemi MIQ yöntemine göre daha kararlı öznitelik kümeleri ile sonuçlanmıştır. MID yönteminin neden daha kararlı bir öznitelik seçim kriteri olduğu teorik olarak ortaya konulmaya çalışılmış ve bu sav deneysel olarak desteklenmiştir. Ayrıca eğitim veri kümelerinin örnek sayısını azaltarak öznitelik seçme algoritmalarının kararlılığını ve başarımını ölçen bir deneysel metodoloji modeli sunulmuştur. MRMR algoritması için, özniteliklerin sınıf etiketleri ile ilişkisinin ve öznitelik artıklığının öznitelik seçimindeki etkisini bir parametre yardımıyla kontrol eden yeni bir seçim kriteri, ortaya konularak değişik parametre değerleri için farklı veri kümelerinde yeni seçim kriterinin kararlılık ve başarım değerleri gözlenmiştir. Yeni seçim kriteri ile öznitelik seçiminde kararlılığın kontrol edilebileceği deneysel olarak gösterilmiştir.
dc.description.abstractIn this study, firstly MRMR (Minimum Redundancy Maximum Relevance) and FCBF (Fast Correlation-Based Filter) feature selection algorithms are presented and compared to each other according to accuracy. Afterwards a new stability measure that can measure the stability between two sets of features is introduced. The two feature evaluation methods within MRMR, MID (Mutual Information Difference) and MIQ (Mutual Information Quotinent) are compared both in stability and accuracy. These two methods result in features with similar accuracy. On the other hand, especially for small data sets, MID results in more stable feature sets than MIQ. Theoretical explanation for why MID is a better cirteria for small sample size is given and it is supported with experimental test results. A new experimental model is also introduced in order to measure the accuracy and the stability of a feature selection algoritm for the case of a reduction of training samples. A new feature selection criterion where redundancy and relevance of selected features are controlled by parameter is presented and using the predefined model, its accuracy and stability values are obtained for different parameter values for various datasets. It is empirically shown that stability of feature selection can be controlled using new criterion.
dc.description.degreeYüksek Lisans
dc.description.degreeM.Sc.
dc.identifier.urihttp://hdl.handle.net/11527/333
dc.publisherFen Bilimleri Enstitüsü
dc.publisherInstitute of Science and Technology
dc.rightsİTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.
dc.rightsİTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.
dc.subjectöznitelik seçimi
dc.subjectkararlılık
dc.subjectmrmr algoritması
dc.subjectfcbf algoritması
dc.subjectfeature selection
dc.subjectstability
dc.subjectmrmr algorithm
dc.subjectfcbf algorithm
dc.titleKararlı Ve Başarımı Yüksek Öznitelik Seçimi
dc.title.alternativeStable And Accurate Feature Selection
dc.typeMaster Thesis

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
Ad:
9441.pdf
Boyut:
5.21 MB
Format:
Adobe Portable Document Format

Lisanslı seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
Ad:
license.txt
Boyut:
3.14 KB
Format:
Plain Text
Açıklama