Veri Madenciliğin Ve Demetleme

thumbnail.default.alt
Tarih
Yazarlar
Tantuğ, A. Cüneyd
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Bu yüksek lisans tezinde, veri madenciliğinde kullanılan teknikler incelenmiş ve özellikle demetleme tekniklerinin ayrıntılı irdelenmesi yapılmıştır. Daha sonra uygulama anlamında yapılan çalışmada çok büyük boyutlarda örüntü kümeleri üzerinde demetleme işlemini gerçekleştirmek üzere algoritmaya yardımcı olacak bazı iyileştirmeler gerçeklenmiştir. Demetlenecek verileri esnek, verimli ve bellek karmaşıklığını azaltacak şekilde ana bellek içerisinde saklayan bir çerçeve veri yapısı tasarlanmıştır. Bu yapıya blok mekanizması, takas yönetimi ve çerçeve bellek kullanımını gerçekleyen bir bellek yönetim sistemi de eklenmiştir. Ayrıca algoritmanın kategorik ve karakter katarı tipindeki verileri de demetleme yaparken kullanabilmesine destek sağlanmıştır. Bu mimari üzerinde K-Means algoritması gerçeklenmiştir. Sonuçta çok büyük veriler üzerinde bile demetleme yapabilen, esnek ve bellek karmaşıklığı çok düşük bir mimariye sahip olan bir yazılım geliştirilmiştir.
In this thesis, the techniques used in data mining are examined. Especially clustering in data mining is widely investigated. Some modifications has been made to the clustering algorithms to make space complexity of these algorithms smaller by an efficient and flexible way, especially while working with large data sets. A memory management system is provided in order to maximize the efficiency of memory usage and fastening the algorithms. This memory management system has block mechanism that supports swapping of blocks and frame block usage. In addition to these, the support for categorical data types and string clustering is added to the application. As a result, a software that has a template based data structure that can easily be used by all data mining techniques eventhough while dealing with very large data sets is developed. In this software K-Means algorithm is implemented as an instance of data mining algorithm.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2002
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2002
Anahtar kelimeler
Veri madenciliği, demetleme, K-Means, Data mining, clustering, K-Means
Alıntı