Sosyal Kaynak Paylaşım Siteleri İçin Üç Parçalı Çizge Demetleme Yöntemi İle Öneri Üretme

thumbnail.default.alt
Tarih
2012-05-23
Yazarlar
Üstünbaş, Yonca
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Web 2.0 ile gelen uygulama alanlarından biri de sosyal kaynak paylaşım sistemleridir. Bu sistemlerin bir kısmı hiyerarşilerle karşılaştırıldığında aşağıdan yukarı bir sınıflandırma tekniği olan etiketleme yaklaşımını kullanır. Etiketleme, bir bilgi parçasınına kişisel olarak seçilmiş bir anahtar kelimenin atanması işlemidir. Bu yaklaşım zaman içinde popülerleşti ve Web 2.0‟ın en önemli özelliklerinden biri haline geldi. Yüz milyonlarca insanın bu yaklaşımı benimseyip kullanması sonucunda bu sistemler folksonomi adı verilen yeni bir bilgi temsil sistemi yaratmış oldular. Öneri araçları, insanlara ilgilenme ihtimalleri yüksek olan seçenekler sağlayarak karar verme aşamasında fayda sağlar. Farklı araştırma alanlarında pek çok değişik konu, teknik ve method kullanan öneri modelleri geliştirilmiştir. Folksonomilerden çıkartılan bilginin içeriği ve yapısı, öneri modelleri için kaynak olarak kullanılmaya uygundur. Bir sosyal etiketleme sistemindeki kullanıcının bir kaynağı bir anahtar kelime ile etiketlemesi ile kullanıcı, kaynak ve etiket arasında üçparçalı bir ilişki kurulmuş olur. Daha fazla insanın aynı kaynakları farklı kelimler ile etiketlemesi sonucunda oluşan üçparçalı ilişkilerin oluşturduğu ağ yapısı, öneri üretmekte kullanılabilecek değerli bilgiyi içerir. Bu ağın üç parçalı olarak demetlenmesi, bir öneri sisteminin, veri seti içindeki doğal gruplaşmaları anlamasını, farklı ve benzer olanları tanımlayabilmesini ve bu bilgi ile modelini eğitebilmesini sağlar. Bu çalışmada, kullanıcı, kaynak ve etiketlerin demet bilgilerinin eşzamanlı edinimini sağlayan üç parçalı demetle algortiması gerçekledik. Bu algoritmayı kullanarak elde ettiğimiz bilgi, öneri modelimizin hem Web sitesi öneriminde hem de etiket öneriminde kullanılmasına olanak verdi. Gerçeklenen sistemin en popüler etiketleme sistemlerinden biri olan Delicious‟tan alınan veri seti üzerinde deneyleri yapıldı ve sonuçlar iki parçalı demetleme ile elde edilen sonuçlarla karşılaştırılarak değerlendirildi. Bir öneri modeli için üç parçalı verinin eşzamanlı olarak demetlenmesi, demet içeriklerine farklı bir bilgiyi daha katarak karar verdiği için, ikililerin iki parçalı demetlenmesi ile elde edilenden daha fazla faydalı bilgi sağladı. Deney sonuçları, Web sayfası öneriminde üç parçalı yapının iki parçalı yapıya göre daha iyi kesinlik sonuçlarına ulaşmasının yanında, öneri modelinin kullanıcı için tag önerimi de yapmasına olanak tanıyacak faydalı bilgiyi içerdiğini göstermiştir.
One of the applications of Web 2.0 is social resource sharing systems. Some of these systems are using tagging approach, which is a kind of bottom-up classification technique when compared to hierarchies. Tagging is the term for assigning a personally chosen keyword to a piece of information. This approach has been popularized and has become an important feature of Web 2.0 Web. When hundreds of millions of users used this approach, these systems resulted with a knowledge representation called folksonomy. The term “folksonomy” describes a classification system derived from the practice and a method of collaboratively creating and managing tags to annotate and categorize content. Recommendation engines help people to make decisions by providing options which the user may be interested in. Different recommendation systems use various methods, concepts and techniques from different research areas. The content and structure information extracted from folksonomies, makes it a good candidate for recommendation models. When a social tagging system allows a user to bookmark a resource with a specific keyword, a tripartite relationship is built among user, resource and the keyword. As more people tag the same resources with different keywords, the resulting network of these tripartite relations, provides valuable information for generating recommendations. Tripartite clustering of this network, helps a recommendation system to understand the natural grouping in the dataset and enables it to identify the similar and different ones, so that, it can use this knowledge while training the model. In this study, we implemented a web-based recommender system that uses a tripartite clustering algorithm for synchronous retrieval of cluster information of users, tags and resources. Resulting information of this algorithm enables our recommendation engine to make both Web page recommendations and tag recommendations. The implemented model is experimented with a real dataset, which is gathered from one of the most popular social bookmarking systems, Delicious and results are evaluated by comparing to bipartite clustering. Simultaneous clustering of tripartite structured data provides more useful information for a recommender system, than bipartite clustering of the pairs, because of deciding the cluster contents with one more, different type of information source. Experiments show that tripartite clustering for Web recommendation outperforms bipartite clustering and it provides more information to let our engine making tag recommendations for the user.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2011
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2011
Anahtar kelimeler
veri madenciliği, öneri modelleri, sosyal kaynak paylaşım sistemleri, data mining, web mining, folksonomy mining, recommender, social resource sharing system
Alıntı