Enriching item feature representations in session-based recommendation with global item graphs
Enriching item feature representations in session-based recommendation with global item graphs
dc.contributor.advisor | Gündüz Öğüdücü, Şule | |
dc.contributor.author | Karatepe, Yunus | |
dc.contributor.authorID | 504221536 | |
dc.contributor.department | Computer Engineering | |
dc.date.accessioned | 2025-08-22T13:11:34Z | |
dc.date.available | 2025-08-22T13:11:34Z | |
dc.date.issued | 2025-07-01 | |
dc.description | Thesis (M.Sc.) -- Istanbul Technical University, Graduate School, 2025 | |
dc.description.abstract | With the advancements in artificial intelligence (AI), many industries that rely on human interaction have begun to utilize these powerful AI models. E-commerce stands out as one of the industries where modeling customer behavior is crucial. In e-commerce, it is very important to recommend items that will attract customers' attention and result in their purchase. A user's shopping experience is significantly influenced by how efficiently they can discover items that align with their preferences within a given time period. There may be different types of shopping behaviors that can create the need for different types of recommendation models. Hence, there are several types of recommender systems: Collaborative Filtering, Content-Based Filtering, and Hybrid Systems that utilize both approaches. Collaborative filtering methods predict users' interests by analyzing preferences from multiple users. It operates under the assumption that users who have liked similar things will continue to like similar things in the future. Content-based filtering methods, however, analyze items and item features, then match them to the user's profile and make recommendations. It builds a profile for each user based on the features of items they have interacted with and suggests new items with similar characteristics. In addition, various types of recommender systems have been developed to accommodate different data characteristics and application requirements. Session-Based Recommender Systems (SBRS) represent one of the most popular subtypes of recommender systems, focusing specifically on a short period of user interactions to generate recommendations. Unlike traditional methods such as collaborative and content-based filtering, which primarily rely on long-term historical user and item data, SBRS are designed to capture short-term, dynamic user preferences that emerge during a specific session. This approach proves especially beneficial in scenarios where historical user data is lacking or where user preferences are rapidly shifting. By focusing solely on the sequence and context of user actions in a session, SBRS can provide more relevant recommendations, enhancing the overall user experience. SBRS are particularly prevalent in e-commerce platforms, where users often interact with items over short periods. In today's fast-paced digital environment, user interests can change rapidly, and the relevance of historical data may diminish quickly. For instance, consider a user who logs into an e-commerce application and purchases a mobile phone after viewing several related items. Post-purchase, the user's interest in mobile phones may wane, rendering past interaction data less effective for future recommendations. Traditional recommendation methods, which rely heavily on long-term user profiles, might not adapt swiftly to such shifts in user intent. In contrast, SBRS focus on the user's current session, capturing immediate preferences and providing timely, context-aware recommendations that align with the user's interests. Although SBRS appear to be the best system for modeling short-term user interests, they have their limitations, including the cold start problem and limited item diversity. The cold-start problem arises when a model lacks adequate historical data, limiting its ability to learn effectively and generate accurate recommendations. Additionally, limited item diversity often emerges as models tend to favor popular items, resulting in repetitive recommendations and a lack of variety. To deal with these problems, graph-based recommender systems or SBRS that leverage graph structures have been introduced. In this study, we introduce a novel approach to enhance SBRS by enriching item representations through graph-based aggregation techniques and storing this information in the item's feature vector. The core idea is to capture and embed item-item relationships directly into the feature vectors of individual items, thereby incorporating contextual information derived from their interactions within the item network. By constructing an item graph where nodes represent items and edges represent relationships, we apply graph aggregation methods to enrich items' features for each item. This process enables each item to incorporate information coming from its neighborhood. Such enriched representations are particularly beneficial for items with limited interaction data, commonly referred to as "cold items.". Integrating these enriched item feature vectors into the SBRS aims to improve recommendation accuracy for tested models: Session-based Recommendation with Graph Neural Networks (SR-GNN) and Long-Short Term Memory (LSTM), especially in sessions involving cold items. By providing a more comprehensive understanding of each item's context within the broader item network, the system can generate more relevant and personalized recommendations, enhancing the overall user experience. Experiments are conducted on the Dressipi 2022 Dataset, which is mainly used in the past for the RecSys2022 Challenge. Experimental evaluations show that the proposed method is improving overall recommendation accuracy for both SR-GNN and LSTM models. Beyond overall recommendation accuracy, the proposed feature enrichment technique significantly improves the performance of SR-GNN on cold sessions (sessions that contain cold-unpopular items). Looking ahead, there are several promising directions to further explore the impact of our feature enrichment approach. One area involves applying this method across various recommendation models, such as collaborative filtering, content-based filtering, and hybrid systems. Each model type may uniquely benefit from enriched item representations, potentially leading to improved recommendation accuracy. Additionally, evaluating the effectiveness of our approach on diverse datasets would help measure its generalizability and robustness. Another avenue worth investigating is the integration strategy of the enriched features. Rather than embedding them directly into the feature vector of the item, there may be other, perhaps better, ways to store them. In conclusion, SBRS are crucial for e-commerce, offering the best possible methods to represent and model customer behavior in various ways. Several problems, such as cold start and limited item diversity, still exist, but there are different methods to tackle those challenges. Utilizing graphs is one of the most common approaches that addresses the cold start problem. One promising solution involves leveraging graph-based methods to enrich item representations. By incorporating contextual information from item-item relationships, these approaches can enhance the representation of less popular or new items, thereby improving recommendation quality in sessions involving such items. Continued advancements in both SBRS and graph-based techniques are expected to further enhance recommendation systems. This progress will contribute to more personalized and satisfying shopping experiences for users, ultimately benefiting both consumers and e-commerce platforms. | |
dc.description.abstract | Yapay Zeka alanındaki hızlı gelişmelerle birlikte, insanlarla doğrudan etkileşim içerisinde bulunan birçok sektör, bu güçlü teknolojilerden yoğun şekilde faydalanmaya başlamıştır. Bu sektörler arasında, kullanıcı davranışlarının doğru bir şekilde modellenmesinin büyük önem taşıdığı e-ticaret sektörü öne çıkmaktadır. E-ticaret uygulamalarında, müşterilerin ilgisini çekecek ve satın alma ile sonuçlanabilecek ürünlerin önerilmesi, kullanıcı memnuniyetini artırmanın ve satışları iyileştirmenin temel yollarından biridir. Bir kullanıcının alışveriş deneyimi, belirli bir zaman dilimi içerisinde ilgi alanlarına uygun ürünleri ne kadar hızlı ve etkili keşfedebildiğiyle doğrudan ilişkilidir. Farklı kullanıcıların farklı alışveriş alışkanlıklarına sahip olması, öneri sistemlerinin de çeşitlenmesine neden olmuştur. Bu nedenle, öneri sistemleri veri yapısına ve kullanım senaryolarına bağlı olarak farklı gruplara ayrılmaktadır. Başlıca üç ana türden söz edilebilir: İşbirlikçi Filtreleme (Collaborative Filtering), İçerik Tabanlı Filtreleme (Content-Based Filtering) ve bu iki yaklaşımı birleştiren, her iki tarafın da kuvvetli yönlerini kullanan Hibrit Sistemler. İşbirlikçi filtreleme yöntemleri, bir kullanıcının tercihlerini, benzer geçmiş etkileşimlere sahip diğer kullanıcıların tercihlerine göre tahmin eder. Bu yöntem, kullanıcıların geçmişte benzer ürünleri beğendiği varsayımına dayanarak gelecekte de benzer ürünleri tercih edeceğini öngörür. Bir diğer taraftan, içerik tabanlı filtreleme yöntemleri, ürünlerin içerik özelliklerini analiz ederek kullanıcının geçmişte ilgilendiği ürünlerle benzer özelliklere sahip yeni ürünleri önermeye odaklanır. Bu yöntem, her kullanıcı için özelleştirilmiş bir profil oluşturarak, benzer nitelikteki ürünleri belirlemeye çalışır. Farklı veri yapıları ve uygulama ihtiyaçları doğrultusunda bu yöntemlere ek olarak daha birçok öneri sistemi çeşidi de geliştirilmiştir. Bu bağlamda, Oturum Tabanlı Öneri Sistemleri (Session-Based Recommender Systems, SBRS), özellikle son yıllarda büyük ilgi gören ve kısa süreli kullanıcı etkileşimlerinden öneriler üretmeye odaklanan sistemlerdir. Geleneksel yöntemler çoğunlukla kullanıcıların uzun vadeli geçmiş verilerine ihtiyaç duymaktadır. Ancak SBRS, kullanıcının mevcut oturumundaki davranışları temel alarak anlık ilgi alanlarını tespit etmeyi hedefler. Bu özellikleri sayesinde, kullanıcı geçmiş verisinin bulunmadığı ya da kullanıcı tercihlerinin hızlıca değiştiği durumlarda önemli avantajlar sunar. SBRS, kullanıcının bir oturum içinde gerçekleştirdiği işlem sırası ve işlem bağlamı gibi unsurları dikkate alarak daha alakalı, zamana duyarlı ve kullanıcının o anlık isteklerine odaklı öneriler üretme potansiyeline sahiptir. Bu sayede, günümüzde çevrimiçi alış-verişin epeyce yaygın olduğu ve kullanıcı isteklerinin çok hızlı değiştiği düşünüldüğünde, e-ticaret için muazzam bir öneme sahiptir. Günümüzde, özellikle mobil uygulamalar ve web tabanlı alışveriş platformlarında, kullanıcıların ürünlerle etkileşimleri çoğunlukla kısa süreli oturumlar şeklinde gerçekleşmektedir. Bu kısa oturumlar sırasında, kullanıcının ilgi alanları hızla değişebilir ve bu da geleneksel sistemlerin yeterince esnek olamamasına, kullanıcının anlık isteklerine yönelik öneriler yapılamamasına neden olur. Örneğin, bir kullanıcı birkaç cep telefonu inceleyip bir tanesini satın aldıktan sonra, sonraki oturumlarında cep telefonlarına olan ilgisini kaybedebilir. Bu gibi durumlarda, geçmiş verilere dayanan öneri sistemleri güncel kullanıcı ihtiyacını doğru şekilde yansıtamayabilir. Buna karşın SBRS, kullanıcının o anki etkileşimlerine odaklandığı için güncel ihtiyaçlara daha uygun öneriler sunabilir. Her ne kadar SBRS kısa vadeli kullanıcı tercihlerinin modellenmesinde oldukça başarılı olsa da, bazı sınırlamaları da beraberinde getirir. Bu sınırlamaların başında, soğuk başlangıç (cold-start) problemi ve sınırlı ürün çeşitliliği gelmektedir. Soğuk başlangıç problemi, hakkında yeterli geçmiş etkileşim verisi bulunmayan ürünlerin (veya kullanıcıların) doğru şekilde önerilememesi durumudur. Bu durum, özellikle yeni eklenen ürünlerin sistem tarafından göz ardı edilmesine neden olabilir. Sınırlı ürün çeşitliliği problemi ise, öneri sistemlerinin sıklıkla popüler ürünleri önermesi sonucunda oluşur; bu da kullanıcıya sunulan seçeneklerin çeşitliliğini azaltır. Bu tür zorluklarla başa çıkmak amacıyla, çizge tabanlı yapılar kullanılarak geliştirilen öneri sistemleri ön plana çıkmıştır. Bu sistemler, ürünler arası ilişkileri daha iyi modelleme kapasitesine sahiptir. Bu çalışmada, SBRS performansını artırmak amacıyla, ürün temsillerinin çizge tabanlı bilgi toplama (aggregation) yöntemleri ile zenginleştirilmesi önerilmektedir. Önerilen yöntemde, ürünler arası ilişkileri içeren bir ürün grafiği oluşturularak, her ürün düğümünün komşularından bağlamsal bilgi edinmesi sağlanır. Elde edilen bu bilgilerin her ürünün özellik vektörüne entegre edilmesiyle, zenginleştirilmiş temsil vektörleri elde edilir. Bu vektörler, özellikle geçmiş etkileşim verisi az olan "soğuk ürünler" için anlamlı katkılar sağlar. Bu yöntem, sadece öneri doğruluğunu değil, aynı zamanda öneri çeşitliliğini de artırma potansiyeline sahiptir. Çalışmada geliştirilen bu zenginleştirilmiş ürün vektörleri, oturum tabanlı öneri sistemlerinde sıklıkla kullanılan iki farklı mimariye entegre edilmiştir: Grafik Sinir Ağlarıyla Oturum Tabanlı Öneri (Session-based Recommendation with Graph Neural Networks, SR-GNN) ve Uzun Kısa Süreli Bellek (Long Short-Term Memory, LSTM). Özellikle soğuk ürün içeren oturumlar gibi zorlu senaryolarda, öneri doğruluğunu artırmak hedeflenmiştir. Ürünlerin daha geniş bir bağlamda temsil edilmesiyle, sistemin hem genel doğruluğu artmakta hem de kişiselleştirme kapasitesi gelişmektedir. Deneyler, RecSys2022 Challenge kapsamında da kullanılan gerçek dünya e-ticaret verilerinden oluşan Dressipi 2022 veri seti üzerinde gerçekleştirilmiştir. Bu veri seti 1.1 milyon adet kullanıcı oturumlarından oluşmaktadır. Veri seti kendi içerisinde etiketlendirilmiş: 1 milyon adet oturum eğitim verisi, 100 bin adet oturum ise 2 farklı test verisi olarak işaretlenmiştir. Test verilerin kendi içerisinde ikiye bölünmüş, bunlardan bir tanesi yarışma kapsamında katılımcılara sağlanmış, diğer test veri seti ise gizli tutulmuştur. Yarışma sonlandığında ise tüm veriler paylaşılmıştır. Bu çalışmada eğitim verisini tamamının kullanımının, yalnızca en güncel belirli bir bölümünü kullanımına kıyasla daha başarısız sonuç verdiği gözlemlenmiştir. Son 2, 3 ve 4 aylık periyotlar kullanılarak yapılan testler sonucunda en güncel son 3 aylık eğitim verisinin kullanımına karar verilmiştir. Çalışmada başarı değerlendirmesi için yaygın olarak kullanılan ölçütlerden biri olan Mean Reciprocal Ranking (MRR) metriği tercih edilmiştir. Değerlendirme sürecinde, kullanıcıya sunulan öneri listesinin ilk kaç öğesi içerisinde doğru ürünün yer aldığını analiz edebilmek amacıyla, MRR hesaplamalarında kesim noktaları 20 ve 100 olarak belirlenmiştir (MRR@20, MRR@100). Bu sayede, hem kısa liste önerilerinin (top-20) hem de daha geniş öneri listelerinin (top-100) başarımı ayrı ayrı analiz edilmiştir. SR-GNN modelinin MRR@20 başarısı, önerilen varlık özellik vektörü zenginleştirmesi ile, 0.16968'dan 0.17144'e kadar artırılabilirken, MRR@100 başarısı 0.17360'tan 0.175356'a kadar artırılabilmiştir. Aynı şekilde LSTM mimarisi için de incelendiğinde başarılar MRR@20 için, 0.16421'den 0.16506'ya kadar, MRR@100 için ise 0.16816'dan 0.16903'e kadar artırılabilmiştir. Soğuk oturumlar üzerinde SR-GNN mimarisinde elde edilen başarı artışının LSTM mimarisine kıyasla çok daha net ve fazla olduğu gözlemlenmiştir. Özet olarak, yapılan kapsamlı deneysel analizler, önerilen yöntemin hem SR-GNN hem de LSTM modellerinde genel öneri doğruluğunu artırdığını göstermektedir. Bununla birlikte, özellikle soğuk ürünler içeren oturumlarda SR-GNN mimarisinin başarımında daha net bir artış gözlemlenmiştir. LSTM mimarisinde ise genel başarıda anlamlı bir miktarda artış gözlenirken soğuk oturumlar üzerinde gözlemlenen artış SR-GNN mimarisine kıyasla daha az olarak bulunmuştur. Bu sonuçlar, çizge tabanlı zenginleştirmenin özellikle çizge mimarilerle bütünleştiğinde daha da etkili olduğunu göstermektedir. Gelecekteki çalışmalar için önerilen yöntemin farklı öneri sistemlerine entegre edilmesi değerlendirilebilir. Özellikle içerik tabanlı veya hibrit sistemlerle birlikte kullanıldığında, zenginleştirilmiş ürün temsillerinin katkısı daha da belirgin hâle gelebilir. Ayrıca, farklı veri setlerinde yapılan deneyler sayesinde yöntemin genellenebilirliği ve dayanıklılığı test edilebilir. Bu bağlamda, özellik zenginleştirme sürecinde kullanılan entegrasyon stratejilerinin çeşitlendirilmesi ve alternatif yöntemlerin araştırılması da gelecek çalışmalar için anlamlı bir araştırma alanı sunmaktadır. Sonuç olarak, oturum tabanlı öneri sistemleri, e-ticaret uygulamalarında kullanıcı davranışlarını doğru modelleyebilmek adına son derece önemli bir rol oynamaktadır. Bu sistemlerin sahip olduğu sınırlamaları aşmak adına çizge tabanlı zenginleştirme yaklaşımları etkili ve umut vadeden bir çözüm sunmaktadır. Ürünler arası ilişkilerden elde edilen bağlamsal bilginin ürün temsillerine entegre edilmesiyle, öneri kalitesi özellikle az etkileşimli ürünler için önemli ölçüde artırılabilmektedir. SBRS ve çizge tabanlı tekniklerdeki ilerlemeler, hem kullanıcı memnuniyetini artırmakta hem de e-ticaret platformları için daha yüksek etkileşim ve dönüşüm oranları sağlamaktadır. | |
dc.description.degree | M.Sc. | |
dc.identifier.uri | http://hdl.handle.net/11527/27630 | |
dc.language.iso | en | |
dc.publisher | ITU Graduate School | |
dc.sdg.type | Goal 9: Industry, Innovation and Infrastructure | |
dc.subject | bilgisayar bilimleri | |
dc.subject | computer sciences | |
dc.subject | oturum tabanlı öneri sistemleri | |
dc.subject | session-based recommender systems | |
dc.title | Enriching item feature representations in session-based recommendation with global item graphs | |
dc.title.alternative | Oturum tabanlı öneri sistemlerinde evrensel varlık çizgesi ile varlık özellik vektörlerinin zenginleştirilmesi | |
dc.type | Master Thesis |