Yükseköğretim kurumlarındaki öğrenci terkini tahmin etmeye yönelik makine öğrenmesi modellerinin incelenmesi ve açıklanabilirliği

Yükleniyor...
Küçük Resim

item.page.authors

Süreli Yayın başlığı

Süreli Yayın ISSN

Cilt Başlığı

Yayınevi

Lisansüstü Eğitim Enstitüsü

Özet

Bu çalışmada, yükseköğretim kurumlarındaki öğrenci terki problemini ele almak amacıyla çeşitli makine öğrenmesi modelleri incelenmiş ve bu modellerin açıklanabilirliği üzerinde durulmuştur. Çalışmada kullanılan veri seti, Tecnologico de Monterrey'den elde edilen 2014-2020 yılları arasındaki 121,584 öğrenciye ait 143,326 kayıt içermektedir. Bu veriler lise-üniversite düzeyi karışık hazırlandığından, sadece 64,641 üniversite öğrencisinin verisi kullanılmıştır. Veri setindeki dengesizlik problemi nedeniyle, SMOTE algoritması kullanılarak veri dengelenmiştir. Çalışmada kullanılan yöntemler arasında gömme teknikleri ve çeşitli makine öğrenmesi algoritmaları bulunmaktadır. Gömme teknikleri kullanılarak öğrenci verisinin temsil gücü arttırılarak tahmin performansına etkisi ölçülmüştür. Kullanılan sınıflandırma algoritmaları arasında Çok Katmanlı Algılayıcı (MLP), Lojistik Regresyon (LR), Karar Ağaçları (DT), K-en Yakın Komşu (KNN), Naïve Bayes (NB), AdaBoost, XGBoost ve Rastgele Orman (RF) yer almaktadır. Bu algoritmalar geçmiş çalışmalarda sıklıkla kullanılan algoritmalar arasından seçilmiştir. Deneysel sonuçlar, gömme teknikleri ile zenginleştirilmiş veri seti ve ham veri seti üzerinde karşılaştırmalı olarak sunulmuştur. Sınıfsal dengesizlik olan veri setlerinde değerlendirme kriteri olarak doğruluğun yanı sıra F1-Skoru ve ROC AUC gibi ölçümlerin modellerin sınıf ayrım kalitesini göstermesi sebebiyle değerlendirme göz önünde bulundurulmuştur. Sonuçlar, XGBoost ve Rastgele Orman (RF) modellerinin hem gömme teknikleri ile zenginleştirilmiş veri seti hem de ham veri seti üzerinde en yüksek performansı gösterdiğini ortaya koymuştur. XGBoost ve RF modelleri için, 5-katlamalı çapraz doğrulama ve test sonuçları detaylı olarak analiz edilmiştir. Modellerin açıklanabilirliğini sağlamak amacıyla, LIME algoritması kullanılmıştır. LIME algoritması, bireysel tahminlerin nedenlerini açıklamak için kullanılmıştır. Açıklanabilirlik, modellerin daha iyi anlaşılmasını ve eğitim süreçlerinin şeffaflığını artırmaktadır. Çalışmanın sonuçları, açıklanabilir makine öğrenmesi algoritmalarının öğrenci terki problemini çözmede etkili olduğunu göstermektedir. Ayrıca gömme tekniği kullanılarak verinin zenginleştirilmesinin ümit vaadettiği görülmektedir. Gelecek çalışmalarda, daha geniş veri setleri ve farklı gömme teknikleri kullanılarak model performansının artırılması hedeflenmektedir. Ayrıca, açıklanabilirlik yöntemlerinin daha fazla kullanılması, öğrenci terkinin azaltıması alanında çalışan yöneticilere ve eğitimcilere daha değerli bilgiler sunacaktır.

Açıklama

Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü, 2024

Konusu

makine öğrenmesi, machine elarning, student dropout, öğrenci terki, yüksek öğretim, higher education

Alıntı

Endorsement

Review

Supplemented By

Referenced By