İSTANBUL TEKNİK ÜNİVERSİTESİ ⋆ LİSANSÜSTÜ EĞİTİM ENSTİTÜSÜ T1-AĞIRLIKLI MR GÖRÜNTÜLERİNDE MEME TÜMÖRÜ TANISI İÇİN GÖRÜNTÜ TABANLI TESPİT VE HASTA BAZLI KARAR İYİLEŞTİRİLMESİNİN BİRLEŞTİRİLMESİ: FASTER R-CNN YAKLAŞIMI YÜKSEK LİSANS TEZİ Şeyma Nur TUFAN İletişim Sistemleri Anabilim Dalı Uydu Haberleşmesi ve Uzaktan Algılama Programı HAZİRAN 2025 İSTANBUL TEKNİK ÜNİVERSİTESİ ⋆ LİSANSÜSTÜ EĞİTİM ENSTİTÜSÜ T1-AĞIRLIKLI MR GÖRÜNTÜLERİNDE MEME TÜMÖRÜ TANISI İÇİN GÖRÜNTÜ TABANLI TESPİT VE HASTA BAZLI KARAR İYİLEŞTİRİLMESİNİN BİRLEŞTİRİLMESİ: FASTER R-CNN YAKLAŞIMI YÜKSEK LİSANS TEZİ Şeyma Nur TUFAN (705241006) İletişim Sistemleri Anabilim Dalı Uydu Haberleşmesi ve Uzaktan Algılama Programı Tez Danışmanı: Prof. Dr. İbrahim AKDUMAN HAZİRAN 2025 ISTANBUL TECHNICAL UNIVERSITY ⋆ GRADUATE SCHOOL COMBINING IMAGE-BASED DETECTION AND PATIENT-LEVEL DECISION ENHANCEMENT FOR BREAST TUMOR DIAGNOSIS USING T1-WEIGHTED MRI AND FASTER R-CNN M.Sc. THESIS Şeyma Nur TUFAN (705241006) Communication Systems Department Satellite Communication and Remote Sensing Programme Thesis Advisor: Prof. Dr. İbrahim AKDUMAN JUNE 2025 İTÜ, Lisansüstü Eğitim Enstitüsü’nün 705241006 numaralı Yüksek Lisans Öğren- cisi Şeyma Nur TUFAN, ilgili yönetmeliklerin belirlediği gerekli tüm şartları yer- ine getirdikten sonra hazırladığı “T1-AĞIRLIKLI MR GÖRÜNTÜLERİNDE MEME TÜMÖRÜ TANISI İÇİN GÖRÜNTÜ TABANLI TESPİT VE HASTA BAZLI KARAR İYİLEŞTİRİLMESİNİN BİRLEŞTİRİLMESİ: FASTER R-CNN YAKLAŞIMI” baş- lıklı tezini aşağıda imzaları olan jüri önünde başarı ile sunmuştur. Tez Danışmanı : Prof. Dr. İbrahim AKDUMAN .............................. İstanbul Teknik Üniversitesi Jüri Üyeleri : Prof. Dr. Hülya ŞAHİNTÜRK .............................. Yıldız Teknik Üniversitesi Prof. Dr. Mehmet ÇAYÖREN .............................. İstanbul Teknik Üniversitesi .............................. Teslim Tarihi : 3 Haziran 2025 Savunma Tarihi : 19 Haziran 2025 v vi Sevgili annem, babam ve kardeşlerime, vii viii ÖNSÖZ Çalışmalarımı yürütmemde gerekli olan tüm ortam ve donanım imkanlarını sağlayan InfiWave Diagnostics Yazılım Şirketi’ne en içten teşekkürlerimi sunarım. Ayrıca, tez üretim sürecim boyunca bilgi birikimi ve engin tecrübeleriyle yol gösteren, her an desteklerini esirgemeyen değerli danışmanım Prof. Dr. İbrahim Akduman ve Aleksandar Janjic’e derin şükranlarımı ifade etmek isterim. Onların engin bilgi birikimi, sabırla sağladıkları rehberlik ve yapıcı eleştirileri, bu çalışmanın şekillenmesinde büyük rol oynamıştır. Bunun yanı sıra, hayatımın her anında yanımda olan, koşulsuz sevgileri ve moral destekleriyle bana güç veren sevgili aileme sonsuz minnettarım. Onların varlığı ve inancı, karşılaştığım zorlukların üstesinden gelmemde en büyük motivasyon kaynağı olmuştur. Bu yolculukta bana inanan, sabırla destek olan tüm dostlarıma da teşekkür ederim. Haziran 2025 Şeyma Nur TUFAN ix x İÇİNDEKİLER Sayfa ÖNSÖZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix İÇİNDEKİLER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi KISALTMALAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii SEMBOLLER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv ÇİZELGE LİSTESİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii ŞEKİL LİSTESİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix ÖZET . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi SUMMARY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xxiii 1. GİRİŞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Lıteratür Taraması . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2. KULLANILAN VERİ SETİ VE GÖRÜNTÜ ÖZELLİKLERİ . . . . . . . . . . . . . . 7 2.1 Veri Seti Kaynakları. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Veri Setinde Bulunan Hasta ve Görüntü Sayısı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.3 Görüntü Özellikleri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 Veri Setinde Bulunan Etiket Özellikleri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3. MODEL EĞİTİMİ VE HİPERPARAMETRE OPTİMİZASYONU . . . . . . . 13 3.1 Kullanılan Model Mimarisi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.2 Eğitim Yapısı ve Parametreler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.2.1 Eğitim-validasyon veri bilgileri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2.2 Kayıp fonksiyonu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2.3 Optimizasyon algoritması ve ağırlık çürümesi . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.2.4 Öğrenme oranı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.2.5 Momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.2.6 Epoch ve batch sayıları . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.3 Hiperparametre Optimizasyonu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.4 Kullanılan Donanım Özellikleri ve Eğitim Süresi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 4. HASTA BAZLI KARAR İYİLEŞTİRİLMESİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 5. SONUÇLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 5.1 Test Prosedürü (Hasta Bazlı ve Dilim Bazlı Test) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 5.2 Hasta Bazlı Karar İyileştirmesi Doğruluk Hesabı . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 5.3 Sonuç ve Öneriler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 6. TEŞEKKÜR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 KAYNAKLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 ÖZGEÇMİŞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 xi xii KISALTMALAR Faster R-CNN : Faster Region-based Convolutional Neural Network Faster MRG : Magnetik Rezonans Görüntüleme CNN : Convolutional Neural Network DCE-MRI : Dynamic Contrast-Enhanced Magnetic Resonance Imaging Mask R-CNN : Mask Region-based Convolutional Neural Network FROC : Free-response Receiver Operating Characteristic CPM : Competition Performance Metric CAD : Computer-Aided Diagnosis FPN : Feature Pyramid Network ROI : Region of Interest VGG16 : Visual Geometry Group 16 YOLO : You Only Look Once CLAHE : Contrast Limited Adaptive Histogram Equalization mAP : Mean Average Precision DSC : Dice Similarity Coefficient TCIA) : The Cancer Imaging Archive NCI) : National Cancer Institute DICOM) : Digital Imaging and Communications in Medicine NIfTI) : Neuroimaging Informatics Technology Initiative T : Tesla RPN : Region Proposal Network ResNet-50 : Residual Network-50 SGD : Stochastic Gradient Descent LR : Learning Rate TPE : Tree-structured Parzen Estimator IoU : Intersection over Union xiii xiv SEMBOLLER TP : Doğru Pozitif TN : Doğru Negatif FP : Yanlış Pozitif FN : Yanlış Negatif xv xvi ÇİZELGE LİSTESİ Sayfa Çizelge 2.1: Kullanılan görüntülerin özellikleri. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Çizelge 3.1: Eğitim ve validasyon verilerinin tümörlü ve sağlıklı görüntülere göre dağılımı. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Çizelge 3.2: Kullanılan donanıma ait teknik özellikler.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 xvii xviii ŞEKİL LİSTESİ Sayfa Şekil 3.1: LR Range Test grafiği – Öğrenme oranına göre kayıp (loss) değişimi. 17 Şekil 5.1: Faster R-CNN modelinin yanlış pozitif tahminleri ve önerilen metodoloji ile bu tahminlerin nasıl elendiğini gösteren örnek görüntüler.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 xix xx T1-AĞIRLIKLI MR GÖRÜNTÜLERİNDE MEME TÜMÖRÜ TANISI İÇİN GÖRÜNTÜ TABANLI TESPİT VE HASTA BAZLI KARAR İYİLEŞTİRİLMESİNİN BİRLEŞTİRİLMESİ: FASTER R-CNN YAKLAŞIMI ÖZET Meme kanseri, dünya genelinde kadınlar arasında en sık görülen kanser türlerinden biri olup, erken tanı ve tedavi süreci hastalığın seyri açısından hayati öneme sahiptir. Erken dönemde tespit edilen vakalarda tedavi başarı oranı belirgin ölçüde artmakta, bu da hasta sağkalım sürelerini anlamlı derecede uzatabilmektedir. Bu bağlamda, meme kanserinin erken evrede ve doğru şekilde tespiti için etkili, güvenilir ve hızlı tanı yöntemlerinin geliştirilmesi gerekmektedir. Günümüzde manyetik rezonans görüntüleme (MRG), yumuşak doku ayrımındaki üstünlüğü ve kontrast hassasiyeti sayesinde meme lezyonlarının görüntülenmesinde önemli bir rol oynamaktadır. Ancak, MRG görüntülerinin manuel olarak yorumlanması, zaman alıcı ve yorucu bir süreçtir; ayrıca yorumlayıcının deneyimine bağlı olarak subjektif farklılıklar içerebilir. Bu nedenle, otomatik tanı sistemlerine duyulan ihtiyaç gün geçtikçe artmaktadır. Bu tez çalışmasında, meme MRG görüntülerinde tümörlerin otomatik tespiti ve lokalizasyonunu sağlamak üzere derin öğrenme temelli iki aşalı bir sistem tasarlanmıştır. Birinci aşamada, Faster R-CNN tabanlı bir nesne tanıma modeli kullanılarak olası tümör bölgeleri belirlenmektedir. Bu aşama, hâlihazırda literatürde yaygın olarak kullanılan standart yaklaşımlarla paralellik göstermektedir. Ancak çalışmanın temel katkısı, ikinci aşamada sunulan ve dilim bazlı karar mekanizmasına dayanan yeni metodolojidir. Bu metodoloji, tüm görüntüler için sadece kutu tahmini yapmakla kalmayıp, dilim seviyesinde maske içerip içermediğine göre tahminlerin anlamlılığını sorgulamakta ve böylece yanlış pozitif oranını azaltmaktadır. Modelin eğitim ve test süreçlerinde çeşitli kaynaklardan elde edilmiş, T1 ağırlıklı, benzer kontrast seviyelerindeki görüntülere yer verilmiştir. Veriler Duke Üniversitesi, Zenodo veri platformu ve Infiwave Diagnostics Yazılım Limited Şirketi’nden sağlanan MRG görüntülerini içermektedir. Tüm veriler, T1-Ağırlıklı, kontrast sonrası fazlara ait , 512×512 çözünürlüğünde ve 16-bit derinliğindedir. Yöntem, iki düzeyde değerlendirilmiştir: Dilim bazlı testlerde, her bir MRG dilimi için referans maske ile modelin tahmini kıyaslanarak, doğru pozitif (TP, True Positive), yanlış negatif (FN, False Negative), yanlış pozitif (FP, False Positive) ve doğru negatif (TN, True Negative) sınıflandırmaları yapılmıştır. Bu bağlamda, yalnızca Faster R-CNN modelinin kullanıldığı senaryoya kıyasla, önerilen metodoloji ile özgüllük (specifity) değeri %92’den %98’e yükseltilmiştir. Bu durum, yalnızca kutu tabanlı tahminlere güvenmenin ötesine geçilerek, modelin anlamsız ya da hatalı xxi pozitif tespitlerini elemine eden bir yapının başarılı bir şekilde entegre edildiğini göstermektedir. Hasta bazlı testlerde ise, 50 sağlıklı ve 50 tümörlü hastanın bulunduğu bir test veri seti kullanılmıştır. Bu testte, her bir hastanın en az bir diliminde tahmin bulunması durumunda tümörlü olarak sınıflandırılması yeterli kabul edilmiştir. Elde edilen sonuçlara göre, tümörlü hastaların 49’u doğru şekilde tespit edilmiş,hastalardan biri sağlıklı olarak işaretlenmiştir. Bu durum, %98 oranında duyarlılık (sensitivity) değeri elde edildiğini göstermektedir. Diğer yandan, sağlıklı hastaların 46’sı doğru şekilde saptanabilmiş, 4 hasta ise yanlış olarak tümörlü olarak işaretlenmiştir; bu da özgüllük oranının %92 olarak gerçekleştiğini göstermektedir. Ayrıca, tespit edilen kutuların gerçek tümör maskesini kapsayıp kapsamadığı analiz edilerek, %97.95 oranında lokalizasyon başarısı elde edilmiştir. Tüm bu bulgular, önerilen sistemin hem dilim hem de hasta düzeyinde karar verme kabiliyetinin yüksek olduğunu, klasik yöntemlerin ötesinde anlamlı bir iyileştime sunduğunu ve yanlış pozitif/negatif oranlarını dikkate değer ölçüde azalttığını ortaya koymaktadır. Bu yöntemin, klinik uygulamalarda radyologlara karar destek aracı olarak hizmet verebilecek potansiyele sahip olduğu ve meme kanseri tarama süreçlerinde hızlı, güvenilir ve tutarlı bir yardımcı sistem olarak kullanılabileceği sonucuna varılmıştır. xxii COMBINING IMAGE-BASED DETECTION AND PATIENT-LEVEL DECISION ENHANCEMENT FOR BREAST TUMOR DIAGNOSIS USING T1-WEIGHTED MRI AND FASTER R-CNN SUMMARY Breast cancer is one of the most common types of cancer among women worldwide, and early diagnosis and treatment are of vital importance for the course of the disease. When detected at an early stage, the success rate of treatment significantly increases, thereby substantially extending patient survival times. In this context, the development of effective, reliable, and rapid diagnostic methods for the accurate and early detection of breast cancer is crucial. Today, magnetic resonance imaging (MRI) plays a significant role in the imaging of breast lesions due to its superior soft tissue contrast and high sensitivity. However, the manual interpretation of MRI images is a time-consuming and labor-intensive process, and it may contain subjective variations depending on the experience of the radiologist. Therefore, the demand for automated diagnostic systems is steadily increasing. In this thesis study, a deep learning-based two-stage system has been designed for the automatic detection and localization of tumors in breast MRI scans. In the first stage, a Faster R-CNN-based object detection model is used to identify potential tumor regions. This stage aligns with the widely used standard approaches in the literature. However, the main contribution of this study lies in the second stage, which introduces a novel slice-based decision-making methodology. This method not only produces bounding box predictions for each image but also evaluates the meaningfulness of these predictions by checking for the presence of a reference mask at the slice level, thus significantly reducing the false positive rate. During the training and testing phases of the model, contrast-enhanced, T1-weighted MRI images from multiple sources were utilized. The data used in this study includes MRI scans from Duke University, the Zenodo data repository, and Infiwave Diagnostics Software Ltd. All images are from the post-contrast phase, have a resolution of 512×512 pixels, and a bit depth of 16. The proposed method has been evaluated at two levels: In slice-based tests, each MRI slice was compared with the ground truth mask to classify results as true positive (TP), false negative (FN), false positive (FP), or true negative (TN). In this context, compared to the baseline scenario using only the Faster R-CNN model, the specificity increased from 92% to 98% with the proposed methodology. This improvement demonstrates the effectiveness of incorporating a structure that eliminates semantically irrelevant or incorrect positive detections, rather than relying solely on bounding box predictions. In patient-level tests, a test dataset consisting of 50 healthy and 50 tumor-bearing patients was used. In this evaluation, the presence of a single detection in any slice of a patient was considered sufficient for the patient to be classified as tumor-positive. xxiii According to the results, 49 of the tumor-bearing patients were correctly identified, while one was misclassified as healthy. This corresponds to a sensitivity of 98%. On the other hand, 46 of the healthy patients were correctly identified, whereas 4 were incorrectly classified as tumor-positive, resulting in a specificity of 92%. In addition, by analyzing whether the predicted bounding boxes overlapped with the actual tumor masks, a localization accuracy of 97.95 All these findings indicate that the proposed system demonstrates high decision-making performance at both the slice and patient levels, offering meaningful improvements over traditional methods and significantly reducing false positive and false negative rates. It is concluded that the proposed approach has strong potential to serve as a decision support tool for radiologists in clinical practice and may be effectively utilized as a fast, reliable, and consistent assistive system in breast cancer screening workflows. xxiv 1. GİRİŞ Meme kanseri, erken teşhis olanaklarındaki gelişmeler ve tedavi yöntemlerinde kaydedilen önemli ilerlemeler sayesinde ölüm oranlarında belirgin bir düşüş göstermiş olsa da, günümüzde kadınlar arasında kansere bağlı ölümlerin en sık görülen ikinci nedeni olmaya devam etmekte ve kadın sağlığını tehdit eden başlıca onkolojik hastalıklardan biri olma özelliğini sürdürmektedir (Giaquinto, Sung, Newman, Freedman, Smith, Star, Jemal, and Siegel, 2024). Özellikle hastalığın erken evrede saptanması, tedavi başarısını ve hasta sağkalımını önemli ölçüde artırmaktadır; nitekim erken tanı konulan olgularda beş yıllık sağkalım oranı %90’ın üzerine çıkmaktadır (A. C. Society, 2016). Teknolojinin de gelişmesiyle erken teşhis, görüntüleme tekniklerinin gücünden yararlanılarak gerçekleştirilmektedir. Meme kanseri teşhisinde en popüler tercih mammografidir. Ancak yoğun meme dokusuna sahip bireylerde mamografinin duyarlılığının azalması, alternatif veya tamamlayıcı tarama yöntemlerinin klinik değerini artırmıştır. Bu bağlamda, ultrasonografi ve manyetik rezonans görüntüleme (MRG) gibi modaliteler, mamografinin sınırlı tanı başarısını desteklemek amacıyla yaygın olarak önerilmektedir. Literatürdeki bulgular, MRG’nin yüksek duyarlılığı sayesinde, mamografik olarak negatif değerlendirilen olgularda dahi ek kanser vakalarının saptanabildiğini ortaya koymaktadır. Nitekim ultrasonografi her 1000 taramada ortalama beş yeni olguyu tanımlayabilirken, MRG bu sayıdan katbekat fazla, yaklaşık 3 ila 33 arası invaziv tümör vakasını tespit edebilmektedir. Dahası, MRG ile saptanan lezyonların çoğunun lokalize ve invaziv karakterde olması, bu yöntemin ileri evre hastalık gelişimini önlemede ne denli kritik bir rol üstlendiğini göstermektedir. Bu bulgular, MRG’nin özellikle yüksek risk grubundaki bireylerde erken tanı ve tedavi sürecine katkı sağlayan etkili bir görüntüleme aracı olduğunu güçlü biçimde desteklemektedir (Richman, Asch, Bendavid, Bhattacharya, and Owens, 2017). 1 Son yıllarda tıbbi görüntüleme alanında derin öğrenme ve yapay zekâ tabanlı yaklaşımların hızla gelişmesi, bu teknolojilerin klinik uygulamalara entegrasyonunu beraberinde getirmiştir. Bu gelişmeler, özellikle hastalıkların erken teşhisi ve tanı doğruluğunun artırılması açısından önemli bir potansiyel sunmaktadır. Derin öğrenme modelleri, görüntü verilerinden anlamlı desenleri yüksek doğrulukla tanımlayabilme yetenekleri sayesinde klinisyenlerin karar verme süreçlerini etkin bir şekilde desteklemekte; aynı zamanda daha hızlı ve güvenilir tanı olanakları sağlamaktadır. Tıbbi görüntülerde yer alan lezyonların veya klinik olarak önemli bölgelerin doğru bir şekilde tespit edilmesi, tanı sürecinin en kritik ve aynı zamanda en zahmetli adımlarından biridir. Bu süreç, özellikle küçük boyutlu ve görüntü içinde dağınık şekilde yer alan anormal yapıların dikkatli bir şekilde taranmasını ve tanımlanmasını gerektirir. Bu noktada, derin öğrenme yaklaşımlarının, özellikle konvolüsyonel sinir ağları (Convolutional Neural Networks - CNNs) gibi güçlü modellerle desteklenmesi, bilgisayar destekli tanı sistemlerinin etkinliğini artırmıştır. CNN tabanlı modeller, tıbbi görüntülerden anlamlı özellikleri otomatik olarak çıkarma yetenekleri sayesinde, lezyon tespiti gibi karmaşık görevleri büyük ölçüde kolaylaştırmakta; tanısal doğruluğu yükseltmekte ve uzmanların değerlendirme sürecinde harcadığı zamanı azaltmaktadır. Bu teknolojik ilerlemeler, modern tıpta yapay zekâ destekli sistemlerin tanı süreçlerine entegrasyonunu hızlandırmakta, klinik verimliliği artırmakta ve hasta yönetiminde daha zamanında, doğru ve etkili kararlar alınmasına katkı sağlamaktadır(Litjens, Kooi, Bejnordi, Setio, Ciompi, Ghafoorian, van der Laak, van Ginneken, and Sánchez, 2017). Bu tez kapsamında geliştirilen proje, manyetik rezonans (MR) görüntülerinde meme tümörlerinin tespiti amacıyla derin öğrenme tabanlı bir yaklaşım sunmaktadır. Projede, özellikle nesne tespiti alanında yüksek başarı göstermesiyle bilinen Faster R-CNN (Faster Region-Based Convolutional Neural Network) mimarisi kullanılarak, görüntü düzeyinde tümörlerin otomatik olarak saptanması hedeflenmiştir. Bununla birlikte, yalnızca görüntü tabanlı değerlendirme ile sınırlı kalınmayarak, hasta bazlı bir analiz yöntemi de geliştirilmiştir. Bu yöntem, birden fazla görüntüden elde edilen tespit sonuçlarının hasta düzeyinde bütüncül bir biçimde değerlendirilmesini sağlayarak tanısal güvenilirliği artırmayı amaçlamaktadır. Modelin başarımını nesnel olarak 2 değerlendirebilmek amacıyla, özgüllük (specificity), duyarlılık (sensitivity) gibi yaygın performans metrikleri kullanılarak kapsamlı bir test süreci gerçekleştirilmiştir. Bu çalışma, derin öğrenme tabanlı görüntü analizi ve hasta bazlı karar destek sistemlerinin entegre edilmesiyle, meme kanserinin erken ve güvenilir teşhisine katkı sunmayı hedeflemektedir. Elde edilen sonuçlar, geliştirilen yaklaşımın klinik uygulamalarda kullanılabilirliğini ortaya koymakta ve gelecekteki yapay zekâ destekli tıbbi tanı sistemleri için önemli bir referans niteliği taşımaktadır. 1.1 Lıteratür Taraması Son yıllarda, derin öğrenme tabanlı yöntemler meme kanseri tespiti amacıyla dinamik kontrastlı manyetik rezonans görüntüleme (DCE-MRI) verileri üzerinde etkili sonuçlar göstermektedir. Bu bağlamda yapılan çeşitli çalışmalarda, Faster R-CNN, U-Net ve Mask R-CNN gibi derin sinir ağı mimarileri yaygın olarak kullanılmaktadır. Jiao ve arkadaşları (2020), meme tümörlerinin otomatik tespiti ve segmentasyonu için ResNet-101 tabanlı Faster R-CNN modelini kullanmışlardır. Modelin eğitiminden önce U-Net++ ile ön işleme yapılmış ve böylece görüntülerdeki parazit etkileri azaltılmıştır. Beş katlı çapraz doğrulama sonucunda 3.4 false positive/case oranında %87.4 kitle düzeyinde hassasiyet elde edilmiştir. Araştırmacılar, küçük veri setlerinden kaynaklanan genelleme problemini azaltmak amacıyla çapraz doğrulama yöntemini vurgulamış ve sonuçların klinik açıdan faydalı olabileceğini belirtmişlerdir (Jiao, Jiang, Pang, Lin, Huang, and Li, 2020b).. Benzer şekilde, Dalmış ve arkadaşları (2018) lezyon adaylarının tespiti için iki seviyeli U-Net mimarisi kullanmış, eğitimde radyologların manuel segmentasyonlarını temel almış ve performansı FROC eğrisiyle değerlendirmiştir. Çeşitli eşik değerlerinde hesaplanan CPM (Competition Performance Metric) sonuçları, sistemin önceki bilgisayar destekli tespit (CAD) yöntemlerine kıyasla anlamlı derecede (p=0.008) daha yüksek performans sergilediğini göstermiştir. Bu da modelin hem kitle hem de dilim bazında daha doğru tespitler yaptığını ortaya koymuştur (Dalmiş, Vreemann, Kooi, Mann, Karssemeijer, and Gubern-Mérida, 2018). 3 Bu alandaki gelişmelerden biri de Gui ve arkadaşlarının (2024) Faster R-CNN mimarisi üzerinde yaptığı iyileştirmelerdir. FPN (Feature Pyramid Network) entegrasyonu ve ROI boyutunun küçültülmesi gibi değişikliklerle modelin doğruluğu artırılmış, false positive oranı önemli ölçüde azaltılmıştır. VGG16 tabanlı Mask R-CNN ile karşılaştırıldığında, geliştirilen sistem iç veri kümesinde %95 duyarlılık ve %13.3 false positive oranı elde etmiştir. Ayrıca, gerçek zamanlı tespit algoritması YOLOv9 ile yapılan karşılaştırmalarda, hız avantajına rağmen YOLO’nun doğruluk açısından geride kaldığı vurgulanmıştır (Gui, Jiao, Li, Jiang, Su, and Pang, 2024). Omurga röntgen görüntülerindeki anormallik tespiti için ise Zhong ve arkadaşları (2023), AC-Faster R-CNN adını verdikleri özel bir yöntem geliştirmiştir. Bu yaklaşım, 12-bit’ten 8-bit’e dönüştürme, CLAHE tabanlı kontrast artırma, görüntü çevirme, yeniden boyutlandırma, normalleştirme ve 800×640 sabit çözünürlükte dolgu gibi kapsamlı ön işleme tekniklerini içermektedir. Gerçek anotasyonlar deneyimli radyologlar tarafından hazırlanmış ve model denetimli öğrenme ile eğitilmiştir. Değerlendirmede mAP@0.5, duyarlılık, kesinlik ve F1-skoru gibi metrikler kullanılmış, sistem anormallik tespitinde yüksek hassasiyet ve sağlamlık göstermiştir (Zhong, Yi, and Jin, 2023). Beyin tümörü segmentasyonu ve sınıflandırmasında ise Methods in Medicine (2023) tarafından sunulan çalışmada, derin konvolüsyonel sinir ağları (CNN) ile geleneksel makine öğrenmesi sınıflayıcılarının (Random Forest, SVM-RBF, ELM gibi) birleştiği hibrit bir mimari önerilmiştir. Sistem, doğrusal ve doğrusal olmayan görüntü kayıt teknikleriyle ön işleme tabi tutulmuş; ardından, Region Proposal Network (RPN) ile entegre edilmiş bölge tabanlı CNN kullanılarak tümörler yerelleştirilmiştir. Bu çok aşamalı işlem hattı, uçtan uca çalışan CNN-ML hibrit sistemiyle tespitten sınıflandırmaya kadar ilerlemiş ve benchmark veri kümelerinde %98.3’e varan sınıflandırma doğruluğu ile %97.8 Dice Benzerlik Katsayısı (DSC) elde edilmiştir. Yazarlar, sistemin az anotasyonlu ortamlara uyarlanabilirliğine dikkat çekmiştir (Methods in Medicine, C. A. M., 2023). Meme kanseri tespiti üzerine yapılan bir diğer çalışma ise Raimundo ve arkadaşları (2023) tarafından geliştirilmiş yenilikçi bir Faster R-CNN çerçevesidir. Bu yaklaşımda, 4 veri tekrarını ve hesaplama süresini azaltmak amacıyla ön işleme aşamasında yalnızca yeterli tümör anotasyonu içeren dilimler seçici olarak filtrelenmiştir. DukeBC veri kümesi üzerinde eğitilen sistem, düşük standart sapma ile %94.46 hasta bazlı doğruluk göstermiştir. Ancak dilim seçimi için kullanılan filtreleme parametrelerinin sezgisel olarak belirlenmesi, geliştirilmesi gereken bir yön olarak belirtilmiştir (Raimundo, Fontes, Gonzaga Mendes Magalhães, and Guevara Lopez, 2023). Son olarak, Jiao ve arkadaşlarının (2020) bir başka çalışmasında, DCE-MRI görüntülerinde meme bölgesi segmentasyonu için U-Net++, kitle tespiti için ise Faster R-CNN kullanılmıştır. Bu hibrit yöntem, sadece meme dokusu ve sınırlayıcı kutu anotasyonlarına odaklanarak dış gürültüyü minimize etmiştir. Hasta bazlı beş katlı çapraz doğrulama uygulanmış, tespit edilen bölgeler 3B uzaya yansıtılarak birbirine yakın kutular birleştirilmiştir. Gerçek pozitifler IoU eşiği 0.5 ile tanımlanmış olup, segmentasyonun tespitten önce entegre edilmesi modelin hem sağlamlığını hem de yorumlanabilirliğini artırmıştır (Jiao, Jiang, Pang, Lin, Huang, and Li, 2020a). 5 6 2. KULLANILAN VERİ SETİ VE GÖRÜNTÜ ÖZELLİKLERİ 2.1 Veri Seti Kaynakları Bu tez çalışmasında, meme tümörlerinin tespiti ve analizi için kullanılan temel veri seti, The Cancer Imaging Archive (TCIA) platformunda yer alan Duke Breast Cancer MRI veri setidir (Saha, Harowicz, Grimm, Weng, Cain, Kim, Ghate, Walsh, and Mazurowski, 2021). TCIA, Amerika Birleşik Devletleri Ulusal Kanser Enstitüsü (National Cancer Institute, NCI) tarafından desteklenen, araştırma topluluğuna açık ve kapsamlı bir tıbbi görüntü arşividir. Platform, çok sayıda klinik çalışmadan elde edilen yüksek kaliteli görüntüleri genellikle DICOM formatında sunmakta; bu görüntülerin yanı sıra detaylı klinik bilgiler, patolojik tanılar, segmentasyon maskeleri ve diğer açıklayıcı verileri de araştırmacıların kullanımına açmaktadır. Özellikle kanser görüntüleme çalışmalarına yönelik zengin içeriğiyle TCIA, yapay zekâ ve makine öğrenmesi uygulamaları için sıklıkla tercih edilen bir kaynaktır. Duke Breast Cancer MRI veri seti, TCIA platformunda yayımlanmış ve Duke Üniversitesi araştırmacıları tarafından hazırlanmıştır. Bu veri seti, toplam 922 farklı hastaya ait dinamik kontrastlı T1-ağırlıklı (DCE-MRI) meme MR görüntülerinden oluşmaktadır. Görüntüler, her hasta için kontrast öncesi (pre-contrast) ve kontrast sonrası (post-contrast) olmak üzere farklı fazlara ayrılmıştır ve bu fazlar arasında zamansal değişimi yansıtan çoklu kesitler bulunmaktadır. Her hasta kaydında yalnızca bir tümör bölgesi manuel olarak segmentasyon maskesiyle işaretlenmiştir, bu da veri setini hem tespit (detection) hem de segmentasyon çalışmaları için son derece uygun kılmaktadır. Görsellerin yüksek çözünürlüklü ve detaylı açıklamalarla birlikte sunulması, geliştirilen modellerin tanı doğruluğunun ve klinik uygulanabilirliğinin daha güçlü bir şekilde değerlendirilmesine olanak sağlamaktadır. Ek olarak, tezde geliştirilen modelin genellenebilirliğini değerlendirmek amacıyla Zenodo platformunda yayımlanmış olan Breast_Cancer_DCE-MRI_Data veri seti test amacıyla kullanılmıştır (Zhang, 2023). Bu veri seti, 100 farklı hastaya ait DCE-MRI 7 görüntülerini içermektedir ve tümör bölgelerine ait segmentasyon maskelerini, farklı kontrast fazlarındaki görüntüleri ve diğer yardımcı açıklayıcı bilgileri kapsamaktadır. Segmentasyon görevleri açısından değerli bir kaynak sunan bu veri seti, modelin farklı veri dağılımlarında test edilmesine ve klinik senaryolara daha yakın koşullarda değerlendirilmesine olanak tanımaktadır. Ayrıca, yalnızca kanserli örneklerle sınırlı kalmamak ve modelin hem pozitif hem de negatif örnekler üzerindeki başarımını artırmak amacıyla, sağlıklı bireylere ait meme MR görüntüleri de kullanılmıştır. Bu görüntüler, Infiwave Diagnostics Yazılım Limited Şirketi’nden temin edilmiştir. Elde edilen bu görüntüler, herhangi bir malignite bulgusu içermeyen olgulardan seçilmiştir. Böylece oluşturulan veri havuzu, hem tümörlü hem de sağlıklı örnekleri dengeli şekilde içermekte olup, modelin gerçek dünya kullanım senaryolarına daha yakın bir şekilde test edilmesini sağlamaktadır. 2.2 Veri Setinde Bulunan Hasta ve Görüntü Sayısı Bu çalışmada kullanılan toplam veri seti, üç farklı kaynaktan temin edilen görüntülerden oluşmaktadır. Tümörlü hastalara ait görüntüler, Duke Breast Cancer MRI koleksiyonundan seçilen 352 hastanın MR verilerinden elde edilmiş ve toplamda 6478 görüntü değerlendirmeye alınmıştır. Görüntüler, her hasta için sağlanan ground truth bilgileri doğrultusunda, tümörün yer aldığı dilim aralıklarına (slice) dayalı olarak seçilmiştir. Ancak, ham veri setinde belirtilen tüm dilim aralıkları doğrudan alınmamış, bunun yerine tümörün görüntüde belirgin olarak görüldüğü sınırlı bir aralık tercih edilmiştir. Dilim seçiminde uygulanan bu daraltma, tümör dokusunun bazı dilimlerde çok az görünmesi veya hiç görünmemesi nedeniyle yapılmıştır. Görsel olarak belirgin olmayan dilimlerin model eğitimine dahil edilmesi, modelin tümörsüz görüntülerde yanlış öğrenme eğiliminde olmasına ve eğitim dengesinin bozulmasına yol açabileceğinden, yalnızca belirgin görsellik taşıyan dilimler tercih edilmiştir. Ayrıca, çok küçük boyuttaki tümörlerin eğitim sürecinde baskın hale gelerek modelin genel performansını olumsuz etkilemesi riskine karşı da önlem alınmıştır. Bu strateji sayesinde, veri setindeki örneklerin niteliği artırılmış ve modelin eğitimi daha sağlam bir temele oturtulmuştur. Eğitim verisinin bu şekilde seçilmesi, modelin hem tespit başarımını artırmakta hem de aşırı öğrenme riskini azaltmaktadır. Ayrıca, Zenodo 8 platformunda yayımlanan “Breast_Cancer_DCE-MRI_Data” veri setinden 50 tümörlü hastaya ait, 6000 görüntü kullanılmıştır. Toplamda ise 12478 tümörlü görüntü çalışmada kullanılmıştır. Sağlıklı bireylere ait görüntüler ise iki farklı grubu kapsamaktadır. İlk grup, test amacıyla kullanılan 50 sağlıklı hastanın her birinden alınan yaklaşık 160 görüntü, toplamda 8000 görüntü içermektedir. İkinci grup ise, modelin eğitim sürecine dahil edilen 19 sağlıklı hastaya ait yaklaşık 3000 görüntüden oluşmaktadır. Toplamda bu veri setinden alınan 11000 sağlıklı görüntü çalışmada farklı amaçlarla kullanılmıştır. 2.3 Görüntü Özellikleri Bu çalışmada kullanılan tüm manyetik rezonans (MR) görüntüleri, T1 ağırlıklı dinamik kontrastlı (DCE-MRI) sekanslardan elde edilmiştir. Görüntüler, kontrast madde enjeksiyonu sonrası elde edilen post-kontrast fazlardan seçilmiş olup, özellikle kontrast maddenin dokulara maksimum dağıldığı son fazlar tercih edilmiştir. Bu seçim, tümör dokularının çevre dokuya göre daha belirgin hale gelmesini sağlamakta ve modelin tümör alanlarını daha başarılı bir şekilde ayırt edebilmesine katkıda bulunmaktadır. Çalışmada kullanılan görüntülerin formatları veri kaynağına göre farklılık göster- mektedir. Duke Breast Cancer MRI veri seti ve özel bir görüntüleme merkezinden etik onayla temin edilen sağlıklı birey görüntüleri, DICOM formatında sağlanmıştır. Zenodo platformunda yayımlanan veri seti ise NIfTI (.nii) formatındadır. Tüm görüntüler 512×512 piksel çözünürlüğünde olup, 16-bit derinliktedir. Bu yüksek bit derinliği, yoğunluk değerlerinin daha hassas temsil edilmesine olanak tanımakta ve görüntü işleme süreçlerinde bilgi kaybını en aza indirmektedir. Manyetik alan gücü açısından değerlendirildiğinde, Duke veri setine ve sağlıklı görüntülere ait MR taramaları 1.5 Tesla manyetik alan gücüne sahip cihazlarla gerçekleştirilmiştir. Zenodo veri setinde kullanılan cihazların manyetik alan gücüne ilişkin kesin bir bilgiye ulaşılamamıştır. Tüm görüntüler aksiyel düzlemde elde edilmiş olup, çalışmada yalnızca benzer görüntüleme fazları ve sekansları içeren örnekler seçildiğinden, genel veri yapısında 9 bir tutarlılık sağlanmış ve model eğitimi sırasında bu farklılıkların etkisi minimize edilmiştir. Kullanılan farklı kaynaklardan elde edilen MR görüntülerinin temel teknik özellikleri Çizelge 2.1’de özetlenmiştir. 10 Ç iz el ge 2. 1: K ul la nı la n gö rü nt ül er in öz el lik le ri . Ö ze lli k D uk e Ve ri Se ti Z en od o Ve ri Se ti Ö ze lM er ke z V er iF or m at ı D IC O M N If T I( .n ii) D IC O M G ör ün tü Ti pi T 1- w ei gh te d D C E -M R I T 1- w ei gh te d D C E -M R I T 1- w ei gh te d D C E -M R I Fa z Se çi m i Po st -c on tr as t( so n fa z) Po st -c on tr as t( so n fa z) Po st -c on tr as t( so n fa z) Ç öz ün ür lü k 51 2 × 51 2 51 2 × 51 2 51 2 × 51 2 B it D er in liğ i 16 -b it 16 -b it 16 -b it M an ye tik A la n G üc ü 1. 5 T B ili nm iy or 1. 5 T G ör ün tü D üz le m i A ks iy el A ks iy el A ks iy el 11 2.4 Veri Setinde Bulunan Etiket Özellikleri Bu çalışmada kullanılan veri setlerine ait tümör etiketleri, görüntülerde tümörün konumunu tanımlayan çeşitli formatlarda sunulmaktadır. Duke Breast Cancer MRI veri setinde, her hasta için hazırlanan bir tablo aracılığıyla tümör lokasyonuna ilişkin zengin yer bilgisi sağlanmaktadır. Bu tabloda, tümörün bulunduğu hacmi tanımlamak üzere her hastaya özel olarak başlangıç ve bitiş dilim numaraları ile birlikte, her dilim üzerinde tümörün yatay ve düşey düzlemdeki sınırlarını belirleyen başlangıç ve bitiş satır-sütun koordinatları yer almaktadır. Bu bilgiler, her tümör için üç boyutlu bir bounding box tanımlanmasına olanak sunmakta ve tespit görevleri için doğrudan kullanılabilir hale gelmektedir. Öte yandan, Zenodo platformunda yayımlanan Breast_Cancer_DCE-MRI_Data veri seti, her tümör için piksel düzeyinde segmentasyon maskesi sağlamaktadır. Ancak bu veri setinde, tümör lokasyonuna dair koordinat bilgileri doğrudan sunulmamaktadır. Bu nedenle, çalışmada bu maskeler işlenerek, her maskeyi çevreleyen en küçük dikdörtgenin (bounding box) koordinatları ve tümörün bulunduğu slice aralıkları algoritmik olarak çıkarılmıştır. Böylece, Zenodo veri seti de Duke ile benzer şekilde, tespit temelli yaklaşımlar için uygun etiket yapısına dönüştürülmüştür. 12 3. MODEL EĞİTİMİ VE HİPERPARAMETRE OPTİMİZASYONU Bu bölümde, geliştirilen tümör tespit modeli için kullanılan eğitim stratejisi ve hiperparametre optimizasyonu süreçleri detaylandırılmaktadır. Model mimarisi olarak, bölgesel tabanlı bir nesne tespiti yöntemi olan Faster R-CNN tercih edilmiştir. Bu yapı, özellikle tıbbi görüntülerdeki tümör benzeri küçük nesnelerin konumlandırılmasında başarılı sonuçlar vermesiyle bilinmektedir. Modelin eğitiminde uygun parametrelerin belirlenmesi amacıyla, çeşitli hiperparametrelerin (öğrenme oranı, momentum, ağırlık çarpanı vb.) optimizasyonu Optuna kütüphanesi aracılığıyla gerçekleştirilmiştir. Böylece, modelin genel doğruluk ve genellenebilirlik performansı artırılmaya çalışılmıştır. Eğitim sürecinde kullanılan veri bölünmeleri, optimizasyon yöntemi ve model değerlendirme yaklaşımları da bu bölümde detaylı olarak sunulacaktır. 3.1 Kullanılan Model Mimarisi Bu çalışmada kullanılan nesne tespit modeli, literatürde yüksek başarı oranlarıyla öne çıkan Faster R-CNN mimarisi üzerine kurulmuştur. Faster R-CNN, nesne tespiti görevini iki temel modül aracılığıyla gerçekleştiren birleşik bir yapıdır. İlk modül olan Bölge Öneri Ağı (Region Proposal Network - RPN), girdi görüntü üzerinde potansiyel nesne bölgelerini otomatik olarak önermeye yönelik tasarlanmış, derin ve tam evrişimli bir sinir ağıdır. Bu yapı, sabit boyutlu "anchor" kutularını kullanarak her konumda nesne bulunma olasılığını tahmin eder ve uygun bölge önerilerini üretir. İkinci modül ise, önerilen bu bölgeleri değerlendiren Fast R-CNN tabanlı bir dedektördür. Fast R-CNN, her önerilen bölgeden elde edilen özellikleri kullanarak bölgeye ait sınıf tahminini ve konum iyileştirmesini (bounding box regression) gerçekleştirir. Her iki modül aynı temel özellik çıkarım ağı (genellikle ResNet veya VGG gibi) üzerinde çalışır ve bu sayede hem hesaplama maliyeti düşürülür hem de daha tutarlı bir özellik temsili sağlanır. 13 Faster R-CNN mimarisinin önemli avantajlarından biri, bölge önerisi ve sınıflandırma işlemlerini birbirinden bağımsız iki aşama olarak değil, tek bir uçtan uca (end-to-end) öğrenme süreci içinde birlikte optimize edebilmesidir. Ayrıca bu yapı, "attention" mekanizmaları bağlamında da değerlendirilebilir. Bu bakış açısına göre, RPN modülü Fast R-CNN’e görüntü üzerinde "nereye bakması gerektiğini" söyleyerek dikkat yönlendirme işlevi görür. Böylece sistem, daha anlamlı ve odaklanmış özellikler üzerinden öğrenme gerçekleştirir (Ren, He, Girshick, and Sun, 2017). 3.2 Eğitim Yapısı ve Parametreler Bu bölümde, Faster R-CNN tabanlı tümör tespit modelinin eğitimi sürecinde kullanılan yöntemler, ayarlanan parametreler ve modelin genel yapılandırması detaylandırılacaktır. Modelin doğruluk ve genellenebilirlik performansını artırmak amacıyla dikkatlice seçilen hiperparametrelerin, veri bölünmesinin ve veri artırma stratejilerinin nasıl belirlendiği anlatılacaktır. İlk olarak eğitim ve validasyon için kullanılan veri kümesinin içeriği ve bölünme yöntemi açıklanacaktır. Ardından modelin eğitimi sırasında kullanılan kayıp fonksiyonu, optimize edici algoritma (optimizer), öğrenme oranı, momentum ve ağırlık çarpanı gibi temel hiperparametreler detaylandırılacaktır. Eğitim sürecinde kullanılan epoch ve batch size değerleri ile uygulanan veri artırma (augmentation) teknikleri de ayrıca ele alınacaktır. Bunlara ek olarak, optimum parametre değerlerinin belirlenmesi amacıyla gerçek- leştirilen hiperparametre optimizasyon süreci de ayrı bir başlık altında açıklanacaktır. Bu süreçte, özellikle Optuna kütüphanesi ile yapılan deneysel çalışmalar ve sonuçlar paylaşılacaktır. Projemizde kullanılan Faster R-CNN mimarisi, varsayılan yapılandırmalarıyla birlikte uygulanmıştır. Bu kapsamda, modeldeki anchor box ve Region Proposal Network (RPN) parametreleri değiştirilmeden, doğrudan PyTorch’un sunduğu varsayılan değerler kullanılmıştır. Model, önceden eğitilmiş (pretrained) bir ağırlık seti ile başlatılmamış, sıfırdan (scratch) eğitilmiştir. Özellik çıkarıcı (backbone) ağ olarak yaygın şekilde kullanılan ResNet-50 tercih edilmiştir. 14 3.2.1 Eğitim-validasyon veri bilgileri Modelin eğitimi ve değerlendirilmesi amacıyla kullanılan veri seti, tümörlü ve sağlıklı MR görüntülerinden oluşmaktadır. Toplamda 6478 adet tümörlü ve yaklaşık 3000 adet sağlıklı görüntü içeren veri seti, eğitim ve validasyon olmak üzere rastgele bir şekilde %80–%20 oranında ikiye ayrılmıştır. Böylece eğitim aşamasında 5182 adet tümörlü ve 2400 adet sağlıklı görüntü kullanılırken, validasyon setinde ise 1296 adet tümörlü ve 600 adet sağlıklı görüntü yer almıştır. Eğitim ve validasyon veri setlerinin ayrıntılı dağılımı Çizelge 3.1’da sunulmaktadır. Bu dengeli dağılım, modelin her iki sınıfta da genelleme yeteneğini koruyarak öğrenmesini hedeflemektedir. Çizelge 3.1: Eğitim ve validasyon verilerinin tümörlü ve sağlıklı görüntülere göre dağılımı. Veri Türü Tümörlü Görüntü Sayısı Sağlıklı Görüntü Sayısı Toplam Eğitim 5182 2400 7582 Validasyon 1296 600 1896 Toplam 6478 3000 9478 3.2.2 Kayıp fonksiyonu Bu çalışmada kullanılan Faster R-CNN mimarisi, nesne tespitine yönelik çok görevli bir kayıp fonksiyonu ile eğitilmektedir. Bu kayıp fonksiyonu, her görüntü için hem sınıflandırma hem de sınır kutusu regresyonuna dayalı iki temel bileşenden oluşur. Sınıflandırma kaybı, bir nesne olup olmadığını tahmin etmek için log-loss (binary cross-entropy) fonksiyonu ile hesaplanırken; regresyon kaybı, tahmin edilen kutuların gerçek kutulara olan uzaklığını ölçmek için "smooth L1 loss" olarak bilinen daha dayanıklı bir kayıp fonksiyonu ile hesaplanır. Özellikle, yalnızca pozitif örnek olarak belirlenen "anchor" bölgeleri (IoU > 0.7 ya da en yüksek IoU değerine sahip olanlar) regresyon kaybına katkı sağlar. Negatif örnekler (IoU < 0.3) yalnızca sınıflandırma kaybında dikkate alınır. Bu sayede model, hem tümör içeren bölgeleri doğru şekilde tespit etmeyi hem de bu bölgelerin konumlarını olabildiğince hassas biçimde belirlemeyi öğrenir. Bu yaklaşım, Faster R-CNN modelinin temel eğitim prensibi olup orijinal çalışmada detaylı şekilde açıklanmıştır (Ren, He, Girshick, and Sun, 2017). 15 3.2.3 Optimizasyon algoritması ve ağırlık çürümesi Bu çalışmada modelin ağırlıklarının güncellenmesi için Stochastic Gradient Descent (SGD) optimizasyon algoritması kullanılmıştır. SGD, klasik gradient descent yönteminin daha verimli ve hafif bir versiyonudur. Büyük veri kümelerinde, tüm veri üzerinde hesaplama yapmak yerine, rastgele seçilen küçük veri grupları (mini-batch’ler) üzerinden gradyanlar hesaplanarak model parametreleri güncellenir. Bu sayede, hem bellek kullanımı azalır hem de model daha hızlı güncellenebilir. SGD’nin temel avantajı, özellikle derin öğrenme modellerinde genel anlamda daha iyi genelleme sağlamasıdır. Ayrıca, bu çalışmada kullanılan SGD algoritması momentum ve ağırlık çürümesi (weight decay) gibi iyileştirici mekanizmalarla desteklenmiştir. Momentum, gradyanların yönünde bir "ivme" etkisi oluşturarak daha kararlı bir öğrenme süreci sağlar. Weight decay ise aşırı öğrenmeyi azaltmaya yardımcı olur (Bottou, 2010). 3.2.4 Öğrenme oranı Bu çalışmada modelin eğitimi sırasında kullanılan en önemli hiperparametrelerden biri öğrenme oranıdır. Öğrenme oranı, modelin her adımda ağırlıklarını ne kadar değiştireceğini belirleyen bir katsayıdır. Çok küçük bir öğrenme oranı modelin yavaş öğrenmesine ve yerel minimumda takılı kalmasına neden olabilirken, çok büyük bir öğrenme oranı modelin kararsız davranmasına ve optimum değerin etrafında salınım yapmasına yol açabilir (Bengio, 2012). Modelin eğitimi için uygun öğrenme oranını (learning rate) belirlemek amacıyla, LR Range Test uygulanmıştır. Bu testte diğer bütün parametreler sabitken öğrenme oranı 10−7 ile 10−1 arasında logaritmik olarak artacak şekilde değiştirilmiş ve her öğrenme oranı için kayıp değeri (loss) gözlemlenmiştir. Şekil 3.1’te, öğrenme oranı arttıkça kayıp değerinin nasıl değiştiği görülmektedir: Grafikte görüldüğü üzere, kayıp değeri başlangıçta yüksek seviyede sabit kalmakta, ardından 10−4 ile 10−2 aralığında belirgin bir düşüş göstermektedir. Bu düşüş, modelin bu aralıkta daha etkili öğrendiğini göstermektedir. Özellikle 10−3 civarında 16 Şekil 3.1: LR Range Test grafiği – Öğrenme oranına göre kayıp (loss) değişimi. kayıp değeri minimum seviyeye ulaşmıştır. Ancak 10−2 sonrasında ani dalgalanmalar gözlemlenmekte, bu da modelin dengesizleşmeye başladığını göstermektedir. Bu bilgiler ışığında, Optuna kütüphanesi ile yapılan hiperparametre optimizasyonunda, bu aralık temel alınarak en uygun öğrenme oranı değeri aratılmıştır. Böylece modelin hem hızlı hem de dengeli bir şekilde öğrenmesi sağlanmıştır. Bu tür sistematik aramalar, hiperparametre ayarlamalarında önemli bir rol oynamaktadır. 3.2.5 Momentum Momentum, Stokastik Gradyan İnişi (SGD) algoritmasının güncellemeler sırasında önceki gradyan bilgisini de hesaba katarak daha dengeli ve hızlı bir şekilde en iyi ağırlıklara ulaşmasını sağlar (Ruder, 2016). Momentum, özellikle kayıp yüzeyinin eğimi düşük olan bölgelerinde öğrenmeyi hızlandırırken, yüksek dalgalanma gösteren bölgelerde daha stabil bir öğrenme sağlar. Düşük momentum değeri, modelin güncellemelerde yalnızca mevcut gradyana odaklanmasına neden olurken, yüksek değerler geçmiş gradyanların daha fazla etkili olmasını sağlamaktadır. Optuna ile yapılan hiperparametre arama sürecinde farklı değerlerin model performansına etkisi gözlemlenmiş ve en uygun momentum değeri seçilmiştir. Momentum değerinin dikkatli bir şekilde ayarlanması, öğrenme sürecinin hem hızını hem de kararlılığını doğrudan etkilemektedir (Sutskever, Martens, Dahl, and Hinton, 2013). 17 3.2.6 Epoch ve batch sayıları Model eğitimi sırasında kullanılan iki temel hiperparametre epoch sayısı ve batch size’dır. Epoch, modelin tüm eğitim verisi üzerinde yaptığı tam döngü sayısını ifade eder. Bir epoch sırasında model, tüm eğitim verisini bir kez görür ve parametrelerini günceller. Batch size ise, modelin aynı anda işlediği örnek sayısıdır. Mini-batch gradyan inişi yaklaşımı sayesinde, tüm veri yerine küçük gruplar üzerinden öğrenme gerçekleştirilir, bu da hem eğitim süresini kısaltır hem de daha kararlı gradyan güncellemeleri sağlar (Goodfellow, Bengio, and Courville, 2016). Bu çalışmada model, 30 epoch boyunca eğitilmiş ve her bir iterasyonda 16 örnek içeren batch size değeri kullanılmıştır. Batch size seçimi ile modelin performansı, bellek kullanımı ve öğrenme dinamizmi arasında bir denge kurulması hedeflenir. Daha küçük batch boyutları genellikle daha fazla gürültü içeren gradyanlar üretir, bu da yerel minimumlara sıkışmayı önlemeye yardımcı olabilirken; daha büyük batch boyutları daha kararlı gradyanlar sağlasa da daha fazla bellek tüketimine ve zaman maliyetine neden olabilir (Keskar, Mudigere, Nocedal, Smelyanskiy, and Tang, 2017). Yine bu parametrelerin seçimi kullanılan donanımın gücü, veri setinin büyüklüğü ve kompleksliği, derin öğrenme aracından beklenen göreve göre değişiklik gösterebilmektedir. 3.3 Hiperparametre Optimizasyonu Derin öğrenme modellerinin başarımı, modelin eğitimi sırasında kullanılan hiper- parametrelerin doğru şekilde belirlenmesine doğrudan bağlıdır. Hiperparametreler, modelin eğitimi öncesinde kullanıcı tarafından belirlenen ve öğrenme süreci boyunca sabit kalan parametrelerdir. Öğrenme oranı (learning rate), momentum, ağırlık çürümesi (weight decay), epoch sayısı ve batch büyüklüğü gibi hiperparametreler, modelin ne kadar iyi genelleme yapabileceğini etkileyen kritik unsurlardır. Bu nedenle, uygun hiperparametre kombinasyonlarının sistematik bir şekilde belirlenmesi, modelin doğruluk ve kararlılığını artırmak açısından oldukça önemlidir. Bu çalışmada hiperparametrelerin otomatik olarak optimize edilmesi amacıyla, açık kaynaklı bir Python kütüphanesi olan Optuna kullanılmıştır. Optuna, kullanıcı tanımlı 18 bir amaç (objective) fonksiyonunu optimize etmek için bayesçi optimizasyona dayalı verimli bir arama stratejisi sunar. Temel olarak, Tree-structured Parzen Estimator (TPE) adı verilen bir algoritma ile çalışarak hiperparametre arama sürecini yönlendirir (Akiba, Sano, Yanase, Ohta, and Koyama, 2019). Bu bağlamda, modelin doğruluk performansını en üst düzeye çıkarmak için öğrenme oranı (lr), ağırlık çürümesi (weight_decay) ve momentum hiperparametreleri optimize edilmiştir. Optimizasyon sürecinde toplam 10 farklı hiperparametre kombinasyonu denenmiştir. Her bir deneme için model 30 epoch boyunca eğitilmiş ve doğrulama kümesinde elde edilen son epoch doğruluğu, ilgili denemenin performans değeri olarak değerlendirilmiştir. Bu sayede, model doğruluğunu maksimize eden hiperparametre kombinasyonu seçilmiştir. 3.4 Kullanılan Donanım Özellikleri ve Eğitim Süresi Model eğitimi, yüksek performanslı bir donanım sistemi üzerinde, GPU hızlandırmalı olarak gerçekleştirilmiştir. Eğitimin tamamı NVIDIA RTX 4080 GPU ile yapılmış olup bu sayede işlemler önemli ölçüde hızlandırılmıştır. Hiperparametre optimizasyonu için kullanılan Optuna aracı, toplamda 10 farklı deneme (trial) yürütmüştür. Her bir deneme, modelin 30 epoch boyunca eğitilmesini içermektedir. Her bir epoch’un yaklaşık 20 dakika sürdüğü göz önünde bulundurulduğunda, toplam eğitim süresi yaklaşık 100 saat olarak hesaplanmıştır. Bu hesaplama, tüm denemelerin ardışık olarak çalıştırıldığı senaryoyu temsil etmektedir. Kullanılan donanım bileşenleri Çizelge 3.2’de özetlenmiştir. Çizelge 3.2: Kullanılan donanıma ait teknik özellikler. Donanım Bileşeni Özellik GPU NVIDIA RTX 4080 (12 GB VRAM) İşlemci (CPU) 13th Gen Intel(R) Core(TM) i7-13650HX @ 2.60 GHz RAM 32 GB Depolama 2 TB SSD 19 20 4. HASTA BAZLI KARAR İYİLEŞTİRİLMESİ Bu çalışmada eğitilen model, her hastanın manyetik rezonans görüntüsünün (MR) her dilimi için bağımsız olarak tümör tespiti gerçekleştirmektedir. Ancak, tümörlerin üç boyutlu yapısı göz önüne alındığında, sadece tek bir dilimdeki tahminlere dayanmak yetersiz kalabilmektedir. Bu nedenle, modelin dilimler arasındaki tutarlılığını ve karar doğruluğunu artırmak amacıyla tahmin sonuçları üzerinde özel bir post-processing yöntemi geliştirilmiştir. Bu yöntemde, ardışık dilimlerde bulunan tahmin kutuları (bounding box) arasındaki örtüşme, Kesişim-birleşim oranı (Intersection over Union, IoU) metriği kullanılarak ölçülmüştür.Kesişim-birleşim oranıise, model tarafından tespit edilen bölgenin ve gerçek bölgenin kesişim alanının birleşim alanına oranı olarak hesaplanır: IoU = |Tahmin∩Gerçek| |Tahmin∪Gerçek| (4.1) Bu durumda eğer iki farklı dilimdeki kutular aynı tümör bölgesini işaret ediyorsa, tümörün tamamının doğru şekilde kapsanması ve daha güvenilir bir tespit yapılması için, söz konusu üst üste gelen kutuların yalnızca en büyüğü seçilmiştir. Bu, tümörün olası alt parçalarının gözden kaçmasını önlemek için yapılmıştır. Bu işlem sayesinde, hastadaki birden fazla tümör varlığı olasılığı da korunmakta, yani farklı bölgelerdeki bağımsız tümörler ayırt edilebilmektedir. Sonuç olarak, bu post-processing yaklaşımı dilimler arasında mekânsal tutarlılığı sağlamış, üç boyutlu yapının daha doğru temsil edilmesine olanak tanımış ve modelin karar doğruluğunu önemli ölçüde artırmıştır. 21 22 5. SONUÇLAR Bu tezde model performansını değerlendirmek için üç temel metrik kullanılmıştır: duyarlılık (sensitivity), özgüllük (specificity) ve kesişim-birleşim oranı (Intersection over Union, IoU). Bu metrikler, modelin hem hasta bazlı hem de dilim bazlı testlerdeki başarısını ölçmek amacıyla kullanılmıştır. Duyarlılık (sensitivity), gerçek pozitiflerin (TP) tüm pozitif örnekler içerisindeki oranını ifade eder ve aşağıdaki şekilde tanımlanır: Sensitivity = T P T P+FN (5.1) Özgüllük (specificity) ise gerçek negatiflerin (TN) tüm negatif örnekler içerisindeki oranıdır ve formülü aşağıdaki gibidir: Specificity = T N T N +FP (5.2) Burada, FP yanlış pozitifleri ve FN yanlış negatifleri ifade etmektedir. Performans değerlendirmesi hem dilim bazlı hem de hasta bazlı olarak gerçekleştir- ilmiştir. Dilim bazlı ve hasta bazlı test süreçlerinin ayrıntıları, veri setine ilişkin bilgiler ve bu metriklerin sonuçları sonraki bölümlerde kapsamlı şekilde ele alınacaktır. Önerilen hasta bazlı karar iyileştirmesi methodolojisinin doğruluğa etkisi de sonuçların değerlendirilmesiyle beraber ilerleyen kısımlarda sunulacaktır. 5.1 Test Prosedürü (Hasta Bazlı ve Dilim Bazlı Test) Çalışmamızda model performansını daha hassas biçimde değerlendirebilmek amacıyla hem hasta bazlı hem de dilim bazlı test prosedürleri uygulanmıştır. Özellikle yanlış pozitif tespitlerin (false positive) önüne geçme başarımızı vurgulamak adına, standart Faster R-CNN mimarisi ile önerdiğimiz metodoloji arasındaki farkı ortaya koymak 23 için dilim bazlı bir değerlendirme yaklaşımı geliştirilmiştir. Bu kapsamda, ground truth olarak kullanılan maskeler, her bir dilimdeki tümör varlığını beyaz pikseller ile temsil etmektedir. Eğer bir dilimde maske (yani beyaz piksel) bulunuyor ve model o dilim için bir tahminde bulunuyorsa, bu durum doğru pozitif (TP) olarak değerlendirilmiştir. Benzer şekilde, maskesi bulunan ancak tahmin yapılmayan dilimler yanlış negatif (FN), maskesi bulunmayan ancak tahmin yapılan dilimler yanlış pozitif (FP), ve hem maske hem de tahminin bulunmadığı dilimler doğru negatif (TN) olarak sınıflandırılmıştır. Bu ölçütler doğrultusunda yapılan değerlendirmede, yalnızca Faster R-CNN mimarisi kullanıldığında modelin özgüllük (specificity) değeri %92 olarak ölçülmüştür. Ancak önerdiğimiz metodoloji ile bu değer %98’e yükselmiş ve yanlış pozitif oranında anlamlı bir azalma sağlanmıştır. Bu sonuç, geliştirilen sistemin yalnızca tümör içeren dilimleri yüksek doğrulukla tanımlamakla kalmayıp, aynı zamanda sağlıklı dilimleri gereksiz yere işaretlememe konusunda da üstün bir performans sergilediğini göstermektedir. 5.2 Hasta Bazlı Karar İyileştirmesi Doğruluk Hesabı Önerdiğimiz metodolojinin hasta bazında karar verme başarımını değerlendirmek amacıyla, farklı senaryolarda nasıl bir yol izlediğini gözlemlemek adına kapsamlı bir test uygulanmıştır. Bu testte, tamamı sağlıklı olan 50 hasta ile tümör içeren 50 hasta olmak üzere toplamda 100 hasta verisi kullanılmıştır. Amaç, modelin sadece dilim bazlı değil, hasta düzeyinde de doğru sınıflandırma yapabilme yeteneğini ölçmektir. Modelin hasta bazlı sınıflandırma performansı iki ana ölçütle değerlendirilmiştir: duyarlılık (sensitivity) ve özgüllük (specificity). Bir hastanın “tümörlü” olarak etiketlenebilmesi için, en az bir diliminde model tarafından tümör tespiti yapılması yeterli sayılmıştır. Buna göre, 50 tümörlü hastanın 49’u doğru şekilde tümörlü olarak etiketlenmiş, yalnızca 1 hasta sağlıklı olarak sınıflandırılmıştır. Bu sonuç, %98 duyarlılık (sensitivity) değerine karşılık gelmektedir. Öte yandan, 50 sağlıklı hastadan 46’sı doğru şekilde sağlıklı olarak sınıflandırılmış, 4 hasta tümörlü olarak işaretlenmiştir. Bu da %92 özgüllük (specificity) değerine karşılık gelmektedir. 24 Şekil 5.1: Faster R-CNN modelinin yanlış pozitif tahminleri ve önerilen metodoloji ile bu tahminlerin nasıl elendiğini gösteren örnek görüntüler. 25 Ek olarak, modelin yalnızca sınıflandırma değil, doğru lokalizasyon yapabilme yeteneği de değerlendirilmiştir. Bu kapsamda, modelin işaretlediği kutuların Zenodo veri setinde bulunan tümör maskelerini içerip içermediğine bakılmıştır. Tümörlü olarak işaretlenen 49 hastadan yalnızca 1’inde kutunun yanlış bölgeyi işaretlemesi nedeniyle lokalizasyon hatası meydana gelmiştir. Bu doğrultuda, lokalizasyon doğruluğu %97.95 olarak hesaplanmıştır. Bu test sonuçları, önerilen metodolojinin hasta düzeyinde yüksek doğrulukla karar verebildiğini ve tümör bölgelerini büyük oranda doğru lokalize edebildiğini göstermektedir. Özellikle yanlış negatiflerin oldukça düşük olması, sistemin klinik uygulamalarda güvenilir bir destek aracı olma potansiyelini ortaya koymaktadır. 5.3 Sonuç ve Öneriler Bu çalışmada, meme MR görüntülerinde tümör lokalizasyonuna yönelik geliştirilen derin öğrenme tabanlı bir karar destek sistemi sunulmuştur. Temel olarak Faster R-CNN mimarisi kullanılarak yürütülen bu çalışma, modelin ürettiği tahminlerin hasta bazında değerlendirilmesi ile yanlış pozitiflerin önemli ölçüde azaltılmasını hedefleyen yeni bir metodoloji önermektedir. Geleneksel dilim bazlı analizlerin ötesine geçilerek, her hastaya ait dilimlerin birlikte değerlendirilmesi sayesinde, karar mekanizmasının doğruluk ve güvenilirliği önemli ölçüde artırılmıştır. Yapılan testler sonucunda, Faster R-CNN modelinin tek başına uygulandığı durumda elde edilen %92 özgüllük değeri, önerilen metodoloji ile %98’e ulaşmıştır. Ayrıca 50 sağlıklı ve 50 tümörlü hastadan oluşan veri kümesi üzerinde yapılan değerlendirmelerde, tümörlü 50 hastadan yalnızca biri sağlıklı olarak sınıflandırılmış, sadece bir hastada tümör doğru şekilde tespit edilmesine rağmen lokalizasyon hatalı olmuştur. Sağlıklı hastalar arasında ise yalnızca dört hasta yanlış olarak tümörlü olarak işaretlenmiş, kalan 46 hasta doğru şekilde tanımlanmıştır. Bu bulgular, önerilen sistemin hasta bazlı karar verme süreçlerinde yüksek doğrulukla çalıştığını ve yanlış pozitifleri büyük ölçüde elimine ettiğini göstermektedir. Geliştirilen sistemin sunduğu bu başarıya rağmen, ilerleyen çalışmalarda bazı yönleriyle daha da güçlendirilmesi mümkündür. Özellikle segmentasyon modelleri ile 26 entegre edilerek tespit edilen kutular içerisinde piksel bazlı tümör alanı belirlenebilir, böylece lokalizasyon doğruluğu daha da artırılabilir. Ayrıca farklı görüntüleme modaliteleri ya da klinik verilerin modelle birleştirilmesi, karar sürecine çok boyutlu bir katkı sağlayabilir. Modelin farklı veri setlerinde test edilmesi, genellenebilirliğini ortaya koymak açısından faydalı olacaktır. Bu bağlamda önerilen metodoloji, yalnızca teknik doğruluk açısından değil, aynı zamanda klinik kullanıma uygunluk ve pratik güvenilirlik açısından da önemli bir katkı sağlamaktadır. Elde edilen sonuçlar, sistemin gelecekte gerçek zamanlı tanı destek sistemlerine dönüştürülerek radyologların iş yükünü azaltmada ve tanı süreçlerini iyileştirmede etkin bir şekilde kullanılabileceğini göstermektedir. 27 28 6. TEŞEKKÜR Bu tez çalışmasında kullanılan veri ve teknik destekten dolayı çalıştığım kurum olan InfiWave Diagnostics Yazılım Limited Şirketi’ne teşekkür ederim. Sağladıkları katkılar, bu çalışmanın gerçekleştirilmesinde önemli bir rol oynamıştır. 29 30 KAYNAKLAR A. C. Society. (2016). Cancer facts & figures. Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). Optuna: A next-generation hyperparameter optimization framework. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2623–2631. https://doi.org/10.1145/3292500.3330701 Bengio, Y. (2012). Practical recommendations for gradient-based training of deep architectures. Neural networks: Tricks of the trade, 437–478. Bottou, L. (2010). Large-scale machine learning with stochastic gradient descent. Proceedings of COMPSTAT’2010, 177–186. Dalmiş, M. U., Vreemann, S., Kooi, T., Mann, R. M., Karssemeijer, N., & Gubern-Mérida, A. (2018). Fully automated detection of breast cancer in screening mri using convolutional neural networks. Journal of Medical Imaging, 5(1), 014502. https://doi.org/10.1117/1.JMI.5.1.014502 Giaquinto, A. N., Sung, H., Newman, L. A., Freedman, R. A., Smith, R. A., Star, J., Jemal, A., & Siegel, R. L. (2024). Breast cancer statistics, 2024. Wiley. https: //doi.org/10.3322/caac.21863 Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. MIT Press. https: //www.deeplearningbook.org/ Gui, H., Jiao, H., Li, L., Jiang, X., Su, T., & Pang, Z. (2024). Breast tumor detection and diagnosis using an improved faster r-cnn in dce-mri. Bioengineering, 11(12), 1217. https://doi.org/10.3390/bioengineering11121217 Jiao, H., Jiang, X., Pang, Z., Lin, X., Huang, Y., & Li, L. (2020a). Deep convolutional neural networks-based automatic breast segmentation and mass detection in dce-mri. Computational and Mathematical Methods in Medicine, 2020(1), 2413706. Jiao, H., Jiang, X., Pang, Z., Lin, X., Huang, Y., & Li, L. (2020b). Deep convolutional neural networks-based automatic breast segmentation and mass detection in dce-mri. Computational and Mathematical Methods in Medicine, 2020, 12 pages. https://doi.org/10.1155/2020/2413706 31 Keskar, N. S., Mudigere, D., Nocedal, J., Smelyanskiy, M., & Tang, P. (2017). On large-batch training for deep learning: Generalization gap and sharp minima. arXiv preprint arXiv:1609.04836. https://arxiv.org/abs/1609.04836 Litjens, G., Kooi, T., Bejnordi, B. E., Setio, A. A. A., Ciompi, F., Ghafoorian, M., van der Laak, J. A., van Ginneken, B., & Sánchez, C. I. (2017). A survey on deep learning in medical image analysis. Medical image analysis, 42, 60–88. Methods in Medicine, C. A. M. (2023). Retracted: A hybrid approach based on deep cnn and machine learning classifiers for the tumor segmentation and classification in brain mri [Retracted article]. Raimundo, J. N. C., Fontes, J. P. P., Gonzaga Mendes Magalhães, L., & Guevara Lopez, M. A. (2023). An innovative faster r-cnn-based framework for breast cancer detection in mri. Journal of Imaging, 9(9), 169. Ren, S., He, K., Girshick, R., & Sun, J. (2017). Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 39(6), 1137–1149. https://doi.org/10.1109/ TPAMI.2016.2577031 Richman, I., Asch, S. M., Bendavid, E., Bhattacharya, J., & Owens, D. K. (2017). Breast density notification legislation and breast cancer stage at diagnosis: Early evidence from the seer registry. Journal of General Internal Medicine, 32(6), 603–609. https://doi.org/10.1007/s11606-016-3966-7 Ruder, S. (2016). An overview of gradient descent optimization algorithms. arXiv preprint arXiv:1609.04747. https://arxiv.org/abs/1609.04747 Saha, A., Harowicz, M. R., Grimm, L. J., Weng, J., Cain, E. H., Kim, C. E., Ghate, S. V., Walsh, R., & Mazurowski, M. A. (2021). Dynamic contrast-enhanced magnetic resonance images of breast cancer patients with tumor locations [Data set]. https://doi.org/10.7937/TCIA.e3sv-re93 Sutskever, I., Martens, J., Dahl, G., & Hinton, G. (2013). On the importance of initialization and momentum in deep learning. International conference on machine learning, 1139–1147. Zhang, J. (2023). Breastcancerdce−mridata [Data set]. https://doi.org/https://doi. org/10.5281/zenodo.8068383 Zhong, B., Yi, J., & Jin, Z. (2023). Ac-faster r-cnn: An improved detection architecture with high precision and sensitivity for abnormality in spine x-ray images. Physics in Medicine & Biology, 68(19), 195021. 32 ÖZGEÇMİŞ Adı SOYADI: Şeyma Nur TUFAN ÖĞRENİM DURUMU: • Lisans: 2019, İstanbul Teknik Üniversitesi, İnşaat Fakültesi, Geomatik Mühendisliği MESLEKİ DENEYİMLER VE ÖDÜLLER: • 2022-2024 yılları arasında Doç. Dr. Mahmut Oğuz Selbesoğlu ile birlikte "UAV-GPR Gözlemleriyle Antarktika Horseshoe Adasında Buzulların İzlenmesi Ve 3 Boyutlu Modellenmesi" projesinde stajyer araştırmacı olarak çalıştı. • 2024-2025 yılları arasında Prof. Dr. İbrahim Akduman ile Tıbbi Cihaz Geliştirme ve Uygulama Laboratuvarında araştırmalarına devam etti. • 2025 yılında InfiWave Diagnostics Yazılım Limited Şirketi’nde yazılım mühendisi olarak çalıştı. YÜKSEK LİSANS TEZİNDEN TÜRETİLEN YAYINLAR, SUNUMLAR VE PATENTLER: • Tufan, Ş. N. , A. Janjic and İ. Akduman, (2025). “Deep Learning-Based Breast Tumor Detection in MRI Using Faster R-CNN ” Management Education In Europe. International Graduate Research Symposium (IGRS’25), Mayıs 12-14, 2025 İstanbul, Türkiye. (Presentation Instance) 33 DİĞER YAYINLAR, SUNUMLAR VE PATENTLER: • Ş. N. Tufan, A. Ş. Ayyıldız, A. Janjic, İ. Akduman, O. Buğdayci and L. Çelik, "Mapping of Breast Tissue Dielectric Properties Using T1-Weighted MRI Data," 2024 IEEE-EMBS Conference on Biomedical Engi- neering and Sciences (IECBES), Penang, Malaysia, 2024, pp. 323-327, doi: 10.1109/IECBES61011.2024.10990720. 34