LEE- Bilgisayar Mühendisliği-Yüksek Lisans

Bu koleksiyon için kalıcı URI

Gözat

Son Başvurular

Şimdi gösteriliyor 1 - 5 / 13
  • Öge
    Yabancı dil öğrenimi için otomatik gramer egzersizi üretimi üzerine kullanıcı algılarının değerlendirilmesi
    (Lisansüstü Eğitim Enstitüsü, 2022-12-28) Bektaş, Fatih ; Eryiğit, Gülşen ; 504181514 ; Bilgisayar Mühendisligi
    Morfolojik olarak zengin dillerin yapısı gereği, dilbilgisinin kelime düzeyinde gömülü olması nedeniyle öğrenciler için dil öğrenimi ve öğretmenler için dil alıştırmaları oluşturma süreci oldukça zor hale gelebilmektedir. Kelimelerin, çoklu çekimlemeler ve türetmeler nedeniyle karmaşıklıklıkları artabilmektedir. Yabancı dil öğrenicileri için bu dillerde, bir kelimenin başsözcüğünü bulmak ve sözlükten aramak bile zorlu bir görev olabilmektedir. Bu da başlangıç seviyelerindeki öğreniciler için fazla sayıda alıştırmaya maruz kalarak dilin morfolojik yapısını öğrenme gerekliliğini ortaya çıkarmaktadır. Dil eğitimi programlarında kullanılan ders kitaplarındaki sınırlı sayıdaki alıştırmalar yeterli olmamaktadır. Bu noktada dinamik olarak üretilebilecek alıştırmaların önemi açığa çıkmaktadır. Bu doğrultuda morfolojik olarak zengin diller için sonlu durum dönüştürücüsü tabanlı morfolojik çözümleyiciler ve morfolojik üreticiler önemli bir çözüm imkanı sunmaktadır. Teknolojinin gelişmesiyle birlikte eğitim ortamlarında artan oranda dijital teknolojilerden destek alınmaktadır. Akıllı telefonların giderek daha fazla öğrenme amacıyla kullanılması ile birlikte, mobil uygulamaların eğitimdeki konumu büyümektedir. Bu doğrultuda mobil destekli dil öğrenimi konsepti giderek popüler hale gelmektedir. Ayrıca mobil destekli dil öğreniminde oyunlaştırma yaklaşımları, dil öğrenme uygulamalarının etkililiğini artırmaktadır. Bu çalışmada, karmaşık morfoloji öğrenimi için İTÜ'de geliştirilen sonlu durum dönüştürücüsü tabanlı bir oyunlaştırma yaklaşımının, yabancı dil olarak Türkçe öğrenenler üzerindeki motivasyonel ve davranışsal sonuçları araştırılmaktadır. Karmaşık morfoloji öğrenimi için önerilen oyunlaştırma yaklaşımına yönelik öğrencilerin algıları ölçülerek nicel ve nitel analizler yapılmıştır. Analizler sonucu ortaya çıkan yeni isterler neticesinde, söz konusu mobil uygulama farklı arayüz dillerini ve Türkçeden farklı dilleri destekleyebilecek bir yapıya kavuşturulmuştur. Test amaçlı olarak Fransızca dili için gerçekleme yapılmıştır. Ayrıca uygulamada sunulan alıştırmaların, gerçek hayattan alınan bağlamlar ile genişletilmesi doğrultusunda çalışmalar yürütülmüştür. Öğrenci algılarının ölçülmesi adına yürütülen deney 3 haftalık bir kapsamda sürdürülmüştür. Deneyin katılımcıları, A1 seviyesi Türkçe dil eğitimi sınıfında bulunan yabancı öğrencilerdir. Uygulama, dil eğitiminde yardımcı bir araç olarak kullanılmıştır. Katılımcıların deney süresi içerisinde, müfredatlarına paralel olarak uygulama içerisindeki bazı oyunları oynamaları istenmiştir. Deney süreci içerisinde günlük uygulaması yapılmış, deney sonunda anket ve yarı yapılandırılmış odak grup görüşmesi uygulanmıştır. Sonuçlar, katılımcıların büyük çoğunluğunun uygulama hakkında olumlu bir algıya sahip olduklarını göstermiştir. Öğrencilerin önceki mobil destekli dil öğrenimi deneyimlerine kıyasla önerilen yaklaşım, öğrencilerin müfredata uygun olan dilbilgisi alıştırmaları ihtiyaçlarını karşıladığı için beğenilmiştir. Bulgular, öğrencilerin bu yaklaşımdan sınıf ortamlarında ek materyal olarak yararlanabileceğini göstermektedir. Kullanım istatistikleri ayrıca, oyun ögelerinin öğrenciler arasında rekabeti beslediğini ve statik alıştırmalardan farklı olarak onları birbirinden farklı, dinamik olarak üretilmiş içeriklerle alıştırmaları tekrar etmeye yönlendirdiğini ortaya koymuştur. Türkçe için diğer mobil destekli dil öğrenimi uygulamaları ile deneyim sahibi olan katılımcıların görüşleri ışığında, önerilen yaklaşımın morfolojik olarak zengin diller için dilbilgisinin açık alıştırmalar aracılığı ile öğretimi alanında önemli bir boşluğu doldurduğu görülmektedir.
  • Öge
    Mac sublayer protocol design and optimization for aerial swarms
    (Graduate School, 2023-07-28) Aydın, Esin Ece ; Seçinti, Gökhan ; 504211514 ; Computer Engineering
    The main objective of this thesis is to design and optimize a MAC sublayer protocol for ad hoc networks, with a primary focus on maintaining the reliabile communication. Ad hoc networks, comprising aerial swarms, provide benefits such as easy use and operation in diverse environments, thanks to their simple and economical deployment, along with their remarkable maneuverability. However, the communication standard used in these networks -IEEE 802.11 standard, widely known as Wi-Fi- is primarily designed for networks with limited mobility and minimal changes in network topology. As a result, the existing Wi-Fi standards have limitations in accommodating rapidly changing network topology. This limitation becomes particularly problematic for aerial swarms that require reliable and high-bandwidth multi-hop communication links, ultimately leading to an inability to meet the quality of service (QoS) requirements. Due to the dynamic and contested nature of ad hoc networks, ensuring reliable communication can be challenging at times. To address network management challenges in highly decentralized networks, a self-organizing TDMA-based protocol is proposed. This protocol is designed to tackle communication difficulties in ad hoc networks and optimize the overall communication process by incorporating intelligent topology management, dynamic slot assignment, slot migration, and slot releasing as key components. By integrating these features, the protocol aims to enhance communication reliability and address the specific requirements of ad hoc networks. Implementing this protocol at the data link layer allows for decentralized coordination among nodes, removing the requirement for a central unit and assuring continuous communication even in dynamically changing environments and conditions. In contrast to existing MAC-sublayer protocols, the goal of this research is to present and simulate a protocol that meets ad hoc network's specific requirements. The thesis begins with an examination and modeling of the current situation, which is followed by an outline of services, message formats, procedural rules, and sequence diagrams for the subsequent protocol design stage. The protocol's design incorporates a number of notable abilities, such as slot operations, frame size modifications, topology management, optimization in control packet exchange, and collision avoidance, all of which contribute to the protocol's successful operation. To validate the findings of this thesis, the suggested protocol is evaluated using the OMNeT++ simulation environment. In contrast to previous studies, the proposed S-TDMA protocol is assessed based on four key metrics: energy efficiency, control traffic, packet delivery ratio, and average channel utilization. The evaluation results indicate a substantial enhancement in overall channel utilization, reaching up to 55%, while also reducing control traffic overhead by approximately 13%. These outcomes highlight the effectiveness and benefits of the proposed protocol in improving network performance and resource utilization. The results of simulations provide important insights into the protocol's performance and ability to adapt to changing network conditions.
  • Öge
    An online network intrusion detection system for DDoS attacks with IoT botnet
    (Graduate School, 2022-05-23) Aydın, Erim ; Bahtiyar, Şerif ; 504181513 ; Computer Engineering
    The necessity for reliable and rapid intrusion detection systems to identify distributed denial-of-service (DDoS) attacks using IoT botnets has become more evident as the IoT environment expands. Many network intrusion detection systems (NIDS) built on deep learning algorithms that provide accurate detection have been designed to address this demand. However, since most of the developed NIDSs depend on network traffic flow features rather than incoming packet features, they may be incapable of providing an online solution. On the other hand, online and real-time systems either do not utilize the temporal characteristics of network traffic at all, or employ recurrent deep learning models (RNN, LSTM, etc.) to remember time-based characteristics of the traffic in the short-term. This thesis presents a network intrusion detection system built on the CNN algorithm that can work online and makes use of both the spatial and temporal characteristics of the network data. By adding two memories to the system, with one of them, the system can keep track of the characteristics of previous traffic data for a longer period, and with the second memory, by keeping the previously classified traffic flow information, it can avoid examining all of the packets with the time-consuming deep learning model, reducing intrusion detection time. It has been seen that the suggested system is capable of detecting malicious traffic coming from IoT botnets in a timely and accurate manner.
  • Öge
    Akademik hukuk makalelerinde atıf önerisi
    (Lisansüstü Eğitim Enstitüsü, 2023-06-22) Arslan, Doğukan ; Eryiğit, Gülşen ; 504201515 ; Bilgisayar Mühendisliği
    Hukuk ve Doğal Dil İşleme çalışmalarının kesişiminde, hukuki metinlerin anlaşılması, işlenmesi, yorumlanması ve üretilmesi gibi konulara odaklanan "Hukuki DDİ" çalışmaları yer alır ve bu çalışmalar farklı hukuki metin türleri üzerinde çeşitli alt görevlere odaklanmaktadır. Bu çalışmalardan biri de Atıf Öneri görevidir. Atıf Önerisi, bilimsel makalelerde belirli bir metin için potansiyel atıfların belirlenmesi çalışmalarını kapsar. Ancak, bu görevdeki çalışmalarda, veri kümelerinin alan bazında yeterince kapsayıcı olmaması ve alanlara dengesiz dağılması gibi sorunlar genellikle ihmal edilmektedir. Son zamanlarda yapılan bir çalışmada, bu sorunlar ele alınmış ve farklı alanları kapsayan yeni bir veri kümesi oluşturulmuştur. Ancak, hukuk gibi bazı temel alanlar hala bu tür çalışmaların dışında kalmaktadır. Bu nedenle, Atıf Önerisi gibi alt görevlerde bile, büyük veri kümeleriyle eğitilen dil modelleri, alan bazında eksiklikler gösterebilmektedir. Hukuki Doğal Dil İşleme bağlamında Atıf Önerisi, çoğunlukla mahkeme kararları gibi bilimsel olmayan hukuki metinlerden, var olan argümanları gerekçelendirmek için çeşitli atıfların elde edilmesini amaçlar. Hukuk sistemleri, Ortak Hukuk ve Kıta Avrupası Hukuk sistemi olmak üzere iki ana kategoriye ayrılabilir. Ortak Hukuk sistemine sahip ülkelerde, kararların sonuçları geçmiş davaların incelenmesiyle belirlenir ve bu nedenle kararlar arasında çok sayıda atıf bulunurken, Kıta Avrupası Hukuk sistemine sahip ülkelerde karar verme süreci daha çok olgusal kanıtlar ve ilgili kanun maddelerine dayanır. Bu da kararların kanunlara ve tüzüklere daha fazla atıf içermesine yol açar. Her iki sistemde de hukuk uygulayıcıları için emsal kararları bulmak önemlidir, ancak bu süreç zaman alıcı olabilir. Türkiye'de Yargıtay tarafından yayınlanan 7 milyondan fazla karar bulunmaktadır ve avukatlar, ilgili içtihatları aramak için önemli miktarda zaman harcamaktadır. Hukuki Atıf Önerisi görevinin halihazırdaki önemi ve faydaları, akademik hukuk metinlerinin gereken ilgiyi görmemesi ve görev kapsamına alınmamasıyla sonuçlanmıştır. Bununla birlikte, bilimsel makalelerden otomatik olarak atıf bilgisi çıkarılarak elde edilecek olan işaretli veri ile, etiketli veri oluşturmanın maliyetli olduğu Hukuki Doğal Dil İşleme görevleri için önemli bir kaynak oluşturulabilir. Bu yaklaşım, Atıf Önerisi görevinin yanı sıra emsal karar bulma, hukuki belge benzerliği ve hukuki karar tahmini gibi diğer görevlerde de etkili olabilir. Bu şekilde, akademik hukuk metinleri daha verimli bir şekilde kullanılarak daha iyi performans gösteren dil modelleri geliştirilebilir. Ayrıca, diğer bilimsel alanlardan farklı dilbilimsel özelliklere sahip olan hukuki metinler için özel bir ilgi gerekir. Geleneksel Atıf Önerisi görevinden ayrışan Hukuki Atıf Önerisi, bu özellikleri anlayabilen ve etkili atıf önerileri sunabilen dil modellerine ihtiyaç duyar. Bilimsel yayıncılığın hızlı genişlemesiyle birlikte, atıfların güvenilirliği ve kalitesiyle ilgili endişeler ortaya çıkmış ve Atıf Önerme görevi zaman içinde önem kazanmıştır. Bu görev kapsamında işbirlikçi filtreleme, çizge temelli filtreleme ve içerik temelli filtreleme gibi yöntemler kullanılmaktadır. Farklı metin türleri, haberlerden patentlere ve yargı kararlarına kadar, Atıf Önerme görevinde kullanılmıştır. Görev, önerinin kapsamına bağlı olarak da genellikle yerel ve küresel olmak üzere iki ana kategoriye ayrılır. Çeşitli akademik makale veri kümeleri, Atıf Önerme tekniklerinin geliştirilmesi ve test edilmesi için kullanılmıştır. Atıf Önerİ yöntemleri, akademik olmayan hukuki metinleri (mahkeme kararları, tüzükler, atıfta bulunulan yasalar vb.) tespit etmek amacıyla hukuk alanına uyarlanmaktadır. Bu uyarlamalar, Hukuki Atıf Önerme görevi adı altında gerçekleştirilmektedir. Tez kapsamında Hukuki Atıf Öneri görevi için, akademik hukuki makalelerden oluşan bir veri kümesi toplanmıştır. Bu veri kümesi, Atıf Önerme ve ilgili görevlerde iyi performans gösteren veya hukuk alanında eğitilmiş toplamda yedi farklı modelin test edildiği dört farklı deney düzeninde kullanılmıştır. Gerçekleştirilen deneylerde, yedi farklı model için dört farklı deney düzeni kullanılarak, önceden eğitilmiş modellerin doğrudan kullanılması, modellere ince ayar yapılması ve BM25 ile ilgili makalelerin çekilmesiyle birlikte yeniden sıralanması üzerinde çalışmalar yapılmıştır. Benimsenen iki aşamalı yaklaşım, dil modellerinin hantallığını azaltmak için BM25 gibi daha hızlı ancak daha az doğruluk gösteren modelleri kullanarak makale örneklerini hızlı bir şekilde seçmeyi amaçlar. Bu yaklaşım, bilgi getirimi çalışmalarında sistem etkinliğini artırmak için sıkça kullanılır. İlk aşamada, hızlı modellerle ilgili belgelerin örneklerini alırken, daha sonra yavaş ancak daha doğru olan modellerle bu aday makaleler yeniden sıralanır. İngilizce hukuki atıf önerme görevi için LawArXiv adlı hukuki bilimsel makaleler veritabanından makaleler indirilmiştir. Bu veritabanı, 1366 bilimsel hukuki makaleye sahip olan ve çeşitli hukuki konuları kapsayan bir kaynaktır. Makalelerin atıf yapılan kaynakları elde etmek için Google Scholar kullanılmış ve 10 binden fazla atıf içeren makale elde edilmiştir. Elde edilen makalelerin öz kısmı pdfplumber adlı bir Python paketi ile çıkarılmış, ardından başarılı bir şekilde çıkarılan İngilizce makaleler seçilmiştir. Ön işleme adımlarıyla makaleler düzenlenmiş ve öz kısımları çıkarılmıştır. Deneylerde 719 LawArXiv makalesi ve 8,887 atıf içeren 10,111 atıf bağlantısı içeren bir veri kümesi kullanılmıştır. Makalelerin öz kısımları, benzer içerik temelli küresel atıf önerme çalışmalarıyla uyumlu bir şekilde, ince ayar, temsil elde etme ve test aşamalarında girdi olarak kullanılmıştır. Veri kümesi, eğitim ve test olarak ayrılmış olup, verilerin %70'i eğitimde kullanılmış ve kalan %30'u test için ayrılmıştır. İnce ayar aşamasında üçlü kayıp fonksiyonu kullanılmıştır. Bu fonksiyon referans girdiyi (çapa) pozitif bir girdiyle (benzer) ve çapayla eşleşmeyen negatif bir girdiyle karşılaştırır. İnce ayar ve temsil elde etme adımlarından sonra, belge temsil vektörleri vektör uzayında benzerliklerine göre sıralanmıştır. Tüm eğitim ve test süreçlerinde Sentence-Transformers çerçevesi kullanılmıştır. Deneylerin sonuçları, bilgi getirimi çalışmalarında yaygın olarak kullanılan üç farklı metrik olan Mean Average Precision (MAP) (Ortalama Kesinliklerin Ortalaması), Recall (Duyarlılık) ve Mean Reciprocal Rank (MRR) (Sıralamaların Terslerinin Ortalaması) kullanılarak sunulmuştur. Bu metrikler, bir makalenin ortalama olarak 14 atıf bağlantısına sahip olduğu göz önüne alınarak, getirilen ilk 10 belge için (n=10) raporlanmıştır. Önceden eğitilmiş çeşitli modeller ve derlenen veri kümesi eğitilmiş BM25 modelinin karşılaştırması, SciBERT'in diğer modellere kıyasla en düşük performansı gösterdiği, Law2Vec ve LegalBERT gibi hukuki derlemlerle eğitilen modellerin atıf önerme görevinde başarısız olduğu, SGPT'nin ise SPECTER ve SciBERT'ten daha iyi performans gösterdiği ancak BM25'in en başarılı model olarak öne çıktığı sonucunu ortaya koymuştur. Bu sonuçlar, literatürdeki bilimsel alan temelli Atıf Önerme çalışmalarıyla da uyumludur. Önceden eğitilmiş modellere ince ayar yapıldığında elde edilen sonuçlar incelendiğinde, modellerin genel olarak benzer performans sergilediği ancak BM25'i geçemediği görülmektedir. Bununla birlikte, ince ayarlı LegalBERT modelinin performansının önemli ölçüde arttığı, modelin göreve aşinalığının alan bilgisiyle birleşmesinin performansı artırdığı gözlemlenmiştir. En başarılı modeller arasında SciNCL ve SciBERT öne çıkmaktadır, SciBERT'in performansındaki sıçrama dikkat çekicidir. Önceden eğitilmiş modellerin sıralama yeteneklerini BM25'in geri getirme kapasitesiyle birleştiren deneylerin sonuçları önceden eğitilmiş modellerin BM25'in performansını artıramadığını gösterse de, SciNCL'nin tartışmasız olarak en başarılı model olduğunu ortaya koymaktadır. BM25 ile getirilen makalelerin ince ayarlı modellerle yeniden sıralanması sonucunda, tüm ince ayarlı modellerin BM25'in performansını artırdığı gözlemlenmekte olup, SciNCL'in diğer deneylerle uyumlu olarak en başarılı model olduğu görülmektedir (0.30 MAP@10). Bu çalışmada, İngilizce Hukuki Atıf Önerisi veri kümesi oluşturulmuş ve Atıf Önerisi görevinde başarılı modeller ile alana özel eğitilmiş modellerin performansları karşılaştırılmıştır. Ayrıca, iki aşamalı bilgi getirme yöntemi kullanılmıştır. Sonuçlar, öne sürülen hipotezlerin doğruluğunu desteklemektedir. Dil modellerinin Hukuki Atıf Önerisi görevinde başarılı olabilmesi için akademik hukuk makalelerine yer verilmesi gerektiği ortaya çıkmıştır. Aynı şekilde, hukuki dokümanlarla eğitilen modellerin daha kapsayıcı olabilmesi için akademik hukuk makalelerinin de eğitim veri kümesinde bulunması gerektiği gösterilmiştir. İki aşamalı bilgi getirme yöntemi, büyük dil modellerinin ve BM25'in en iyi yönlerini birleştirerek genel performansı artırmaktadır. BM25 ile SciNCL'in birlikte kullanılması, Hukuki Atıf Önerisi görevinde en başarılı sonuçları vermektedir. Gelecek çalışmalar açısından, iki aşamalı bilgi getirme yöntemi önemli bir araştırma alanıdır. Ayrıca, elde edilen Hukuki Atıf Önerisi modelinin farklı hukuki görevlere uygulanması ve başarımlarının test edilmesi önemlidir. Veri kümesinin boyutunu artırmak için çeşitli çalışmalar da yapılabilir. Özellikle veri kümesi büyüdükçe, BM25'in hızı ve performansı daha iyi değerlendirilebilir.
  • Öge
    Fight recognition from still images in the wild
    (Graduate School, 2022-06-22) Aktı, Şeymanur ; Ekenel, Hazım Kemal ; 504191539 ; Computer Engineering
    Violence in general is a sensitive subject and can have a negative impact on both the involved people and witnesses. Fighting is one of the most common types of violence which can be defined as an act where individuals intend to harm each other physically. In daily life, these kinds of situations might not be faced too often, however, the violent content on social media is also a big concern for the users. Since violent acts or fights in particular are considered as an anomaly or intriguing for some, people tend to record these scenes and upload them on their social media accounts. Similarly, news agencies also regard them as newsworthy material in some cases. As a result, fighting scenes become available on social media platforms frequently. Some users may be sensitive to these kinds of media content and children who can be harmed due to the aggressive nature of the fight scenes also uses social media. These facts make it necessary to detect and put limitations on the distribution of violent content on social media. There are some systems focusing on violence and fight recognition on visual data. However, these works mostly propose methods on different domains for violence such as movies, surveillance cameras, etc., and the social media case remains unexplored. Furthermore, even if most of the fight scenes shared on social media are in video sequences, there is also a non-ignorable amount of image data depicting violent fighting. However, no work tackles the fight recognition from still images instead of videos. Thus, in this thesis, the problem of fight recognition from still images is investigated. In this scope, first, a novel dataset was collected from social media images which is named Social Media Fight Images (SMFI). The dataset was collected from Twitter and Google images and some frames were included from the video dataset of NTU CCTV-Fights. The fight samples were chosen among the samples which are recorded in uncontrolled environments. In order to crawl a large amount of data, different keywords were used in various languages. The non-fight samples were also chosen among the data crawled from social media in order to keep the domain consistent across the classes. The dataset is made publicly available by sharing the links to the images. For the classification of the Social Media Fight Images dataset, some image classification methods were applied to the dataset. First, Convolutional Neural Networks (CNN) were employed for the task and their performance was assessed. Then, a recent approach, Vision Transformer (ViT) was exploited for the classification of the fight and non-fight images. The comparison showed that the Vision Transformer gives better results on the dataset achieving a higher accuracy with less overfit. A further experiment was also held on investigating the effect of varying dataset sizes on the performance of the model. This was seen as necessary as the data shared on social media may be deleted in the future and it is not always possible to retrieve the whole dataset. So, the model was trained on different partitions of the dataset and the results showed that even if using more data is better, the model could still give satisfying performance even in absence of 60% of the dataset. Upon the successful results on fight recognition on still images problem, another experimental study was conducted on the classification of video-based datasets using a single frame from each sample. The experiment included four video-based fight datasets and results showed that three of them could be successfully classified without using any temporal information. This indicated that there might be a dataset bias for these three datasets where the inter-class visual difference is high across the classes. Cross-dataset experiments also supported this hypothesis where the trained models on these video datasets perform poorly on the other fight recognition datasets. Nonetheless, the network trained on the proposed SMFI dataset gave a promising accuracy on other datasets as well, showing that the dataset generalizes the fight recognition problem better than the others.