Bilgisayar Bilimleri Lisansüstü Programı - Yüksek Lisans

Bu koleksiyon için kalıcı URI

Gözat

Son Başvurular

Şimdi gösteriliyor 1 - 5 / 34
  • Öge
    İTÜ NER - Türkçe metinlerde adlandırılmış varlık tespiti
    (Lisansüstü Eğitim Enstitüsü, 2015) Şeker, Gökhan Akın ; Eryiğit Cebiroğlu, Gülşen ; 798113 ; Bilgisayar Bilimleri Bilim Dalı
    Adlandırılmış Varlık Tespiti (NER – Named Entity Recognition) en basit şekilde; metin içinden ilgilenilen varlık türlerine ait sözcük adlarının belirlenip bunlara doğru sınıf etiketlerinin atanması olarak tanımlanabilir. Literatürde üzerinde en çok çalışılan türler MUC-6 konferansındaki ortak görevle tanımlanan ENAMEX (kişi, yer, kurum adları) tipleridir. Aynı görevde tanımlanan diğer tipler olan TIMEX (tarih ve saat ifadeleri) ve NUMEX (yüzde ve parasal ifadeler) tipleri de diğer yaygın çalışılan sınıflar olarak karşımıza çıkmakla birlikte aranacak varlık türleri için herhangi bir sınırlama yoktur, protein adları, gen adları, ilaç adları gibi çok çok farklı alanlarda çalışmalara da rastlanabilmektedir. Bu çalışma temel olarak üç aşamada yürütülmüştür. Birinci aşamada ENAMEX türleri üzerinde resmi dille yazılmış metinlerde çalışan bir sistem ortaya konmuş mevcut Türkçe NER sistemleri arasında en yüksek başarım raporlanmıştır; ikinci aşamada bu sisteme TIMEX ve NUMEX türleri eklenerek üzerinde çalışılan tür sayısı yediye çıkarılmıştır; üçüncü aşamada ise bu sistem günlük konuşma diline yakın olan Web 2.0 metinlerine uyarlanmıştır. Birinci aşamada literatürde mevcut çalışmalar incelenirken neredeyse hemen hemen tüm çalışmaların farklı veri kümeleri üzerinde test edildiği veya değerlendirmede farklı kıstaslar esas alındığı için karşılaştırılabilir olmadığı tespit edilmiş ve geçmiş çalışmalar için değerli sonuçlar ortaya koyduğu düşünülen bir çalışma ile konu üzerindeki önemli geçmiş yayınların detaylı değerlendirmesi yapılmıştır. Çalışma sonucunda ortaya konan model, makine öğrenmesi metodu olarak Şartlı Rastgele Alanlar (CRFs) kullanırken diğer yanda titiz bir çalışma ile derlenen alan atlaslarından (gazetteer) da faydalanıldığı için hibrit bir model olarak nitelenebilir. Bu aşamanın sonunda Türkçe gazete haber metinlerinde MUC kıstaslarıyla %95, CoNLL kıstaslarıyla %92 F-ölçütü başarımı ile literatürdeki en yüksek başarım raporlanmıştır. İkinci aşamada birinci aşamanın çıktısı olan modele TIMEX ve NUMEX türlerini de tespit edebilme yeteneği eklenmiştir. Bu aşamada yapılan temel iş birinci aşamada kullanılan verinin yedi tür için yeniden işaretlenmesi ve yeni eklenen türlerin tanınmasında başarımı artırmak için ilave alan atlasları ve CRFs özellikleri eklenmesidir. Sonuçta yedi tür için de benzer oranda yüksek başarım elde edilmiştir. Üçüncü aşamada resmi dille yazılmış metinlerde çalışan model, serbest biçimli dile uyarlanarak, Web 2.0 verisinde çalışmalar yapılmıştır. Bu aşamada iki ayrı sosyal medya veri kümesi işaretlenmiş ve kuralsız metinlerin kurallı metinlere benzetimini sağlamaya yönelik düzeltme adımları eklenmiştir. Twitter veri kümesi üzerinde %68 ile literatürdeki en yüksek başarım oranlarına ulaşılmıştır. Araç diğer güncel bilimsel çalışmalarda kullanılan veri kümeleri üzerinde de test edilerek sonuçlar karşılaştırmalı olarak verilmiştir. Bu çalışma ile hazırlanan üç adet işaretli veri kümesi ve geniş alan atlasları (kişi ad, kişi soyad, yer adları gibi) bu alanda yapılacak sonraki çalışmalarda faydalanılabilecek önemli kaynaklar olarak araştırmacıların hizmetine açıktır. Modelin kendisi de İTÜ Doğal Dil İşleme Araçları arasında çevrimiçi kullanıma açılmıştır.
  • Öge
    Congestion and packet classification based flow management for software-defined networks
    (Institute of Science and Technolgy, 2020) Akkoç, Mertkan ; Canberk, Berk ; 637468 ; Department of Computer Engineering
    In this thesis, we focus on problems in the control plane and problems in the data plane of SDN separaterly. In the control plane, we specifically try to increase the response time of the SDN controller in ultra-dense scenarios. In the data plane, we aim to construct an efficient data structure to achieve both fast rule update and fast packet classification. In the SDN, the control plane is responsible for deciding route and operations for flows that coming to the data plane. To do so, the SDN controller in the control plane has a central view and controls all switches in the data plane. But, this can cause an increase in both e2e latencies of packets and drop rate in the controller if there is a high spiky demand of incoming heterogeneous flows. Because, switches in data plane have to ask what to do to the controller if there is a new incoming flow to them. When newly coming flows increase, communication traffic between the controller and data plane increase. As a result, this can cause congestion in the SDN controller, and e2e latency and drop rate in the controller increase because of this congestion. To solve these problems, we propose a management engine to implement in the SDN controller in ultra-dense SDN scenarios. In this engine, we propose two steps: admission and prioritization steps. We also create different queues for different types of 5G flows (URLLC, eMBB, mMTC) in each step. In the admission, we modify Loss Ratio-Based Random Early Detection (LRED) Algorithm. In prioritization, we propose a tree-based prioritization that considers the priority needs of different flow types and near future states of different queues. According to simulation results, our response time of the SDN controller, e2e latency of packets and dropped rate in the controller are better up to 53%, 58%, and 36%, respectively. Packet classification is a key factor for choosing proper action for incoming packet and has to be done fast, especially in OpenFlow. But OpenFlow vSwitch technology doesn't allow to use some fast hardware technology for packet classification like TCAM. Decision tree methods are preferred solutions for fast classification in OpenFlow vSwitch in the literature. But most of these methods can cause the rule replication problem. As a result, while the duration of packet classification decreases, rule update duration increases. There are also rule partitioning methods in the literature to solve this problem, but the running time of these methods mostly depends on the number of rule fields. Also, some of these solutions don't overcome the rule replication problem. At that point, the main question is that how can we make the rule partitioning fast by both preventing the rule replication and allowing fast packet classification and rule update in OpenFlow vSwitch? To solve the rule partitioning problem, we convert this problem to the interval partitioning and propose a classic Greedy Algorithm. As a result, the running time of the partitioning algorithm only depends on the rule number. After partitioning, we propose to use HyperCuts to construct decision trees for fast packet classification and rule update. According to performance evaluation results, we do the rule partitioning and rule updates faster than the PartitionSort method with the percentage of 88, 15, respectively. We also classify packets faster than the TupleMerge method with the percentage of 40 for online and 50 for offline scenarios.
  • Öge
    Sembolik planlama için uzam-zamansal çıkarsamayla nesne modellerinin ve etkileşimlerinin öğrenilmesi
    (Bilişim Enstitüsü, 2012) Ersen, Mustafa ; Sarıel Talat, Sanem ; 371577 ; Bilgisayar Bilimleri ; Computer Sciences
    Bu tez çalışmasında özerk eylem planlamada kullanılmak üzere ortamdaki çeşitli nesneler arasındaki etkileşimleri öğrenmeye yönelik bir yöntem sunulmaktadır. Öğrenme için ortamdaki nesneler üzerinde gözlemlenen olaylar ve zaman bilgileri ile nesnelerin ilk durumuna ilişkin uzamsal bilgilerden yararlanılmaktadır. Bunun dışında nesnelere ve türlerine ilişkin herhangi bir anlamsal bilgi ya da nesnelerin olaylar arasındaki durumlarına ilişkin bilgi kullanılmamaktadır. Nesne etkileşimlerini öğrenmek üzere uygun bir sınama ortamı olarak ?The Incredible Machine? bilgisayar oyunu kullanılmış ve öğrenme sisteminin başarımı nesneler arasındaki ilişkileri temsil eden farklı seviyelerde bilgi kullanılarak analiz edilmiştir. Nesneler arasında doğrudan gözlemlenebilen ilişkileri barındıran bir bilgi tabanı sisteme sağlandığında, etkileşimler daha sonra planlamada kullanılabilecek seviyede öğrenilmektedir. Ayrıca, nesnelerin uzamsal bilgileri ve olayların zamansal bilgileri üzerinden çıkarsama yapılarak da etkileşimler öğrenilebilmekte ve uzam-zamansal bir yaklaşımla bu bilgiler bir arada kullanılarak bilgi-tabanlı yaklaşıma yakın seviyede sonuçlar elde edilmektedir. İnsan seviyesinde bir müdahaleye gerek olmadan bilgisayarla görü teknikleri yardımıyla otonom bir şekilde elde edilmesi mümkün olan uzamsal ve zamansal bilgiler üzerinden çıkarsama yapmanın mümkün olması makine seviyesinde öğrenmenin başarılı olduğu sonucunu doğurmaktadır.
  • Öge
    Etmenlerle elektronik oylama
    (Bilişim Enstitüsü, 2005) Sandıkkaya, Mehmet Tahir ; Örencik, Bülent ; Bilgisayar Bilimleri ; Computer Science
  • Öge
    Duyarga Ağları İçin Karınca Kolonisi Tabanlı Bir Yönlendirme Algoritması Çözümlemesi Ve Tasarımı
    (Bilişim Enstitüsü, ) Demiray, Deniz ; Altılar, Deniz Turgay ; 299953 ; Bilgisayar Bilimleri ; Computer Science
    Bu çalışmada, duyarga ağlarında çalışmak üzere tasarlanan yeni bir yönlendirme algoritması (ANCOR) anlatılmıştır. ANCOR algoritması, doğadaki karınca kolonilerinin yeni yiyecek kaynağı bulup yiyeceklerini yuvalarına taşırlarken, ya da koloni için yeni bir yuva mekanı ararlarken gösterdikleri davranışlardan esinlenilerek hazırlanmıştır. Doğadaki karınca davranışlarının mümkün olduğunca yakından modellenmesi ile elde edilen ANCOR, duyarga ağlarının ihtiyaçlarını karşılayan, kendi kendine organize olabilen bir yönlendirme algoritmasıdır. İletişim sırasında çok küçük veri paketlerinin kullanılması, bant genişliğinin daha az işgal edilmesini sağlamaktadır.