Sözlüksüz Köke Ulaşma Yöntemi

thumbnail.default.alt
Tarih
2002
Yazarlar
Cebiroğlu, Gülşen
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Doğal Dil alanında yapılan çalışmalar iki kümeye ayrılabilir: 1o Dilden Bağımsız 2o Belli bir dile yönelik çalışmalar. Dilin nedensel olmadığını varsayanlar birinci yöntemi yeğlemişlerdir. Türkçe’nin kurallı bir dil olması nedeniyle, doğal dil işlemede özel bir durumu vardır. Türkçe’nin bu özelliğine dayanarak geliştirilen, sözlük kullanmadan kök bulma yöntemi ve bu yönteme uygun olarak gerçekleştirilen yazılım bu tezde tanıtılmaktadır. Tez kapsamında, Türkçe bir sözcüğün, kök ve eklerine sözlük kullanmadan ayrıştırılmasının kurallaştırılabileceği iddia edilmiş ve kanıtlanmıştır. Yapılan çalışmada, bir sözcük köküne getirilebilecek ekler kümelere ayrılmış ve her küme için, eklerin sözcüğe getiriliş sıraları kurallaştırılarak, sonlu durum makineleri oluşturulmuştur. Kümelere özgü oluşturulan makineler birleştirilerek ortaya çıkan ana makine yardımıyla yapılan biçimbirimsel analizde, bir sözcüğe getirilen eklerin sondan başlanarak başa doğru sözcükten çıkarılması ile, sözcük köküne ulaşıldığı görülmüştür.
The studies done in the natural language field can be divided into two categories: 1o Independent from the language 2o Dependent to a specific language. People who suppose that the language isn’t causal prefer the first one. Due to its regularity, Turkish language has a special status in natural language processing. Root reaching method without dictionary formed based on this property of the Turkish language and the software developed according to that method are presented in this thesis. In the thesis’ content, it is claimed and proved that the analysis of a Turkish word to its root and suffixes can be formulated. In this study, the suffixes that can be attached to a word root are divided into groups and finite state machines are formed by formulating the order of suffixes for each of these groups. A main machine is formed by combining these machines specific to the groups. In the morphological analysis done using the main machine, it is seen that the word root is obtained by extracting the suffixes from the end towards the start.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2002
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2002
Anahtar kelimeler
Doğal Dil İşleme, Biçimbirimsel Analiz, Türkçe, Sonlu Durum Makineleri, Natural Language Processing, Morphological Analysis, Turkish, Finite State Machines
Alıntı