Türkçe İçin Biçimbirimsel Belirsizlik Giderici
Türkçe İçin Biçimbirimsel Belirsizlik Giderici
dc.contributor.advisor | Adalı, Eşref | tr_TR |
dc.contributor.author | Karadeniz, Zeynep İlknur | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |
dc.contributor.department | Computer Engineering | en_US |
dc.date | 2007 | tr_TR |
dc.date.accessioned | 2015-04-07T13:59:21Z | |
dc.date.available | 2015-04-07T13:59:21Z | |
dc.description | Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007 | tr_TR |
dc.description | Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2007 | en_US |
dc.description.abstract | Doğal Dil İşlemenin kapsamında olan, özet çıkartma, metin sınıflandırması, diller arası çeviri ve anlamsal çalışmalarda bir sözcüğün niteliğinin belirlenmesi önemli bir konudur. Bir sözcüğün niteliği demek, en temel anlatımla o sözcüğün isim mi fiil mi sıfat mı olduğudur. Biraz ayrıntıya inildiğinde, daha alt özelliklerin de belirtilmesi gerekir. Sözgelimi bir fiilin zamanı ve şahsının belirtilmesidir.Türkçe bitişken bir dil olması nedeniyle, sözcükler kök, gövde ve eklerden oluşur. Türkçe ön ek açısından çok kısıtlı olmasına karşın, son ekler konusunda olağanüstü zengindir. Bu eklerin 300 civarında bulunduğu ve bunların yarısının yoğun bir şekilde kullanıldığı bilinmektedir. Türkçe’nin yeni sözcük türetmesine büyük katkı sağlayan bu özelliği, biçimbirimsel çözümlemede sorunlara neden olmaktadır. Bir Hint-Avrupa ailesi dilinde bir sözcüğün biçimbirimsel analizi sonunda belirsizlik oranı az iken, Türkçe’de bir sözcük için 1,8 çözüm bulunmaktadır.Bu tezin amacı Türkçe için biçimbirimsel çözümleyicinin ürettiği sonuçlardan doğru olanının saptanmasıdır. Bu amaçla önce Türkçe’deki sözcüklerin belirsizlik dağılımları çıkartıldı. Ardından sözcükler belirsizlik niteliklerine göre kümelendi. Her belirsizlik türü için kurallar yazarak belirsizlikler giderilmiştir. | tr_TR |
dc.description.abstract | It is an important issue in summarization, text - categorization and semantic related works ,which are the study areas of Natural Language Processing , to detect the properties of a word .The property of a word basically means whether the word is an adjective, a noun or a verb, etc. More precisely, it is not that simple. The sub-categories (for instance, the tense and personal properties of a verb) should also be analayzed. Because of the agglutinative nature of Turkish, Turkish words are made of roots, stems and affixes. Turkish has restricted prefixes but there are roughly 300 suffixes. It is known that the half of these suffixes are widely used. Although this feature helps new word formations, also produces new morphological problem with it. While, in a n Euraopean language, the morphological analaysis of a word produces a few results for a word, this number is 1,8 for a Turkish word. The aim of this thesis is selecting the true parse of a word in a given context from the results produced by a morphological analyzer. For achieving this goal, firstly the morpholgical ambiguities in Turkish is classified and the distribution of the ambiguiteis are analyzed..Then, for all categories, spesific diambiguation rules are written to get rid of the morphologiacl ambiguities. | en_US |
dc.description.degree | Yüksek Lisans | tr_TR |
dc.description.degree | M.Sc. | en_US |
dc.identifier.uri | http://hdl.handle.net/11527/285 | |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.publisher | Institute of Science and Technology | en_US |
dc.rights | İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. | tr_TR |
dc.rights | İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. | en_US |
dc.subject | Doğal Dil İşleme | tr_TR |
dc.subject | Sözcük Etiketleyici | tr_TR |
dc.subject | Biçim Birimsel Belirsizlik Giderici | tr_TR |
dc.subject | Natural Language Processsing | en_US |
dc.subject | POS Tagger | en_US |
dc.subject | Morphological Disambiguator | en_US |
dc.title | Türkçe İçin Biçimbirimsel Belirsizlik Giderici | tr_TR |
dc.title.alternative | Morhological Disambiguator For Turkish | en_US |
dc.type | Master Thesis | en_US |