Türkçe İçin Biçimbirimsel Belirsizlik Giderici

dc.contributor.advisor Adalı, Eşref tr_TR
dc.contributor.author Karadeniz, Zeynep İlknur tr_TR
dc.contributor.department Bilgisayar Mühendisliği tr_TR
dc.contributor.department Computer Engineering en_US
dc.date 2007 tr_TR
dc.date.accessioned 2015-04-07T13:59:21Z
dc.date.available 2015-04-07T13:59:21Z
dc.description Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007 tr_TR
dc.description Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2007 en_US
dc.description.abstract Doğal Dil İşlemenin kapsamında olan, özet çıkartma, metin sınıflandırması, diller arası çeviri ve anlamsal çalışmalarda bir sözcüğün niteliğinin belirlenmesi önemli bir konudur. Bir sözcüğün niteliği demek, en temel anlatımla o sözcüğün isim mi fiil mi sıfat mı olduğudur. Biraz ayrıntıya inildiğinde, daha alt özelliklerin de belirtilmesi gerekir. Sözgelimi bir fiilin zamanı ve şahsının belirtilmesidir.Türkçe bitişken bir dil olması nedeniyle, sözcükler kök, gövde ve eklerden oluşur. Türkçe ön ek açısından çok kısıtlı olmasına karşın, son ekler konusunda olağanüstü zengindir. Bu eklerin 300 civarında bulunduğu ve bunların yarısının yoğun bir şekilde kullanıldığı bilinmektedir. Türkçe’nin yeni sözcük türetmesine büyük katkı sağlayan bu özelliği, biçimbirimsel çözümlemede sorunlara neden olmaktadır. Bir Hint-Avrupa ailesi dilinde bir sözcüğün biçimbirimsel analizi sonunda belirsizlik oranı az iken, Türkçe’de bir sözcük için 1,8 çözüm bulunmaktadır.Bu tezin amacı Türkçe için biçimbirimsel çözümleyicinin ürettiği sonuçlardan doğru olanının saptanmasıdır. Bu amaçla önce Türkçe’deki sözcüklerin belirsizlik dağılımları çıkartıldı. Ardından sözcükler belirsizlik niteliklerine göre kümelendi. Her belirsizlik türü için kurallar yazarak belirsizlikler giderilmiştir. tr_TR
dc.description.abstract It is an important issue in summarization, text - categorization and semantic related works ,which are the study areas of Natural Language Processing , to detect the properties of a word .The property of a word basically means whether the word is an adjective, a noun or a verb, etc. More precisely, it is not that simple. The sub-categories (for instance, the tense and personal properties of a verb) should also be analayzed. Because of the agglutinative nature of Turkish, Turkish words are made of roots, stems and affixes. Turkish has restricted prefixes but there are roughly 300 suffixes. It is known that the half of these suffixes are widely used. Although this feature helps new word formations, also produces new morphological problem with it. While, in a n Euraopean language, the morphological analaysis of a word produces a few results for a word, this number is 1,8 for a Turkish word. The aim of this thesis is selecting the true parse of a word in a given context from the results produced by a morphological analyzer. For achieving this goal, firstly the morpholgical ambiguities in Turkish is classified and the distribution of the ambiguiteis are analyzed..Then, for all categories, spesific diambiguation rules are written to get rid of the morphologiacl ambiguities. en_US
dc.description.degree Yüksek Lisans tr_TR
dc.description.degree M.Sc. en_US
dc.identifier.uri http://hdl.handle.net/11527/285
dc.publisher Fen Bilimleri Enstitüsü tr_TR
dc.publisher Institute of Science and Technology en_US
dc.rights İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. tr_TR
dc.rights İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. en_US
dc.subject Doğal Dil İşleme tr_TR
dc.subject Sözcük Etiketleyici tr_TR
dc.subject Biçim Birimsel Belirsizlik Giderici tr_TR
dc.subject Natural Language Processsing en_US
dc.subject POS Tagger en_US
dc.subject Morphological Disambiguator en_US
dc.title Türkçe İçin Biçimbirimsel Belirsizlik Giderici tr_TR
dc.title.alternative Morhological Disambiguator For Turkish en_US
dc.type Master Thesis en_US
Dosyalar
Orijinal seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.alt
Ad:
4789.pdf
Boyut:
787.17 KB
Format:
Adobe Portable Document Format
Açıklama
Lisanslı seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.placeholder
Ad:
license.txt
Boyut:
3.14 KB
Format:
Plain Text
Açıklama