Türkçe'nin Bağlılık Ayrıştırması

dc.contributor.advisor Adalı, Eşref tr_TR
dc.contributor.author Eryiğit, Gülşen tr_TR
dc.contributor.department Bilgisayar Mühendisliği tr_TR
dc.contributor.department Computer Engineering en_US
dc.date 2007 tr_TR
dc.date.accessioned 2015-04-08T11:49:55Z
dc.date.available 2015-04-08T11:49:55Z
dc.description Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007 tr_TR
dc.description Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2007 en_US
dc.description.abstract Bu çalışmada, zengin bitişken bir biçimbirimsel yapıya sahip, tümce içi öğe dizilişleri serbest ve çoğunlukla sağa bağımlı türde olan Türkçe’nin bağlılık ayrıştırması konusunda araştırmalar yapılmıştır. Sıralanan bu özellikleri ile Türkçe, İngilizce’den ve ayrıştırma alanında üzerinde yoğun olarak çalışılmış birçok dilden farklılıklar göstermektedir. Bu niteliği ile benzer özellikler gösteren bir sınıf dilin temsilcisi olarak görülebilir. Bu çalışmada, yakın geçmişte kullanıma sunulan Türkçe derlem (Odtü-Sabancı Türkçe ağaç yapılı derlemi) kullanılarak, veri güdümlü ayrıştırıcılarda farklı tasarım yöntemlerinin kullanılmasının etkileri incelenmiştir. Öncelikle ayrıştırma algoritmaları ve öğrenme algoritmalarını içeren temel ayrıştırma mimarisi, temel model olarak alınan bazı kural tabanlı ayrıştırıcılar, koşullu olasılık tabanlı modele dayalı bir istatistiksel ayrıştırıcı ve ayırdedici öğrenmeye dayalı sınıflandırıcı tabanlı gerekirci bir ayrıştırıcı kullanılarak irdelenmiştir. Daha sonra, ayrıştırmada biçimbirimsel birimleri, çekimsel özellikleri ve görünüm bilgilerini kullanmanın etkileri incelenmiştir. Sonuçlar, sözcükler yerine sözcüklerden daha küçük olan biçimbirimsel birimlerin tümce yapısının ana birimleri olarak kullanılmasıyla, Türkçe’de ayrıştırma başarımının arttırılabileceğini ve çekimsel özelliklerin ve görünüm bilgilerinin kullanılmasının Türkçe’nin bağlılık çözümlemesinde çok önemli etkisinin olduğunu göstermektedir. Araştırmalar sonucunda, Türkçe’nin bağlılık ayrıştırması konusunda ilgili çalışmalar arasındaki en yüksek başarımlar elde edilmiştir. tr_TR
dc.description.abstract In this study, we focus on dependency parsing of Turkish, a language that is characterized by a rich agglutinating morphology, free constituent order, and predominantly head-final syntactic constructions. In this way, Turkish can be viewed as the representative of a class of languages that are very different from English and most other languages that have been studied in the parsing literature. Using data from the recently released Turkish treebank (Metu-Sabancı Turkish treebank), we investigate the impact of different design choices in developing data-driven parsers. We first investigate the basic parsing methodology, including both parsing algorithms and learning algorithms by using some rule-based parsers as baselines and a statistical parser using a conditional probabilistic model and a deterministic classifier-based parser using discriminative learning. We then examined the impact of using morphological units, inflectional features and lexicalization in parsing. Our results showed that parsing accuracy in Turkish can be improved by taking morphologically defined units rather than word forms as the basic units of syntactic structure and that using inflectional features and lexicalization is crucial for the dependency parsing of Turkish. At the end of our research, we obtained the most state-of-the-art results in the literature for dependency parsing of Turkish. en_US
dc.description.degree Doktora tr_TR
dc.description.degree PhD en_US
dc.identifier.uri http://hdl.handle.net/11527/515
dc.publisher Fen Bilimleri Enstitüsü tr_TR
dc.publisher Institute of Science and Technology en_US
dc.rights İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. tr_TR
dc.rights İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. en_US
dc.subject Bağlılık Ayrıştırması tr_TR
dc.subject Veri güdümlü Ayrıştırma tr_TR
dc.subject Sentaks Analizi tr_TR
dc.subject Doğal Dil İşleme tr_TR
dc.subject Dependency parsing en_US
dc.subject Data-driven Parsing en_US
dc.subject Syntax Analysis en_US
dc.subject Natural Language Processing en_US
dc.title Türkçe'nin Bağlılık Ayrıştırması tr_TR
dc.title.alternative Dependency Parsing Of Turkish en_US
dc.type Doctoral Thesis en_US
Dosyalar
Orijinal seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.alt
Ad:
4632.pdf
Boyut:
1.34 MB
Format:
Adobe Portable Document Format
Açıklama
Lisanslı seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.placeholder
Ad:
license.txt
Boyut:
3.14 KB
Format:
Plain Text
Açıklama