Türkçe'nin Bağlılık Ayrıştırması
Türkçe'nin Bağlılık Ayrıştırması
dc.contributor.advisor | Adalı, Eşref | tr_TR |
dc.contributor.author | Eryiğit, Gülşen | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |
dc.contributor.department | Computer Engineering | en_US |
dc.date | 2007 | tr_TR |
dc.date.accessioned | 2015-04-08T11:49:55Z | |
dc.date.available | 2015-04-08T11:49:55Z | |
dc.description | Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007 | tr_TR |
dc.description | Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2007 | en_US |
dc.description.abstract | Bu çalışmada, zengin bitişken bir biçimbirimsel yapıya sahip, tümce içi öğe dizilişleri serbest ve çoğunlukla sağa bağımlı türde olan Türkçe’nin bağlılık ayrıştırması konusunda araştırmalar yapılmıştır. Sıralanan bu özellikleri ile Türkçe, İngilizce’den ve ayrıştırma alanında üzerinde yoğun olarak çalışılmış birçok dilden farklılıklar göstermektedir. Bu niteliği ile benzer özellikler gösteren bir sınıf dilin temsilcisi olarak görülebilir. Bu çalışmada, yakın geçmişte kullanıma sunulan Türkçe derlem (Odtü-Sabancı Türkçe ağaç yapılı derlemi) kullanılarak, veri güdümlü ayrıştırıcılarda farklı tasarım yöntemlerinin kullanılmasının etkileri incelenmiştir. Öncelikle ayrıştırma algoritmaları ve öğrenme algoritmalarını içeren temel ayrıştırma mimarisi, temel model olarak alınan bazı kural tabanlı ayrıştırıcılar, koşullu olasılık tabanlı modele dayalı bir istatistiksel ayrıştırıcı ve ayırdedici öğrenmeye dayalı sınıflandırıcı tabanlı gerekirci bir ayrıştırıcı kullanılarak irdelenmiştir. Daha sonra, ayrıştırmada biçimbirimsel birimleri, çekimsel özellikleri ve görünüm bilgilerini kullanmanın etkileri incelenmiştir. Sonuçlar, sözcükler yerine sözcüklerden daha küçük olan biçimbirimsel birimlerin tümce yapısının ana birimleri olarak kullanılmasıyla, Türkçe’de ayrıştırma başarımının arttırılabileceğini ve çekimsel özelliklerin ve görünüm bilgilerinin kullanılmasının Türkçe’nin bağlılık çözümlemesinde çok önemli etkisinin olduğunu göstermektedir. Araştırmalar sonucunda, Türkçe’nin bağlılık ayrıştırması konusunda ilgili çalışmalar arasındaki en yüksek başarımlar elde edilmiştir. | tr_TR |
dc.description.abstract | In this study, we focus on dependency parsing of Turkish, a language that is characterized by a rich agglutinating morphology, free constituent order, and predominantly head-final syntactic constructions. In this way, Turkish can be viewed as the representative of a class of languages that are very different from English and most other languages that have been studied in the parsing literature. Using data from the recently released Turkish treebank (Metu-Sabancı Turkish treebank), we investigate the impact of different design choices in developing data-driven parsers. We first investigate the basic parsing methodology, including both parsing algorithms and learning algorithms by using some rule-based parsers as baselines and a statistical parser using a conditional probabilistic model and a deterministic classifier-based parser using discriminative learning. We then examined the impact of using morphological units, inflectional features and lexicalization in parsing. Our results showed that parsing accuracy in Turkish can be improved by taking morphologically defined units rather than word forms as the basic units of syntactic structure and that using inflectional features and lexicalization is crucial for the dependency parsing of Turkish. At the end of our research, we obtained the most state-of-the-art results in the literature for dependency parsing of Turkish. | en_US |
dc.description.degree | Doktora | tr_TR |
dc.description.degree | PhD | en_US |
dc.identifier.uri | http://hdl.handle.net/11527/515 | |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.publisher | Institute of Science and Technology | en_US |
dc.rights | İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. | tr_TR |
dc.rights | İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. | en_US |
dc.subject | Bağlılık Ayrıştırması | tr_TR |
dc.subject | Veri güdümlü Ayrıştırma | tr_TR |
dc.subject | Sentaks Analizi | tr_TR |
dc.subject | Doğal Dil İşleme | tr_TR |
dc.subject | Dependency parsing | en_US |
dc.subject | Data-driven Parsing | en_US |
dc.subject | Syntax Analysis | en_US |
dc.subject | Natural Language Processing | en_US |
dc.title | Türkçe'nin Bağlılık Ayrıştırması | tr_TR |
dc.title.alternative | Dependency Parsing Of Turkish | en_US |
dc.type | Doctoral Thesis | en_US |