Türkçe'nin Bağlılık Ayrıştırması

Eryiğit, Gülşen

Türkçe'nin Bağlılık Ayrıştırması

dc.contributor.advisor	Adalı, Eşref
dc.contributor.author	Eryiğit, Gülşen
dc.contributor.department	Bilgisayar Mühendisliği
dc.contributor.department	Computer Engineering
dc.date	2007
dc.date.accessioned	2015-04-08T11:49:55Z
dc.date.available	2015-04-08T11:49:55Z
dc.description	Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007
dc.description	Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2007
dc.description.abstract	Bu çalışmada, zengin bitişken bir biçimbirimsel yapıya sahip, tümce içi öğe dizilişleri serbest ve çoğunlukla sağa bağımlı türde olan Türkçe’nin bağlılık ayrıştırması konusunda araştırmalar yapılmıştır. Sıralanan bu özellikleri ile Türkçe, İngilizce’den ve ayrıştırma alanında üzerinde yoğun olarak çalışılmış birçok dilden farklılıklar göstermektedir. Bu niteliği ile benzer özellikler gösteren bir sınıf dilin temsilcisi olarak görülebilir. Bu çalışmada, yakın geçmişte kullanıma sunulan Türkçe derlem (Odtü-Sabancı Türkçe ağaç yapılı derlemi) kullanılarak, veri güdümlü ayrıştırıcılarda farklı tasarım yöntemlerinin kullanılmasının etkileri incelenmiştir. Öncelikle ayrıştırma algoritmaları ve öğrenme algoritmalarını içeren temel ayrıştırma mimarisi, temel model olarak alınan bazı kural tabanlı ayrıştırıcılar, koşullu olasılık tabanlı modele dayalı bir istatistiksel ayrıştırıcı ve ayırdedici öğrenmeye dayalı sınıflandırıcı tabanlı gerekirci bir ayrıştırıcı kullanılarak irdelenmiştir. Daha sonra, ayrıştırmada biçimbirimsel birimleri, çekimsel özellikleri ve görünüm bilgilerini kullanmanın etkileri incelenmiştir. Sonuçlar, sözcükler yerine sözcüklerden daha küçük olan biçimbirimsel birimlerin tümce yapısının ana birimleri olarak kullanılmasıyla, Türkçe’de ayrıştırma başarımının arttırılabileceğini ve çekimsel özelliklerin ve görünüm bilgilerinin kullanılmasının Türkçe’nin bağlılık çözümlemesinde çok önemli etkisinin olduğunu göstermektedir. Araştırmalar sonucunda, Türkçe’nin bağlılık ayrıştırması konusunda ilgili çalışmalar arasındaki en yüksek başarımlar elde edilmiştir.
dc.description.abstract	In this study, we focus on dependency parsing of Turkish, a language that is characterized by a rich agglutinating morphology, free constituent order, and predominantly head-final syntactic constructions. In this way, Turkish can be viewed as the representative of a class of languages that are very different from English and most other languages that have been studied in the parsing literature. Using data from the recently released Turkish treebank (Metu-Sabancı Turkish treebank), we investigate the impact of different design choices in developing data-driven parsers. We first investigate the basic parsing methodology, including both parsing algorithms and learning algorithms by using some rule-based parsers as baselines and a statistical parser using a conditional probabilistic model and a deterministic classifier-based parser using discriminative learning. We then examined the impact of using morphological units, inflectional features and lexicalization in parsing. Our results showed that parsing accuracy in Turkish can be improved by taking morphologically defined units rather than word forms as the basic units of syntactic structure and that using inflectional features and lexicalization is crucial for the dependency parsing of Turkish. At the end of our research, we obtained the most state-of-the-art results in the literature for dependency parsing of Turkish.
dc.description.degree	Doktora
dc.description.degree	PhD
dc.identifier.uri	http://hdl.handle.net/11527/515
dc.publisher	Fen Bilimleri Enstitüsü
dc.publisher	Institute of Science and Technology
dc.rights	İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.
dc.rights	İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.
dc.subject	Bağlılık Ayrıştırması
dc.subject	Veri güdümlü Ayrıştırma
dc.subject	Sentaks Analizi
dc.subject	Doğal Dil İşleme
dc.subject	Dependency parsing
dc.subject	Data-driven Parsing
dc.subject	Syntax Analysis
dc.subject	Natural Language Processing
dc.title	Türkçe'nin Bağlılık Ayrıştırması
dc.title.alternative	Dependency Parsing Of Turkish
dc.type	Doctoral Thesis

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1

Ad:: 4632.pdf
Boyut:: 1.34 MB
Format:: Adobe Portable Document Format

İndir

Lisanslı seri

Şimdi gösteriliyor 1 - 1 / 1

Ad:: license.txt
Boyut:: 3.14 KB
Format:: Plain Text
Açıklama

İndir

Koleksiyonlar

FBE- Bilgisayar Mühendisliği Lisansüstü Programı - Doktora