FBE- Bilgisayar Mühendisliği Lisansüstü Programı - Doktora
Bu koleksiyon için kalıcı URI
Gözat
Konu "anlamsal çözümleme" ile FBE- Bilgisayar Mühendisliği Lisansüstü Programı - Doktora'a göz atma
Sayfa başına sonuç
Sıralama Seçenekleri
-
ÖgeTürkçe Tümcelerin Yüklem Odaklı Anlam Ve Dilbilgisi Çözümlemesi(Fen Bilimleri Enstitüsü, ) Dönmez, İlknur ; Adalı, Eşref ; 10119467 ; Bilgisayar Mühendisliği ; Computer EngineeringÇalışmamız tümcelerin anlamsal ve dilbilgisi çözümlemesini içermektedir. Tümcenin anlamsal ve dilbilgisi açısından çözümlenmesi Doğal Dil İşleme (DDİ)’nin ana konulardan biridir. Çalışmamızda, çözümleme yapılırken önce metin içindeki tümcelerin her biri basit tümce olacak şekilde alt tümcelere ayrıştırılmaktadır. Her bir alt tümceye ait öbek kavram çiftleri bulunmakta ve daha sonra her bir alt tümcedeki temel dilbilgisi ve anlamsal yanlışları saptamak için yüklemi temel alan yeni bir yöntem önerilmektedir. Türkçe tümcede yüklem özne ve zaman bilgisi içerir. Ayrıca yüklem, o tümcenin hangi öbeklerden oluşabileceği konusunda da belirleyicidir. örneğin, ``büyümek'' yüklemi tümce içinde nesne almazken, ``-de'' ekiyle biten dolaylı tümleç öbeğini alır. Örneğin ``Ayşeyi büyüdü.'' tümcesi sorunluyken, ``Sokakta büyüdü.'' tümcesi doğrudur. Yüklem ayrıca her bir öbeğin içereceği kavram hakkında da bilgi içermektedir. örneğin ``düşünmek'' yüklemi insanlara özgüdür. Dolayısıyla özne olarak insan kavramıyla ilişkilidir. ``Kapı bugün ne yapacağını düşündü.'' tümcesi mantıklı değildir. Bu saptamalardan yola çıkarak çalışmamızda, tümcelerin öbekleri bulunmuş; her bir öbeğin hangi kavramla ilişkili olduğu belirlenmiş ve tümcenin dilbilgisi çözümlemesini ve anlam çözümlemesini yapan bir model tasarlanmıştır. Çalışmamızda tümceler hal ekleri ve temel öbek yapıları kullanılarak 10 öbeğe ayrıştırılmıştır. Her bir öbeğin içerdiği kavramın 51 kavram sınıfından hangisine ait olduğu belirlenmiştir. öbek-kavram çiftlerinin yüklemle uyumluluğu araştırılırken çatı, kişi ve zaman ekleri de değerlendirilmiştir. Çalışmamızda, her öbek kavram bir matris elemanıyla temsil edilmektedir oysa birleşik tümcelerde öbekler içinde iç tümcelere sahip olabilmektedir. örneğin ``okula sevinçle gelen Ayşe'' öznesi içinde farklı bir iç tümceyi içermektedir. Anlamsal ve dilbilgisi hatası bu iç tümcelerde bulunabilmektedir. örneğin eğer özne öbeği ``okulda sevinçle gelen Ayşe'' olsaydı, gelmek fiili bulunma öbeğiyle uyumlu olmayacak dolayısıyla bu özneyi içeren tümce doğru bir tümce olmayacaktı. Bu nedenle çalışmamız iç tümceleri de içerecek şekilde genişletilmiştir. Bu amaçla tümceler içerdikleri sıfat fiil, zarf fiil yada mastar sayısınca alt tümceye bölünmüştür ve ayrılan her bir alt tümce için çözümleme tekrarlanmıştır. Günümüzde hala pek çok DDİ uygulamasında, tümcelerin içerdiği her bir kelime binler boyutunda temsil edilmekte, farklı kelime sayısına sahip tümcelerin boyutları sabit olmamakta ve tüm bu tümce temsili oldukça ayrık bir yapıya sahip olmaktadır. Çalışmamızda oluşturulan, tümcenin içerdiği öbek kavram türünden sabit uzunluklu, nispeten az boyutlu (10x51) kaba anlamsal matris temsili pek çok anlamsal DDİ çalışmasında kullanılabilecek özelliktedir. Çalışmamızın son bölümünde bu temsilin anlamsal uygulamalarda başarı sağladığı gösterilmiştir. Tümcenin yüzeysel anlamını içeren matris yapısının son satırına yüklemin özellikleri de eklenerek bir döküman sınıflama uygulamasında kullanılmıştır. WEKA paketi ile beş farklı çeşit sınıflandırma algoritması kullanılarak beş ayrı katagorideki dökümanlar sınıflandırılmış sonuçta 145 özellikle 86.10 başarı elde edilmiştir. Modelimize ait özellikleri eski özelliklere eklediğimizde en yüksek başarı olan 97,12'lik en yüksek başarı değeri elde edilmiştir. Sonuç olarak bu çalışmamızda tümcenin öbek kavram vektör temsili oluşturulmuş ve tümcenin dil bilgisel ve anlamsal olarak çözümlenmesi için vektör kıyaslanması kullanan yeni bir yöntem sunulmuştur. Bu yöntemle yapısal hatalardan hedeflenen %81,16'lık dilim içinden %64'lük hata tespit edilmiştir. Çalışmamız ayrıca %81,16 başarı ile tümcelerin alt tümcelerinin bulunduğu; %89 başarıyla tümcelerin kendilerinin ve alt tümcelerinin öbeklerine ayrıldığı, %82,8 başarıyla içerdiği kavramların bulunduğu, içerdiği zaman türünün incelenip yüklemle kıyaslandığı, öznesinin tipinin, tekil ya da çoğul olduğunun incelendiği Türkçe tümce çözümleme kaynağı olmak hedefindedir. Türkçenin düzenli tümce yapısı ve düzenli yüklem yapısı bu çalışmanın esin kaynağı olmasına karşın, öbek-kavram temsili tüm diller için kullanılabilecek bir yöntemdir.