Türkçe Dokümanlar İçin Anlamsal Benzerlik Hesaplama Yöntemi

Yücesoy, Bülent

Türkçe Dokümanlar İçin Anlamsal Benzerlik Hesaplama Yöntemi

dc.contributor.advisor	Öğüdücü, Şule Gündüz
dc.contributor.author	Yücesoy, Bülent
dc.contributor.department	Bilgisayar Mühendisliği
dc.contributor.department	Computer Engineering
dc.date	2007
dc.date.accessioned	2015-04-07T13:59:23Z
dc.date.available	2015-04-07T13:59:23Z
dc.description	Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007
dc.description	Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2007
dc.description.abstract	Bu çalışmada, Türkçe dokümanların anlamsal benzerliğinin hesaplanması için, yeni bir yöntem önerilmiştir. Çalışmada kullanılan dokümanlar, Türkçe bir internet sitesinden elde edilmiştir. Türkçe dokümanlar arası anlam benzerliğini hesaplamak için, Türkçe kavramsal sözlüğündeki sözcükler arası ilişkiler ayrıt temelli bir yaklaşımla incelenmiştir. Önerilen yöntemle sözcükler arası ikili benzerlikler saptanıp, bu benzerliklerin ağırlıklı ortalama kullanılarak birleşimi ile de dokümanlar arası ikili benzerlikler bulunmuştur. Sözcükler arası benzerlik ilişkisi için daha önceden kavramsal sözlük kullanılarak uygulanan ayrıt temelli yöntemlerle de kıyaslama yapılmıştır. Önerilen yöntemle hesaplanan ikili benzerlikler, çizge tabanlı bir demetleme yöntemi ile birbirine daha çok benzeyen dokümanların aynı demette olacağı şekilde gruplanmıştır. Demetleme sonuçlarından hareketle benzerlik sonuçları başarımı çıkarılmıştır. Ayrıca daha sağlıklı bir kıyaslama için kavramsal sözlük kullanmayan yöntemlerle benzerlik hesaplaması da yapılmıştır. Yapılan deneyler sonucunda, bu çalışma kapsamında önerilen benzerlik hesaplama yönteminin başarımının yeter seviyede olduğu gözlenmiştir.
dc.description.abstract	In this study, a new method is offered for calculating semantic similarity of Turkish documents. The documents used in this research are Turkish web pages. The new method uses edge-based similarity technics from Turkish lexical dictionary to calculate semantic similarity of Turkish documents. At first, pairwise similarities between keywords of two documents are calculated. Afterwards, pairwise word similarities are combined in a weighted average manner to get the pairwise document similarity result. Method results are compared with existing edge-based semantic similarity methods. Similarity results of the new method are then clustered by using a graph-based clustering algorithm so that most similar documents are collected in the same group. Clustering results give the performance of similarity results indirectly. In addition, method results are compared with non-lexical semantic similarity algorithms to have a better performance understanding of the new algorithm. The comparison of the results with the examples given in the literature was in a good agreement.
dc.description.degree	Yüksek Lisans
dc.description.degree	M.Sc.
dc.identifier.uri	http://hdl.handle.net/11527/292
dc.publisher	Fen Bilimleri Enstitüsü
dc.publisher	Institute of Science and Technology
dc.rights	İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.
dc.rights	İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.
dc.subject	Veri madenciliği
dc.subject	Türkçe kavramsal sözlük
dc.subject	Anlamsal benzerlik
dc.subject	Data Mining
dc.subject	Turkish Lexical Dictionary
dc.subject	Semantic Similarity
dc.title	Türkçe Dokümanlar İçin Anlamsal Benzerlik Hesaplama Yöntemi
dc.title.alternative	Semantic Similarity Method For Turkish Documents
dc.type	Master Thesis

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1

Ad:: 7286.pdf
Boyut:: 610.29 KB
Format:: Adobe Portable Document Format

İndir

Lisanslı seri

Şimdi gösteriliyor 1 - 1 / 1

Ad:: license.txt
Boyut:: 3.14 KB
Format:: Plain Text
Açıklama

İndir

Koleksiyonlar

FBE- Bilgisayar Mühendisliği Lisansüstü Programı - Yüksek Lisans