Bilgi Erişiminde Tamlama Temelli Dizinleme
Bilgi Erişiminde Tamlama Temelli Dizinleme
dc.contributor.advisor | Adalı, Eşref | tr_TR |
dc.contributor.author | Türkeeş, Mehmet Kıvanç | tr_TR |
dc.contributor.department | Bilgisayar Mühendisliği | tr_TR |
dc.contributor.department | Computer Engineering | en_US |
dc.date | 2007 | tr_TR |
dc.date.accessioned | 2015-04-07T13:59:24Z | |
dc.date.available | 2015-04-07T13:59:24Z | |
dc.description | Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007 | tr_TR |
dc.description | Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2007 | en_US |
dc.description.abstract | Bu tez kapsamında, Türkçe için doğal dil işleme destekli bir bilgi erişim sistemi tasarımı yapılmıştır. Bu bilgi erişim sistemi, Türkçe’nin özelliklerini ve yapısını göz önüne alarak, bilgi erişimindeki başarımı arttırmayı amaçlamaktadır. Tasarlanmış olan bu sistemde Türkçenin biçimsel ve sözdizimsel farklılıkları ele alınmış ve bu farklılıkların giderilmesinin bilgi erişimi üzerindeki etkileri irdelenmiştir. Birimsel farklılıklar biçimbirimsel çözümlemeye dayanan gövdeleme, sözdizimsel farklılıklar ise tamlama analizi ile giderilmeye çalışılmıştır. Tamlama analizinde hem istatistiksel hem de dilbilimsel yaklaşımlar incelenmiş ve dilbilimsel tamlama analizi gerçeklenmiştir. İstatistiksel yaklaşımda, birbirini belirli sıklıklarla izleyen ve belge genelinde sıkça geçen sözcük öbekleri tamlama olarak kabul edilmiş, dilbilimsel yaklaşımda ise isim ve sıfat tamlamaları bulunmaya çalışılmıştır. İstatistiksel yaklaşımda sözcükler arasındaki yakınlık ve sıklık ilişkileri üzerinde durulurken dilbilimsel yaklaşımda biçimbirimsel çözümleme de kullanılarak sözcük türleri ve sözcüklere gelen tamlama ekleri incelenip Türkçedeki isim ve sıfat tamlamaları sonlu durum makineleri ve düzenli ifadeler olarak temsil edilmiştir. Tamlama analizi ile bulunan tamlamalar tek sözcüklerle beraber belgeleri temsil etmek için kullanılarak tamlama bazlı dizinleme gerçeklenmiştir. Ayrıca sözcük bazlı dizinleme ile tamlama bazlı dizinleme karşılaştırılarak bilgi erişimi ve başarımı üzerine etkileri araştırılmıştır. | tr_TR |
dc.description.abstract | In this study, an Information Retrieval system supported by Natural Language Processing for Turkish is designed. This IR system aims at increasing performance in IR by considering features and structure of Turkish language. Designed IR system deals with morphological and syntactical variations of Turkish and studies of the effects on overcoming these variations on IR. Morphological variations are handled with stemming based on morphological analysis and syntactical variations with phrase analysis. For phrase analysis, both statistical and linguistic approaches are studied and linguistical phrase analysis is implemented. In statistical approach, words which follow each other and are frequently repeated in a document are considered as a phrase and terms of proximity and frequency for words are studied. In linguistic approach, noun and adjective phrases are analized. The type and suffix information for words are studied to find noun and adjective phrases in Turkish. Finite state machines and regular expressions are formed for the analysis of linguistic phrases. Phrases, which are determined by phrase analysis, are used for representing documents instead of single words. Phrase based indexing is implemented for this purpose. Comparison between phrase based indexing and term based indexing is done and their effect on IR are studied. | en_US |
dc.description.degree | Yüksek Lisans | tr_TR |
dc.description.degree | M.Sc. | en_US |
dc.identifier.uri | http://hdl.handle.net/11527/297 | |
dc.publisher | Fen Bilimleri Enstitüsü | tr_TR |
dc.publisher | Institute of Science and Technology | en_US |
dc.rights | İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. | tr_TR |
dc.rights | İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. | en_US |
dc.subject | Bilgi Erişimi | tr_TR |
dc.subject | Bilgi Erişim Sistemi | tr_TR |
dc.subject | Doğal Dil İşleme | tr_TR |
dc.subject | Dizinleme | tr_TR |
dc.subject | Tamlama Temelli Dizinleme | tr_TR |
dc.subject | Information Retrieval | en_US |
dc.subject | Information Retrieval System | en_US |
dc.subject | Natural Language Processing | en_US |
dc.subject | Indexing | en_US |
dc.subject | Phrase Based Indexing | en_US |
dc.title | Bilgi Erişiminde Tamlama Temelli Dizinleme | tr_TR |
dc.title.alternative | Phrase Based Indexing In Information Retrieval | en_US |
dc.type | Master Thesis | en_US |