Türkçe İçin Metin Özetleme

dc.contributor.advisor Adalı, Eşref tr_TR
dc.contributor.author Tülek, Mesut tr_TR
dc.contributor.department Bilgisayar Mühendisliği tr_TR
dc.contributor.department Computer Engineering en_US
dc.date 2007 tr_TR
dc.date.accessioned 2015-04-07T13:59:23Z
dc.date.available 2015-04-07T13:59:23Z
dc.description Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007 tr_TR
dc.description Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2007 en_US
dc.description.abstract Bilgi erişimi genel şekliyle, depolanmış bilgi derleminden belirli bilgi gereksinimiyle ilgili bölümlere erişim yöntemine yönelik çalışma olarak tanımlanabilir. Bilgi erişiminin altkümelerinden biri olan metin özetleme, bir belgeyi girdi olarak alan ve çıktı olarak daha kısa, aslının yerine geçen ve onun en önemli içeriğini barındıran bir süreç olarak tanımlanabilir. Yüksek verimlilik, yüksek başarım ve düşük uygulama maliyeti bugünkü araştırmalarda ve pratik uygulamalarda genellikle istatistiksel yöntemlerin kullanılmasının sebebidir. Türkçe, sondan eklemeli ve kurallı yapısı, çok az miktarda kuralsız sözcük içermesi nedeniyle bilgi erişimi araştırmacılarının ilgisini çekmiştir. Türkçenin bu özellikleri, Türkçe için yapılan tüm bilgi erişimi sistemlerinde gövdeleme işlemine önem kazandırmıştır. Bu tezde, Türkçe için farklı metin özetleme yöntemleri tanıtılıp uygulanmıştır. Diğer tüm Türkçe bilgi erişimi sistemlerinde de gerekli olduğu gibi, Türkçenin sondan eklemeli yapısının gözetilmesi amacıyla farklı gövdeleme algoritmalarının özetleme başarımına etkisi incelenmiştir. Başarımlarının daha yüksek olması amacıyla, gerçeklenen gövdeleme algoritmalarında sözcüklerin olası kök ve ek birleşimlerini üreten biçimbirimsel çözümleyici kullanılmıştır. Gövdelenmiş bu sözcükler farklı özetleme yöntemleri aracılığıyla incelenip her yöntem için özette yer alacak cümleler belirlenmiştir. Daha sonra bu yöntemlerin ürettiği sonuçlar birleştirilerek son özet oluşturulmuştur. tr_TR
dc.description.abstract Information retrieval can be broadly defined as the study of how to determine and retrieve the portions, which are relevant to particular information needs, from a corpus of stored information. One of the subsets of information retrieval is text summarization. Text summarization can be defined as the process which takes a document as input and outputs a shorter document which is condensed and can be used instead of the original. Today’s researches and practical applications about text summarization mostly use the early statistical methods because of high efficiency, high performance and low application cost of these approaches. In this study, different statistical methods for text summarization are described and developed for Turkish. The effect of different stemming algorithms on summarization efficiency has been studied for the aim of taking into consideration the agglutinative structure of Turkish, as it is necessary in all other information retrieval systems for this language. Morphological analyzer, which outputs the root and affix combinations of the input word, has been used in stemming algorithms to increase the efficiency of the text summarization. These stemmed words have been studied by different summarization methods and sentences which will be included in the summary have been chosen. In the end, the final summary has been created by combining the results of these methods. en_US
dc.description.degree Yüksek Lisans tr_TR
dc.description.degree M.Sc. en_US
dc.identifier.uri http://hdl.handle.net/11527/293
dc.publisher Fen Bilimleri Enstitüsü tr_TR
dc.publisher Institute of Science and Technology en_US
dc.rights İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. tr_TR
dc.rights İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. en_US
dc.subject Bilgi Erişimi tr_TR
dc.subject Metin Özetleme tr_TR
dc.subject Gövdeleme tr_TR
dc.subject Information Retrieval en_US
dc.subject Text Summarization en_US
dc.subject Stemming en_US
dc.title Türkçe İçin Metin Özetleme tr_TR
dc.title.alternative Text Summarization For Turkish en_US
dc.type Master Thesis en_US
Dosyalar
Orijinal seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.alt
Ad:
7290.pdf
Boyut:
639.42 KB
Format:
Adobe Portable Document Format
Açıklama
Lisanslı seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.placeholder
Ad:
license.txt
Boyut:
3.14 KB
Format:
Plain Text
Açıklama