Please use this identifier to cite or link to this item: http://hdl.handle.net/11527/330
Title: Protein İşlev Kestiriminde Yapısal Bilginin Katkısı Ve Dizi Geçiş Olasılıkları İle Peptit Sınıflandırma
Other Titles: Improvement Of Protein Function Prediction Using Structural Information And Peptide Classification Using Syntactic Transition Probabilities
Authors: Çataltepe, Zehra
Aygün, Eser
Bilgisayar Mühendisliği
Computer Engineering
Keywords: Örüntü tanıma
Biyoenformatik
Biyolojik dizi analizi
Dizi hizalama
Protein işlev kestirimi
Peptit sınıflandırma
Pattern recognition
Bioinformatic
Biological sequence analysis
Sequence alignment
Protein function prediction
Peptide classification
Issue Date: 4-Mar-2009
Publisher: Fen Bilimleri Enstitüsü
Institute of Science and Technology
Abstract: Biyolojik dizi analizi, nükleotid ve amino asit dizilerinin evrimsel, yapısal ve işlevsel özelliklerini ortaya çıkarmayı amaçlar. İkili hizalama algoritmaları, biyolojik dizi analizinde yoğun olarak kullanılan araçlardır. Bu çalışmada; standart ikili hizalama algoritmalarının bir derlemesini sunmak, Oommen ve Kashyap ın tanımladığı dizi geçiş olasılığını bir biyolojik dizi benzerlik ölçütü olarak tanıtmak, yapısal bilginin protein işlev kestiriminin başarısını nasıl arttırdığını göstermek, Oommen ve Kashyap ın dizi geçiş olasılığını, iki peptit sınıflandırma problemi üzerine standart dizi benzerlik ölçütleriyle kıyaslamak, ve gereken dizi analiz araçlarını bir bilgisayar yazılımı olarak gerçeklemek amaçlanmıştır. Çalışmanın deneysel kısmının ilk aşamasında, ikincil yapı dizilerini amino asit dizisi hizalamalarıyla birlikte kullanmanın moleküler işlev kestirim başarısını arttırdığını açıkça ortaya koymuştur. Buna karşılık kestirilmiş ikincil yapıların kestirime herhangi bir katkısının olmadığı gözlenmiştir. İkinci olarak, dizi geçiş olasılıkları, sınıflandırıcıya sunulan nitelikler olarak, standart genel hizalama puanları ile kıyaslanmıştır. Sınıflandırma başarısı ölçümleri, dizi geçiş olasılıklarının genel hizalama puanlarından çok daha iyi nitelikler sağladığını şüpheye yer bırakmayacak şekilde ortaya koymuştur. Önerilen yöntem ayrıca aynı veri kümeleri üzerinde uygulanmış önceki yöntemlerin neredeyse hepsinden daha başarılı olarak genel kabul görmüş peptit benzerlik ölçütü olmaya aday olduğunu kanıtlamıştır.
Biological sequence analysis deals with nucleotide and amino acid sequences, aiming to expose their evolutionary, structural and functional properties. This study intends to provide a review of well known pairwise alignment methods, to introduce the syntactic transition probability of Oommen and Kashyap as a biological sequence similarity metric, to demonstrate how the structural information improves protein function prediction, to compare syntactic transition probability of Oommen and Kashyap with standard sequence similarity metrics on two peptide classifaction problems, and to implement necessary sequence analysis tools as a computer software. In the first part of the experiments, the results clearly indicate that the use of secondary structure sequences along with amino acid sequence alignments improves molecular function prediction performance, while the use of predicted secondary structures does not. In the second part, syntactic transition probabilities are compared with standard global alignment scores as being features fed into a machine learning classifier. The classification performance measurements undoubtedly proved that syntactic transition probabilities are much better features than global alignment scores for peptides.
Description: Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2009
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2009
URI: http://hdl.handle.net/11527/330
Appears in Collections:Bilgisayar Mühendisliği Lisansüstü Programı - Yüksek Lisans

Files in This Item:
File Description SizeFormat 
9250.pdf409.12 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.