Protein İşlev Kestiriminde Yapısal Bilginin Katkısı Ve Dizi Geçiş Olasılıkları İle Peptit Sınıflandırma

thumbnail.default.alt
Tarih
2009-03-04
Yazarlar
Aygün, Eser
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Biyolojik dizi analizi, nükleotid ve amino asit dizilerinin evrimsel, yapısal ve işlevsel özelliklerini ortaya çıkarmayı amaçlar. İkili hizalama algoritmaları, biyolojik dizi analizinde yoğun olarak kullanılan araçlardır. Bu çalışmada; standart ikili hizalama algoritmalarının bir derlemesini sunmak, Oommen ve Kashyap ın tanımladığı dizi geçiş olasılığını bir biyolojik dizi benzerlik ölçütü olarak tanıtmak, yapısal bilginin protein işlev kestiriminin başarısını nasıl arttırdığını göstermek, Oommen ve Kashyap ın dizi geçiş olasılığını, iki peptit sınıflandırma problemi üzerine standart dizi benzerlik ölçütleriyle kıyaslamak, ve gereken dizi analiz araçlarını bir bilgisayar yazılımı olarak gerçeklemek amaçlanmıştır. Çalışmanın deneysel kısmının ilk aşamasında, ikincil yapı dizilerini amino asit dizisi hizalamalarıyla birlikte kullanmanın moleküler işlev kestirim başarısını arttırdığını açıkça ortaya koymuştur. Buna karşılık kestirilmiş ikincil yapıların kestirime herhangi bir katkısının olmadığı gözlenmiştir. İkinci olarak, dizi geçiş olasılıkları, sınıflandırıcıya sunulan nitelikler olarak, standart genel hizalama puanları ile kıyaslanmıştır. Sınıflandırma başarısı ölçümleri, dizi geçiş olasılıklarının genel hizalama puanlarından çok daha iyi nitelikler sağladığını şüpheye yer bırakmayacak şekilde ortaya koymuştur. Önerilen yöntem ayrıca aynı veri kümeleri üzerinde uygulanmış önceki yöntemlerin neredeyse hepsinden daha başarılı olarak genel kabul görmüş peptit benzerlik ölçütü olmaya aday olduğunu kanıtlamıştır.
Biological sequence analysis deals with nucleotide and amino acid sequences, aiming to expose their evolutionary, structural and functional properties. This study intends to provide a review of well known pairwise alignment methods, to introduce the syntactic transition probability of Oommen and Kashyap as a biological sequence similarity metric, to demonstrate how the structural information improves protein function prediction, to compare syntactic transition probability of Oommen and Kashyap with standard sequence similarity metrics on two peptide classifaction problems, and to implement necessary sequence analysis tools as a computer software. In the first part of the experiments, the results clearly indicate that the use of secondary structure sequences along with amino acid sequence alignments improves molecular function prediction performance, while the use of predicted secondary structures does not. In the second part, syntactic transition probabilities are compared with standard global alignment scores as being features fed into a machine learning classifier. The classification performance measurements undoubtedly proved that syntactic transition probabilities are much better features than global alignment scores for peptides.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2009
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2009
Anahtar kelimeler
Örüntü tanıma, Biyoenformatik, Biyolojik dizi analizi, Dizi hizalama, Protein işlev kestirimi, Peptit sınıflandırma, Pattern recognition, Bioinformatic, Biological sequence analysis, Sequence alignment, Protein function prediction, Peptide classification
Alıntı