Saklı Markov Modelleri Kullanarak Protein Fonksiyon Öngörüsü

dc.contributor.advisor Çataltepe, Zehra tr_TR
dc.contributor.author Kömürlü, Caner tr_TR
dc.contributor.authorID 371550 tr_TR
dc.contributor.department Bilgisayar Bilimleri tr_TR
dc.contributor.department Computer Science en_US
dc.date 2008 tr_TR
dc.date.accessioned 2016-10-25T14:12:29Z
dc.date.available 2016-10-25T14:12:29Z
dc.description Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Bilişim Enstitüsü, 2008 tr_TR
dc.description Thesis (M.Sc.) -- İstanbul Technical University, Institute of Informatics, 2008 en_US
dc.description.abstract Saklı Markov modellerininin biyoinformatik alanında kullanılmaya başlanması ile üzerine düşülen konu HMM profilleri olmuştur. Saklı Markov modellerinden önce çoklu hizalama yöntemleri ile üretilen profiller, bu modellerin kullanılması ile daha başarılı ve yüksek doğrulukla üretilmeye başladı. Uzak homoloji kavramının bu modellerle çalışmalara dahil edilmesi bu sayede gerçekleşti. Uzak homoloji üzerine geliştirilen araçlar ve bu araçların kullandığı diğer araçların başında, HHsearch (HMM HMM search), PRC (Profile Comparer), SAM (Sequence Alignment Modelling), HMMER gelir. Bu çalışmada HMMER, profil-dizi kıyaslaması yoluyla benzerlik matrisi üretiminde, HHsearch profil-profil kıyaslaması yoluyla benzerlik matrisi üretiminde, PRC yine profil-profil kıyaslaması yoluyla benzerlik matrisi üretiminde kullanıldı. Bu yöntemlerde gerekli yerlerde PSI-BLAST, ClustalW ve Kalign, hizalama ve demetleme yöntemleri için kullanıldı. Veri olarak Protein Data Bank veritabanınıdan Gene Ontology'ye bağlı olarak oluşturulan 5 sınıflı protein veritabanı, yine aynı veri kümesinin zenginleştirilmiş sürümü ve NR veri kümesi kullanıldı. Benzerlik matrislerinin üretiminin neticesinde elde edilen veri, örüntü tanıma tekniklerinde kullanıldı. 5 sınıflı veri kümesi için dizi-profil ve profil-profil kıyaslamasının katar hizlama yöntemlerinden daha kötü sonuç verdiği bulundu. İkincil yapının HMM'de hesaba katılmasının fonksiyon öngörüsünde faydalı olduğu görüldü. NR veri kümesi ile zenginleştirilmiş veri kümesinin profil üretiminde faydalı olduğu görüldü. tr_TR
dc.description.abstract The profile-HMM's became popular with the use of hidden Markov models in bioinformatics. Profiles, which were conventionally produced using alignment methods, became more accurate and successfull by means of hidden Markov models. As a consequence, remote homolgs were included into function prediction studies with these models. In this study, HMMER is used in sequence-profile comparison, HHsearch is used in profile-profile comparison, PRC is used in profile-profile comparison for similarity matrix production. PSI-BLAST, ClustalW and Kalign are used in alignment and clustering steps. As the data set, 5-class protein database generated from Protein Data Bank database with respect to Gene Ontology Annotation is used. In addition, its variant, the enriched data set and NR data set are used. The similarity matrices produced by HMMER, HHSearch and PRC methods are used as inputs to machine learning techniques. For the 5-class data set used, it is found out that sequence-HMM-profile and HMM profile-profile methods cannot perform as well as sequence aligment techniques. It is also found out that using secondary structure in addition to the amino acid sequence helps with protein function prediction. Enrichment of data set with NR data is found to help with function prediction. en_US
dc.description.degree Yüksek Lisans tr_TR
dc.description.degree M.Sc. en_US
dc.identifier.uri http://hdl.handle.net/11527/12201
dc.publisher Bilişim Enstitüsü tr_TR
dc.publisher Institute of Informatics en_US
dc.rights İTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır. tr_TR
dc.rights İTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. en_US
dc.subject HMM tr_TR
dc.subject Biyoinformatik tr_TR
dc.subject Dizi Hizalama tr_TR
dc.subject HMM en_US
dc.subject Bioinformatics en_US
dc.subject Sequence Alignment en_US
dc.title Saklı Markov Modelleri Kullanarak Protein Fonksiyon Öngörüsü tr_TR
dc.title.alternative Protein Function Prediction Using Hidden Markov Models en_US
dc.type masterThesis en_US
Dosyalar
Orijinal seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.alt
Ad:
704061004.pdf
Boyut:
1.14 MB
Format:
Adobe Portable Document Format
Açıklama
Lisanslı seri
Şimdi gösteriliyor 1 - 1 / 1
thumbnail.default.placeholder
Ad:
license.txt
Boyut:
3.16 KB
Format:
Plain Text
Açıklama