Saklı Markov Modelleri Kullanarak Protein Fonksiyon Öngörüsü

dc.contributor.advisorÇataltepe, Zehra
dc.contributor.authorKömürlü, Caner
dc.contributor.authorID371550
dc.contributor.departmentBilgisayar Bilimleri
dc.contributor.departmentComputer Science
dc.date2008
dc.date.accessioned2016-10-25T14:12:29Z
dc.date.available2016-10-25T14:12:29Z
dc.descriptionTez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Bilişim Enstitüsü, 2008
dc.descriptionThesis (M.Sc.) -- İstanbul Technical University, Institute of Informatics, 2008
dc.description.abstractSaklı Markov modellerininin biyoinformatik alanında kullanılmaya başlanması ile üzerine düşülen konu HMM profilleri olmuştur. Saklı Markov modellerinden önce çoklu hizalama yöntemleri ile üretilen profiller, bu modellerin kullanılması ile daha başarılı ve yüksek doğrulukla üretilmeye başladı. Uzak homoloji kavramının bu modellerle çalışmalara dahil edilmesi bu sayede gerçekleşti. Uzak homoloji üzerine geliştirilen araçlar ve bu araçların kullandığı diğer araçların başında, HHsearch (HMM HMM search), PRC (Profile Comparer), SAM (Sequence Alignment Modelling), HMMER gelir. Bu çalışmada HMMER, profil-dizi kıyaslaması yoluyla benzerlik matrisi üretiminde, HHsearch profil-profil kıyaslaması yoluyla benzerlik matrisi üretiminde, PRC yine profil-profil kıyaslaması yoluyla benzerlik matrisi üretiminde kullanıldı. Bu yöntemlerde gerekli yerlerde PSI-BLAST, ClustalW ve Kalign, hizalama ve demetleme yöntemleri için kullanıldı. Veri olarak Protein Data Bank veritabanınıdan Gene Ontology'ye bağlı olarak oluşturulan 5 sınıflı protein veritabanı, yine aynı veri kümesinin zenginleştirilmiş sürümü ve NR veri kümesi kullanıldı. Benzerlik matrislerinin üretiminin neticesinde elde edilen veri, örüntü tanıma tekniklerinde kullanıldı. 5 sınıflı veri kümesi için dizi-profil ve profil-profil kıyaslamasının katar hizlama yöntemlerinden daha kötü sonuç verdiği bulundu. İkincil yapının HMM'de hesaba katılmasının fonksiyon öngörüsünde faydalı olduğu görüldü. NR veri kümesi ile zenginleştirilmiş veri kümesinin profil üretiminde faydalı olduğu görüldü.
dc.description.abstractThe profile-HMM's became popular with the use of hidden Markov models in bioinformatics. Profiles, which were conventionally produced using alignment methods, became more accurate and successfull by means of hidden Markov models. As a consequence, remote homolgs were included into function prediction studies with these models. In this study, HMMER is used in sequence-profile comparison, HHsearch is used in profile-profile comparison, PRC is used in profile-profile comparison for similarity matrix production. PSI-BLAST, ClustalW and Kalign are used in alignment and clustering steps. As the data set, 5-class protein database generated from Protein Data Bank database with respect to Gene Ontology Annotation is used. In addition, its variant, the enriched data set and NR data set are used. The similarity matrices produced by HMMER, HHSearch and PRC methods are used as inputs to machine learning techniques. For the 5-class data set used, it is found out that sequence-HMM-profile and HMM profile-profile methods cannot perform as well as sequence aligment techniques. It is also found out that using secondary structure in addition to the amino acid sequence helps with protein function prediction. Enrichment of data set with NR data is found to help with function prediction.
dc.description.degreeYüksek Lisans
dc.description.degreeM.Sc.
dc.identifier.urihttp://hdl.handle.net/11527/12201
dc.publisherBilişim Enstitüsü
dc.publisherInstitute of Informatics
dc.rightsİTÜ tezleri telif hakkı ile korunmaktadır. Bunlar, bu kaynak üzerinden herhangi bir amaçla görüntülenebilir, ancak yazılı izin alınmadan herhangi bir biçimde yeniden oluşturulması veya dağıtılması yasaklanmıştır.
dc.rightsİTÜ theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission.
dc.subjectHMM
dc.subjectBiyoinformatik
dc.subjectDizi Hizalama
dc.subjectHMM
dc.subjectBioinformatics
dc.subjectSequence Alignment
dc.titleSaklı Markov Modelleri Kullanarak Protein Fonksiyon Öngörüsü
dc.title.alternativeProtein Function Prediction Using Hidden Markov Models
dc.typeMaster Thesis

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
Ad:
704061004.pdf
Boyut:
1.14 MB
Format:
Adobe Portable Document Format

Lisanslı seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
Ad:
license.txt
Boyut:
3.16 KB
Format:
Plain Text
Açıklama