İçerik-temelli Ağlarının Özellikleri

thumbnail.default.alt
Tarih
Yazarlar
Balcan, Duygu
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Özet
Burada sunulan tez calışmasının ana teması transkripsiyon gen regülasyonu (düzenleme) çizgelerinin oluşumuna katkıda bulunan unsurların ve bu çizgelerin yapısal (topolojik) özelliklerinin enformasyon teorisi yaklaşımı ile modellenmesidir. Transkripsiyonel gen kontrolünde, transkripsiyon faktörleri olarak isimlendirilen proteinler DNA üzerinde özel alt dizilere bağlanarak, gen ifadesinin düzenlenmesine katkıda bulunmaktadırlar. Böyle bir proteinin tanıyıp bağlanabildiği DNA motiflerinin bilgi içeriğini başka bir alfabede ifade etmek mümkün olabilir. Bu yaklaşımla mayanın transkripsiyonel gen düzenleme ağını, içerik temelli ağın herbir düğümü bir gene karşılık gelmek üzere, herbir düğümüne gelişi güzel ikilik sistemde içerikleri olan diziler atayarak ve düğümler arasına, onlara atanan dizilerin birbirleri içerisinde tekrarlanma durumlarına göre, belli koşulları sağlamaları sonunda kenarlar yerleştirerek modelledik. Paylaşılan bilgi miktarının dağılımı modelimizin en önemli girdisi olup, ortaya çıkacak olan çizgenin özelliklerini tamamen belirlemektedir. Mayanının etkileşim ağını ayrıntılı biçimde inceleyerek, çizgenin yapısal özelliklerini içerik temelli modelimizin istatistiksel topluluğunun üyeleriyle karşılaştırdık. Gördük ki, içerik temelli modelimiz maya çizgesinin bütün özelliklerini barındırmakta ve bu tür ağların yapısal özelliklerinin anlaşılmasına imkan sağlamaktadır. Tamamen gelişi güzel dizilerden oluşturduğumuz içerik temelli çizgenin mayanın kontrol ağına yakınlığı, bu tür karmaşık ağ yapılarının evrim altında ereksel biçimde yoktan var edilmeleri gerekmedikleri sonucuna varmamıza neden olmaktadır. İçerik temelli modelimizin kabalaştırılması sonunda elde ettiğimiz ve (sadece dizi uzunluklarına bağlı) gizli-değişkenli olarak isimlendirilen modelin bizim içerik temelli modelimizi ve gerçek maya çizgesini yakından izleyen yapısal özellikleri nedeniyle, bu kaba model üzerinde yapılacak analitik hesapların düzenleme ağlarının yapılarıyla ilgili öngörülerde bulunabileceğini göstermektedir. İcerik temelli çizgelerin gen kontrol ağlarına yakınlıkları, gelişi güzel Boolean dinamiğini içerik temelli ağlara uyarlamamızı özendirmiştir. Bu yolla gen ifadesinin kontrol çizgelerinin topolojilerinin gen ifadesi dinamiği üzerindeki etkilerini anlamak mükün olabilir. Sonuçlarımız içerik temelli ağların bağışıklık sistemi yada protein etkileşimleri gibi çok sayıda koşulun yerine gelmesi sayesinde oluşan etkileşim ağlarının modellenmesi için elverişli olanaklar sunduğunu göstermektedir.
The research we present in this thesis has been devoted to the modelling and understanding of transcriptional gene regulatory networks, on the basis of an information theoretical approach. Transcriptional gene regulation involve special proteins, namely the transcription factors, which bind to the DNA by recognizing specific subsequences, namely the transcription factor binding sites, embedded in them. We have modelled the transcriptional regulation network of yeast within this approach by associating random linear codes with the genes of the organism represented by nodes in our content-based network, and establishing edges between the nodes if and only if they share a certain amount of information, which has been realized via a sequence-matching rule. The distribution of the amount of shared information, which has been represented by the bitwise Shannon information of the random linear codes associated with the binding sequences and the promoter regions, are the most important biological inputs to our content-based model. We have made a very careful analysis of the transcriptional regulation networks of yeast, and compared their topological features with those of the ensemble of our content-based networks. We have observed that our content-based model is able to reproduce all the global topological features of these networks, which provides us with an understanding of their emergent nature. We conclude that the complex networks of gene regulation can arise spontaneously even with the random codes, so they do not need to be constructed from scratch by evolutionary mechanisms. We have also introduced the hidden-variable version of our content-based model involving only the pairwise connection probabilities as a function of the string lengths and observed that this model is able capture the main properties of our double-string model. So the analytical calculation on the hidden-variable model can provide us with making some predictions on the further properties of real networks. Very close topological similarities between the content-based models and genetic regulatory networks have led us to consider a modified random Boolean dynamics on our content-based networks, which we believe will help us with the understanding of the relationship between the architecture of the underlying network and the function of these systems. Our results point to further promising research problems in biological systems, where interactions between different components require the fulfillment of a series of constraints, which means the exchange of a certain amount of information. Examples are immune systems and protein interactions.
Açıklama
Tez (Doktora) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007
Thesis (PhD) -- İstanbul Technical University, Institute of Science and Technology, 2007
Anahtar kelimeler
içerik-temelli ağlar, transkripsiyonel gen regülasyon ağları, enformasyon teorisi, content-based networks, transcriptional genetic regulatory netwoks, ınformation theory
Alıntı