Boolcu Ağların Evrimleştirilmesi İle Biyolojik Regulasyon Ağlarının Ve Meta-ağlarının Topolojik Ve Dinamik Özelliklerinin Modellenmesi
Boolcu Ağların Evrimleştirilmesi İle Biyolojik Regulasyon Ağlarının Ve Meta-ağlarının Topolojik Ve Dinamik Özelliklerinin Modellenmesi
Dosyalar
Tarih
2014-07-02
Yazarlar
Danacı, Burçin
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Fen Bilimleri Enstitüsü
Institute of Science and Technology
Institute of Science and Technology
Özet
Ağlar, biyolojik sistemler de dahil olmak üzere çok çeşitli yapıların modellenmesinde kullanılmaktadır. Burada sistemi oluşturan elemanlar arasındaki etkileşimler sistemin zaman içindeki davranışını belirler. Her bir elemanın zamanda tanımlı bir durumu vardır. Bu durum ağın çeşidine bağlı olarak bir vektörle veya skaler bir alanla temsil edilebilir. Sistemin durumu ise bütün nodların durumlarının fonksiyonu olarak tanımlanır. Elemanların durumları, aralarındaki etkileşimlere bağlı olarak zaman içinde değişir ve sistemin davranışını belirler. Bu elemanların her biri ağın düğümlerini, aralarındaki bağlantılar ise düğümler arasındaki kenarları oluştururlar. Bu bağlantıların tümü ağın topolojisini, sistemin zaman içinde değişen davranışı ise dinamiğini belirler. Topoloji komşuluk matrisiyle tanımlanır. Komşuluk matrisinin her bir elemanı iki düğüm arasında bir kenar olup olmadığını ifade eder. Ağırlıklandırılmamış bir ağda bu matrisin elemanları 1 (kenar varsa) veya 0 (kenar yoksa) değerlerini alırlar. Ağırlıklandırılmış bir ağda ise bu matrisin elemanları kenarların ağırlıklarıyla orantılı değerler alırlar. Hücre içi biyolojik fonksiyonları kontrol eden genetik regülasyon ağları Boolcu ağlar tarafından modellenebilmektedir. İlk kez Kauffman tarafından ileri sürülen bu modele göre ağdaki her bir düğüm bir gene karşılık gelir. Genler sadece iki durumda olabilirler. Aktif durumdayken protein kodlarlar. Pasif durumda olduklarındaysa kodlama işlemi gerçekleşmez. Bir genin kodladığı protein, başka bir geni aktifleştirebilir veya pasifize edebilir. Aktive etmesi durumunda bu etkileşim positif, pasifize etmesi durumunda ise negatif etkileşim olarak tanımlanır. Genler sonlu sayıda ise durumları sadece iki değer alabildiğinden sistemin faz uzayı sonlu sayıda durum vektörü içerir. Sistem herhangi bir başlangıç noktasından hareket ederek zaman içinde değişmeyen bir duruma ulaşırsa, bu duruma sabit nokta denir. Ancak sistemin durumu etkileşimlerden dolayı zaman içinde sabit kalmayabilir, fakat faz uzayı sonlu olduğundan sistem bir süre sonra daha önce bulunduğu bir duruma geri dönecektir ve o andan itibaren sabit sayıda durum arasında periyodik olarak salınım yapacaktır. Sistemin herhangi bir başlangıç noktasından başlayarak, yeterli zaman geçtikten sonra ulaştığı sabit noktaya veya tekrarlanan durum kümesine çekici denir. Genetik regülasyon ağlarında farklı çekicilerin farklı hücre tiplerine veya çevredeki değişikliklere verilen farklı tepkilere karşılık geldiği düşünülebilir. Kullandığımız modele göre bir ağın sahip olduğu dinamik çekiciler kümesi, bu ağın "fenotipi"ni, komşuluk matrisi ise "genotipi"ni tanımlamaktadır. Ağların dinamik özellikleri topolojik özellikleri tarafından belirlenmektedir. Fakat topolojiyle dinamik arasındaki ilişkiyi veren bir formül bulunmamaktadır. Bu çalışmanın amacı, belirli bir dinamik özelliğe sahip olacak şekilde evrimleştirilmiş ağ popülasyonlarının topolojik özelliklerini kıyaslayarak hangi topolojik özelliklerin istenen dinamik özelliğe yol açtığını incelemektir. Burada aranan dinamik özellik ağların kısa çekicilere sahip olmasıdır. Bunun sebebi hücre başkalaşımı gibi biyolojik fonksiyonlardan sorumlu genetik regülasyon ağlarının kısa çekicilere sahip olmaları gerektiğinin bilinmesidir. Bu çalışmada, Boolcu ağları evrimleştirmek için sabit nokta çekicilerine veya ikili döngülere sahip ağları (çizgeleri) seçen bir genetik algoritma kullanılmıştır. Birbirinden bağımsız olarak Evolving Boolean graphs to model the topological and dynamical behavior of biological regulatory networks and their metanetworksevrimleştirilmiş popülasyonların çeşitli özellikleri karşılaştırılarak Boolcu ağların dinamiği (fenotipleri) ile komşuluk matrisleri (genotipleri) arasındaki ilişki incelenmiştir. Yapılan simülasyonlar sonucu bir popülasyondaki ağların ortalama çekici uzunluklarının simülasyonun ilk evresinde zamanla azaldığı ve bu azalışın $t^{-\gamma}$ şeklinde bir kuvvet yasasına uyduğu gözlemlenmiştir, burada $t$ genetik algoritmanın zaman adımıdır. İlk 100-150 adımdan sonra ise ortalama çekici uzunluğu 2'den küçük bir değerin etrafında küçük salınımlar yapmaya devam etmiştir. Kısa çekicilere sahip çizgelerin ayırdedici özellikleri bu çizgelerin randomize (rastgele hale getirme) edilmesiyle oluşturulmuş kontrol grubu kullanılarak saptanmıştır. Randomizasyon işlemi evrimleştirilmiş çizgelerin toplam kenar sayılarını koruyarak rastgele bir şekilde yeniden üretilmesiyle gerçekleştirilmiştir. Farklı çizgelerin topolojik özellikleri, derece dağılımları ve motif frekansları karşılaştırılarak incelenmiştir. Niceliksel bir karşılaştırma için enformasyon içeriği kullanılmıştır. Enformasyon içeriği hem motif frekansları ve derece dağılımları gibi topolojik özelliklere dayanarak hem de ortalama çekici uzunluğu gibi dinamik bir özelliğe dayanarak hesaplanmıştır ve her iki durumda da evrimleştirilmiş çizgelerin enformasyon içeriği randomize çizgelere göre daha düşüktür. Evrimleştirilmiş çizgelerin motif frekansları bazı motiflerin hemen hemen bütün çizgelerde baskılandığını, bazılarının ise yüksek oranda ortaya çıktığını göstermektedir. Evrimleştirilmiş çizgelerde yüksek kenar sayısına sahip veya geri beslemeli motifler düşük oranda görünürken ileri beslemeli motiflerin frekansları oldukça yüksektir. Evrimleştirilmiş çizgelerle biyolojik ağların motif frekanslarını karşılaştırmak için "anlamlılık profili" kullanılmıştır. Karşılaştırma için k-çekirdek algoritması kullanılarak \textit{E. coli, B. subtilis} ve \textit{S. cerevisae}nin genetik regülasyon ağları en çok kenara sahip düğümlerinden oluşan alt çizgelere ayrıştırılmıştır. Biyolojik ağların bu alt çizgeleriyle evrimleştirilmiş Boolcu ağların anlamlılık profillerinin birbirlerine benzer olduğu saptanmıştır. Evrimleştirilmiş Boolcu ağlardan oluşan farklı popülasyonların anlamlılık profilleri genel olarak birbirine benzese de, diğer topolojik ve dinamik özellikleri birbirinden oldukça farklı olabilmektedir. Ortalama çekici uzunluğunun stasis durumuna yavaş bir şekilde yaklaşmasının da gösterdiği gibi "uyumluluk yüzeyi" engebeli bir yüzeydir ve farklı popülasyonlar genotip ve fenotip uzayının farklı alanlarını taramaktadırlar. Bu sorunu aşmak için bu popülasyonlar düğümlerinde Boolcu çizgeler bulunan meta-ağlar olarak düşünülebilirler. Bu meta-ağların yapıları regülasyon ağlarının evrilebilirlik ve mutasyonlara karşı dayanıklılık gibi hayati önem taşıyan özellikleriyle yakından ilişkilidir. Genotip uzayındaki meta-ağlar için yaptığımız tanıma göre Boolcu ağlar birbirlerine bir mutasyon adımı uzaklıktaysa bu ağlar bir kenarla bağlı kabul edilirler. Birlikte evrilmiş çizgeler randomize çizgelere kıyasla, genotip uzayında birbirlerine daha yakınlar; başka bir deyişle evrimleştirilmiş çizgeler için ortalama mutasyon uzunluğu randomize çizgelerde oluğundan daha küçüktür. Birbirinden bağımsız olarak evrimleştirilmiş popülasyonların genotip uzayında meydana getirdiği meta-ağların derece dağılımları aynı ortalama değere sahip Poisson dağılımına uymaktadır. Çoğu meta-ağın popülasyondaki çizgelerin yarısından fazlasını içeren bağlı bir bileşeni bulunmaktadır. Randomize popülasyonlarda çizgeler arası minimum mutasyon uzunluğu birden büyük olduğundan bu poülasyonlardaki çizgelerin komşuları bulunmamaktadır. Boolcu ağlar fenotip uzayında da bir meta-ağ oluşturabilirler. Burada yaptığımız tanıma göre iki çizgenin en az bir tane ortak çekicisi varsa bu çizgeler bağlı kabul edilmektedirler. Bu kenarlar çizgelerin ortak çekicilerinin çekici havzalarının büyüklükleriyle orantılı olarak ağırlıklandırılmıştır. Çizgelerin dayanıklılığını test etmek için değişen eşik değerlerine göre eşik değerinden düşük ağırlığa sahip kenarlar elenerek meta-ağların en büyük bağlı bileşenleri karşılaştırılmıştır. Buna göre evrimleştirilmiş popülasyonların meta-ağlarının en büyük bağlı bileşenleri eşik değeri artırıldığında randomize meta-ağların en büyük bağlı bileşenlerine göre daha yavaş küçülmektedir. Bu da evrimleştirilmiş çizgelerin, fenotiplerinde fazla değişiklik olmaksızın genotip uzayında geniş alanları tarayabildikleri anlamına gelmektedir.
Our study aims to capture the topological and dynamical features of gene regulatory networks by evolving Boolean graph populations subject to a fitness function favoring point attractors and two-cycles. According to our model, the set of the dynamical attractors a network has constitutes its "phenotype", whereas its adjacency matrix is considered as its "genotype". The relation between the dynamics (phenotype) and the wiring (genotype) is studied by comparing different features of independently evolved populations. The distinguishing features of the graphs with short attractor lengths were determined by using a randomized control group. Randomization was carried out by rewiring the evolved graphs by preserving the total number of edges. The topological features of different networks were examined by comparing degree distributions and motif frequencies. For a quantitative comparison information content is used. The information content based on both the topological features such as degree distributions and motif frequencies and the dynamical features such as mean attractor lengths were found to be smaller for evolved graphs compared to those of randomized graphs. The motif frequencies of the evolved graphs showed that feed back loops are suppressed, whereas the number of feed-forward loops and loopless motifs are relatively high. Significance profiles were used to compare motif frequencies of the evolved and biological networks. The biological networks we have studied are the core computational graphs of gene regulatory networks of E. coli, B. subtilis and S. cerevisae, extracted by using k-core algorithm. The significance profiles of the evolved networks were found to be similar to those of the biological networks. Although the significance profiles of different populations of evolved Boolean graphs were similar to each other, in general, their other topological and dynamical features can be very different. As the slow relaxation of the mean attractor lengths to stasis indicates, the fitness landscape is a rugged one and different populations span different areas in genotype and phenotype spaces. To overcome this problem, these populations can be considered as metanetworks whose nodes are Boolean graphs. The structures of these metanetworks are strongly correlated to the vital features of the regulatory networks, such as evolvability and mutational robustness. The Boolean graphs are connected in genotype space by an edge if they are one mutation away from each other. Coevolved networks are closer to each other in genotype space compared to the randomized networks, in the sense that the average mutational distance between the evolved networks is smaller than those of the randomized networks. The degree distributions of the metanetworks formed in genotype space generally fit Poisson distributions with the same mean value for independently evolved populations. Most of these metanetworks have connected components containing more than half of the networks within the population. The randomized counterparts of the evolved networks, however, do not have any neighbors in the genotype space, since the minimum mutational distance between the randomized networks is larger than one. The Boolean graphs form a metanetwork in phenotype space, where two Boolean graphs are connected by an edge, if they share at least one attractor. The edges are weighted by the sizes of the basins of attraction of the shared attractors and different threshold values are used to eliminate weak connections. The metanetworks of the evolved populations are highly connected and the sizes of their largest connected components decrease slower with the increasing threshold compared to the metanetworks of the randomized populations, pointing the robustness of the Boolean graphs under mutations.
Our study aims to capture the topological and dynamical features of gene regulatory networks by evolving Boolean graph populations subject to a fitness function favoring point attractors and two-cycles. According to our model, the set of the dynamical attractors a network has constitutes its "phenotype", whereas its adjacency matrix is considered as its "genotype". The relation between the dynamics (phenotype) and the wiring (genotype) is studied by comparing different features of independently evolved populations. The distinguishing features of the graphs with short attractor lengths were determined by using a randomized control group. Randomization was carried out by rewiring the evolved graphs by preserving the total number of edges. The topological features of different networks were examined by comparing degree distributions and motif frequencies. For a quantitative comparison information content is used. The information content based on both the topological features such as degree distributions and motif frequencies and the dynamical features such as mean attractor lengths were found to be smaller for evolved graphs compared to those of randomized graphs. The motif frequencies of the evolved graphs showed that feed back loops are suppressed, whereas the number of feed-forward loops and loopless motifs are relatively high. Significance profiles were used to compare motif frequencies of the evolved and biological networks. The biological networks we have studied are the core computational graphs of gene regulatory networks of E. coli, B. subtilis and S. cerevisae, extracted by using k-core algorithm. The significance profiles of the evolved networks were found to be similar to those of the biological networks. Although the significance profiles of different populations of evolved Boolean graphs were similar to each other, in general, their other topological and dynamical features can be very different. As the slow relaxation of the mean attractor lengths to stasis indicates, the fitness landscape is a rugged one and different populations span different areas in genotype and phenotype spaces. To overcome this problem, these populations can be considered as metanetworks whose nodes are Boolean graphs. The structures of these metanetworks are strongly correlated to the vital features of the regulatory networks, such as evolvability and mutational robustness. The Boolean graphs are connected in genotype space by an edge if they are one mutation away from each other. Coevolved networks are closer to each other in genotype space compared to the randomized networks, in the sense that the average mutational distance between the evolved networks is smaller than those of the randomized networks. The degree distributions of the metanetworks formed in genotype space generally fit Poisson distributions with the same mean value for independently evolved populations. Most of these metanetworks have connected components containing more than half of the networks within the population. The randomized counterparts of the evolved networks, however, do not have any neighbors in the genotype space, since the minimum mutational distance between the randomized networks is larger than one. The Boolean graphs form a metanetwork in phenotype space, where two Boolean graphs are connected by an edge, if they share at least one attractor. The edges are weighted by the sizes of the basins of attraction of the shared attractors and different threshold values are used to eliminate weak connections. The metanetworks of the evolved populations are highly connected and the sizes of their largest connected components decrease slower with the increasing threshold compared to the metanetworks of the randomized populations, pointing the robustness of the Boolean graphs under mutations.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2014
Thesis (M.Sc.) -- İstanbul Technical University, Instıtute of Science and Technology, 2014
Thesis (M.Sc.) -- İstanbul Technical University, Instıtute of Science and Technology, 2014
Anahtar kelimeler
Boolcu Ağlar,
Boolean Networks