Exploring the conformational transition between closed and open states of the sars-CoV-2 spike glycoprotein using molecular dynamics simulations

thumbnail.default.alt
Tarih
2020-06-15
Yazarlar
Kılınç, Ceren
Süreli Yayın başlığı
Süreli Yayın ISSN
Cilt Başlığı
Yayınevi
Institute of Science And Technology
Fen Bilimleri Enstitüsü
Özet
Coronaviruses (CoVs) are classified as a genus under the Coronaviridae family within the order Nidovirales which includes Mesoniviridae, Arteriviridae, Roniviridae, and Coronaviridae families. The Coronaviridae family includes the Coronavirinae subfamily, which is subdivided into four genera; alphacoronaviruses, betacoronaviruses, gammacoronaviruses, and deltacoronaviruses. Coronaviruses are responsible for a wide variety of diseases in humans and animals; alpha- and betacoronaviruses infect mammals, gammacoronaviruses infect mostly birds and few mammals and deltacoronaviruses infect both mammals and birds. Although coronaviruses have been associated with many diseases, historically, coronaviruses had been associated with 15-30% of self-limiting respiratory infections each year in humans. This situation was accepted as such until a member of betacoronavirus named the severe acute respiratory syndrome coronavirus (SARS-CoV) epidemic occurred in 2002. Subsequently, another outbreak caused by another virus belonging to the betacoronavirus genus named the Middle East respiratory syndrome (MERS-CoV) following the SARS-CoV outbreak occurred between 2002-2003 and caused the coronaviruses to be seen as possible pandemic agents. Coronaviruses are able to adapt to new conditions through recombinations and mutations uncomplicatedly, thus, they can alter their host targets efficiently. As a result of these adaptation abilities, a new type of betacoronavirus, which can spread much faster and bind better than SARS-CoV and MERS-CoV, was detected in 2019. A novel coronavirus called severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) that causes the infectious coronavirus disease 2019 (COVID-19) has resulted in a pandemic crisis since its first registration in December 2019. This virus belongs to the same large betacoronavirus family including SARS-CoV and MERS-CoV that caused other epidemic diseases in the past years. Similar to other coronaviruses, SARS-CoV-2 consists of a viral envelope that has a bilayer lipid structure and three structural proteins embedded in this viral envelope: envelope, membrane, and spike (S). Among these structural proteins, S proteins have a critical role on host cell infections since they are involved in the recognition of the host cells and fusion between viral and host cell membranes. S proteins are large trimeric glycoproteins and contain two functional subunits: the S1 subunit responsible for binding to host cell receptors and the S2 subunit responsible for fusion of the host cell and viral membrane. The S1 subunit contains the N-terminal domain (NTD) and the receptor-binding domain (RBD) which can bind directly to the receptor of the host cell. RBD undergoes rigid-body motion to hide or expose the receptor-binding surface. Depending on this movement, S protein can be in receptor inaccessible or receptor accessible states. In the receptor inaccessible state (closed state), all RBDs are in the down position whereas, in the receptor accessible state (open state), at least one RBD is in the up position to engage with the host cell receptor. In order to initiate the binding and fusion mechanism, the S protein switches from the closed state to the open state and bind to the host cell receptor. SARS-CoV-2 S proteins target the angiotensin-converting enzyme 2 (ACE2) receptors located on the membranes of human respiratory epithelial cells and S proteins can bind to ACE2 receptors due to the RBD in their structure. As a result of receptor binding, a series of structural changes occur in the S protein required for fusion mechanism. There are two main cleavage sites in the structure of S protein that are cleaved by the host cell enzymes: the S1/S2 and S2' sites. Upon cleavage of the S1/S2 site, S1 and S2 subunits remain non-covalently bound with each other in the pre-fusion conformation. Cleavage of the S2' site is a prerequisite for the separation of S1 subunit and viral anchored S2 subunit, and for the fusion of the viral and host cell membranes since fusion peptide (FP) at S2 subunit is exposed to the solvent environment after cleavage on this site. Thus, conformational changes that are essential for the fusion mechanism occur in critical fusion mechanism structures heptad repeat 1 (HR1) and heptad repeat 2 (HR2) structures. Conformational change of HR1 to an extended alpha-helix promotes FP insertion in the host cell membrane. This interaction triggers the rearrangement of HR2 to fold over HR1 and form a six-helix bundle. Consequently, viral and host cell membranes are pulled into proximity, allowing the fusion of these membranes and the release of the viral genome into the host cell. This pre-fusion to the post-fusion transition of the S protein can be blocked at any point during the process to prevent the release of the genome into the host cell. Since the recognition of the host cell and release of the viral genome into the host cell are the most crucial steps for pathogenesis and viral infectivity, exploration of the binding and fusion mechanism of S proteins as a potential therapeutic target for developing antiviral drugs has become prominent. In the literature, the binding and fusion process using the complete S protein structures has not been modeled at an all-atom level using molecular dynamics (MD) simulations. MD simulations provide effective insights into structural, dynamic, and energetic information at the atomic level which are difficult to access by experimental techniques. The main aim of the thesis is the modeling of the transition between closed and open states of the SARS-CoV-2 S protein RBD by performing MD simulations. In this thesis, the switching mechanism of the RBD from its closed state to open state is modeled and analyzed using MD simulations and statistical thermodynamic methods. Initial conformations that are used in MD simulations were obtained from crystal structures having PDB ID 6VXX and 6VYB where the RBD of the SARS-CoV-2 S protein in closed and open states, respectively. These structures cover 76.4% of the protein sequence. The remaining parts of the protein sequence were completed using the homology modeling method. Glycan molecules attached to S protein in the crystal structures were conserved throughout the MD simulations. For both open and closed state structures, MD simulations were performed. Based on the results, S protein in the open state was found to be more mobile than the closed state. Salt bridge and hydrogen bond analyses between RBD structures in up and down positions showed that there were a different number of interactions between two positions; and the difference of these interactions between up and down positions might be the reason for the mobility difference between them. In addition, a steric clash between S protein and ACE2 was found in the closed state. This steric clash between ACE2 and the closed state S protein prevents ACE2 binding in the closed state. Therefore, an inhibitor that binds to the S protein in the closed state does not need to compete for the binding interface with the ACE2 receptor. This finding indicates that inhibitory molecules targeting the S protein in the closed state might be developed to prevent RBD-ACE2 binding. In silico pulling experiments were performed to obtain the transition between the two states using steered MD (SMD) simulations. SMD simulations were initiated from closed and open state structures that are obtained with MD simulations and performed for two directions by pulling the RBD structure from down to up conformation to switch between closed to open state and up to down conformation to switch between open to the closed state. In this way, the switching path between closed and open states is obtained. Results of MD and SMD simulations were used for principal component analysis (PCA) to determine the most important and dominant movements taking part in the transition. PCA is an effective and proven method used to determine the most prominent movements of a protein. The covariance matrix of alpha carbon atom coordinates in the protein structure was constructed using the MD simulations data. The diagonal elements of this matrix give the variance value for each amino acid. Based on the simulation results, the first two principal components (PCs) correspond to 96.1% of the total variance, thereby identifying the two most prominent PCs of the protein. Using the determined PCs, the free energy surface was created, and based on the generated energy landscapes, the minimum free energy pathway representing the transition between the down and up state of the S protein protomers was constructed. Energy landscapes suggest the existence of a semi-open state between down and up states of the S protein protomers and several additional substates at various locations were determined. While RBD is in the semi-open state, RBD of one protomer is halfway between its down and up positions while the RBDs of the remaining two protomers are in the down position. The semi-open state shows a different network of interactions than the down and up states and does not show any steric clash to binding with the ACE2 receptor. These findings show the possibility of RBD-ACE2 binding while the S protein in the semi-open state. In the thesis, investigations have been made to discover structural characteristics and transition pathway of the SARS-CoV-2 S protein RBD. This thesis provides an extensive insight into the interdomain interactions, dynamics, and solvent accessibility of the SARS-CoV-2 S protein RBD in its open and closed states and its transition pathway between the closed and open states.
Koronavirüsler; Mesoniviridae, Arteriviridae, Roniviridae ve Coronaviridae ailelerini içeren Nidovirales takımı içinde Coronaviridae ailesi altında bulunan cinsler olarak sınıflandırılmaktadır. Coronaviridae ailesi içerisinde yer alan Coronavirinae alt ailesi ise kendi içerisinde dört türe ayrılmaktadır; alfakoronavirüsler, betakoronavirüsler, gammakoronavirüsler ve deltakoronavirüsler. Koronavirüsler, insanlarda ve hayvanlarda görülen birçok çeşitli hastalıktan sorumludurlar; alfa- ve betakoronavirüsler memelileri, gamakoronavirüsler çoğunlukla kuşları ve az sayıda memelileri, deltakoronavirüsler ise hem memelileri hem de kuşları enfekte etmektedir. Koronavirüsler birçok hastalıkla ilişkilendirilmelerine rağmen, tarihsel olarak, insanlarda görülen kendini sınırlayan solunum yolu enfeksiyonlarının %15-30'u ile ilişkilendirilmiştir. Bu durum 2002 yılında ortaya çıkan ve bir betakoronavirüs üyesi olan şiddetli akut solunum yolu sendromu koronavirüsü (SARS-CoV) salgınına kadar böyle kabul edilmekteydi. 2002-2003 yılları arasında görülen koronavirüs salgınını, Orta Doğu solunum yolu sendromu koronavirüsü (MERS-CoV) olarak adlandırılan başka bir betakoronavirüs ailesine ait virüsün neden olduğu diğer bir salgının izlemesi ile birlikte, koronavirüslerin insanları enfekte edebilen ve pandemiye neden olabilen olası virüsler olarak görülmesine neden olmuştur. Koronavirüsler sahip oldukları genetik çeşitlilik sayesinde ve rekombinasyon ve mutasyon ile yeni koşullara adapte olabilmektedirler ve böylece, hedef konakçı hücre çeşitliliklerini arttırabilmektedirler. Bu adaptasyon yeteneklerinin bir sonucu olarak, SARS-CoV ve MERS-CoV'dan çok daha hızlı yayılabilen ve iyi bağlanabilen yeni bir betakoronavirüs çeşidi daha 2019 yılında tespit edilmiştir. Koronavirüs hastalığı 2019'a (COVID-19) neden olan şiddetli akut solunum yolu sendromu koronavirüs 2 (SARS-CoV-2) adlı yeni bir koronavirüs, 2019 yılının aralık ayında ilk olarak kayıtlara geçtiğinden bu yana bir pandemi olarak sonuçlanmıştır. Bu virüs, geçtiğimiz yıllarda başka salgın hastalıklara neden olan SARS-CoV ve MERS-CoV gibi virüslerin de ait olduğu, insanları enfekte edebilen geniş bir koronavirüs ailesine mensuptur. Diğer koronavirüslerde olduğu gibi, SARS-CoV-2 iki katlı lipit tabaka yapısındaki viral zarftan ve bu viral zarf içine gömülü üç yapısal proteinden oluşmaktadır: membran, zarf ve spike (S). Yapısal proteinlerden birisi olan S proteinleri, konakçı hücreyi tanıma ve viral membran füzyonunu gerçekleştirmede rol aldıkları için konakçı hücrelerin virüs tarafından enfekte edilmesinde kritik bir rol oynamaktadır. S proteinleri, büyük trimerik glikoproteinlerdir ve iki fonksiyonel alt birim içermektedirler: konakçı hücre reseptörlerine bağlanılmasından sorumlu olan S1 alt birimi ve konakçı hücre membranı ile viral membranın füzyonunun gerçekleştirilmesinden sorumlu S2 alt birimi. S1 alt birimi, N-ucu bölgesinden (NTD) ve doğrudan konakçı hücrenin reseptörüne bağlanabilen reseptör bağlanma bölgesinden (RBD) oluşmaktadır. RBD, reseptör bağlanma yüzeyini geçici olarak gizlemek veya ortaya çıkarmak için katı cisim benzeri konformasyonel bir hareket yapmaktadır. Bu hareket sonucundaki pozisyonuna göre, S proteini hedef reseptörle etkileşime girebildiği veya iki yapı arasında çakışma oluştuğu için etkileşime giremediği pozisyonlarda olabilmektedir. Reseptörle etkileşime giremediği halde (kapalı hal), S proteininin yapısındaki tüm RBD'ler aşağı pozisyonda iken, reseptörle etkileşime girebildiği halde (açık hal), en azından tek bir RBD yukarı pozisyonda bulunmaktadır. Bağlanma ve füzyon mekanizmasının başlayabilmesi için, S proteininin, füzyon öncesi konformasyonunda bulunduğu kapalı halden açık hale geçmesi ve konakçı hücrenin reseptörüne bağlanması gerekmektedir. SARS-CoV-2 S proteinleri, insanlardaki solunum yolu epitel hücrelerinin membranları üzerinde bulunan anjiyotensin-dönüştürücü enzim 2 (ACE2) reseptörlerini hedeflemektedirler ve yapılarında bulunan RBD sayesinde konakçı hücre üzerinde bulunan ACE2 reseptörlerine bağlanabilmektedirler. Bu bağlanma sayesinde S proteininde, füzyon için gereken bir dizi yapısal değişiklik gerçekleşmektedir. S proteininin yapısında konakçı hücre enzimleri tarafından kesilmesini sağlayan iki temel kesilme bölgesi bulunmaktadır: S1/S2 ve S2' bölgesi. S1/S2 bölgesinde kesilme gerçekleşmesiyle birlikte, S1 ve S2 alt birimleri birbirleriyle kovalent olmayan bağlar kuracak şekilde etkileşimde kalmaktadırlar. S2' bölgesindeki kesilme ile birlikte, S1 alt birimi ile viral membrana bağlı şekilde bulunan S2 alt birimini birbirinden ayırılmaktadır ve proteinin konakçı hücre membranı ile etkileşmesi için gerekli olan füzyon peptidi (FP) ortamla etkileşimde olacak şekilde ortaya çıkmaktadır. Bu sayede, füzyon mekanizmasında kilit rol oynayan heptad tekrarı 1 (HR1) ve heptad tekrarı 2 (HR2) yapılarında füzyon mekanizması için gerekli olan konformasyonel değişiklikler meydana gelmektedir. HR1'in konformasyonel değişikliğe uğrayarak uzatılmış bir alfa sarmalı şeklinde yeniden düzenlenmesi ile FP konakçı hücre membranına yerleşebilmektedir. Bu yerleşim, S2 alt biriminin yapısında ve HR1 bölgesinin devamında bulunan HR2'nin, HR1'in üstüne katlanarak altılı sarmal bir demet oluşturmasını tetiklemektedir. Böylece S proteini, füzyon öncesi halden oldukça kararlı bir füzyon sonrası hale geçişini tamamlamaktadır. Sonuç olarak konakçı hücre membranı ile viral membran, bu membranların füzyonuna ve viral genomun konakçı hücreye salınmasına izin verecek şekilde yakın konuma gelmektedirler ve membran füzyonu gerçekleşmektedir. Viral genomun konakçı hücreye salınmasını önlemek için, S proteininin füzyon öncesi-sonrası geçişi sırasında gerçekleşen mekanizması herhangi bir noktada bloke edilmelidir. Konakçı hücrenin tanınması ve virüs genomunun konakçı hücreye girişi, patogenez ve viral enfektivite için en kritik adımlar olduğundan, S proteinlerinin bağlanma ve füzyon mekanizmasının çözülmesi, antiviral ilaçların geliştirilebilmesi açısından potansiyel terapötik hedef olarak öne çıkmaktadır. Literatürde, S proteininin bağlanma ve füzyon mekanizması, moleküler dinamik (MD) simülasyonları kullanılarak atomik düzeyde henüz modellenmemiş ve incelenmemiştir. MD simülasyonları, deneysel tekniklerle ulaşılması zor olan veya ulaşılamayan atomik seviyedeki yapısal, dinamik ve enerjetik bilgilere etkin bir şekilde ulaşılmasını sağlamaktadır. Tez çalışmasının temel amacı, S proteininin füzyon öncesi-sonrası geçiş mekanizmasınının adımları atomik seviyede MD simülasyonları gerçekleştirilerek modellenmesidir. Bu tez çalışmasında, S proteininin RBD yapısının kapalı halden açık hale geçiş mekanızması MD simülasyonları ve istatistiksel termodinamik yöntemleri kullanılarak modellenmiştir. MD simülasyonlarında başlangıç konformasyonları olarak, SARS-CoV-2 S proteininin RBD yapısının, sırasıya, kapalı ve açık halde bulunduğu 6VXX ve 6VYB PDB kodlu kristal yapılar kullanılmıştır. Bu yapılar protein sekansının %76.4'ünü kapsamaktadırlar. Protein sekansının eksik kalan kısımları homoloji modelleme yöntemi kullanılarak tamamlanmıştır. Kristal yapılarda bulunan ve S proteini bağlı halde bulunan glikan molekülleri simülasyonlar boyunca korunmuştur. Öncelikle açık ve kapalı haldeki yapılar için konvansiyonel MD simülasyonları gerçekleştirilmiştir. Bu simlüasyonlar sonucunda, açık haldeki S proteinin kapalı hale göre daha hareketli olduğu görülmüştür. Kapalı ve açık hale, iki farklı pozisyonda bulunan RBD yapıları arasındaki tuz köprüsü ve hidrojen bağı analizleri, iki pozisyon arasında farklı sayıda etkileşimler olduğunu göstermiş ve iki pozisyon arasındaki hareketliliğin bu etkileşimlerin farkından kaynaklandığı görülmüştür. Buna ek olarak, iki farklı hallerdeki RBD yapılarınnın ACE2 reseptörüne bağlanma pozisyonları incelenmiş ve kapalı haldeki S proteininin ACE2 yapısı ile çakışma gösterdiği bulunmuştur. Bu çakışma, kapalı halde bulunan S proteininin ACE2 reseptörüne bağlanmasını engellemektedir. Bu nedenle, kapalı hale bağlanan bir inhibitörün bağlanma arayüzü için ACE2 reseptörü ile rekabet etmesi gerekmemektedir. Bu bulgu, RBD-ACE2 bağlanmasını önlemek için kapalı haldeki S proteinini hedef alan inhibitör moleküllerin geliştirilebileceğini göstermektedir. İki hal arasındaki geçişin elde edilebilmesi için yönlendirilmiş MD (SMD) simülasyonları uygulanarak in silico çekme deneyleri gerçekleştirilmiştir. SMD simülasyonları, serbest şekilde simüle edilen iki yapıdan da başlatılmıştır ve hem kapalı halde aşağıda bulunan RBD yapısını yukarı doğru çekerek açık hale getirecek şekilde hem de açık halde yukarıda bulunan RBD yapısını aşağı çekerek proteini kapalı hale getirecek şekilde gerçekleştirilmiştir. Bu şekilde kapalı ve açık hal arasındaki geçiş yolu elde edilmiştir. Konvansiyonel MD ve SMD simülasyonları sonucunda elde edilen veriler kullanılarak RBD'nin kapalı ve açık haller arasındaki geçişinde rol alan hareketleri arasındaki en önemli ve baskın olan hareketlerin belirlenebilmesi için temel bileşenler analizi (PCA) yapılmıştır. PCA, bir proteinin en belirgin hareketlerini incelemek için kullanılan etkili ve kanıtlanmış bir yöntemdir. Analizin gerçekleştirilebilmesi için kovaryans matrisi oluşturulmuştur ve bu matris protein yapısındaki alfa karbon atom koordinatları kullanılarak elde edilmiştir. Bu matrisin diyagonal elemanları her amino asit için olan varyans değerini vermektedir. Elde edilen verilere dayanılarak, ilk iki temel bileşenin toplam varyansın %96.1'ine denk geldiği bulunmuştur ve böylelikle proteinin en belirgin iki temel bileşeni belirlenmiştir. Belirlenen temel bileşenler kullanılarak serbest enerji yüzeyi oluşturulmuştur ve oluşturulan serbest enerji yüzeyinden yararlanılarak S proteininin protomerlerinin aşağı ve yukarı hali arasındaki geçişi temsil eden minimum serbest enerji yolu belirlenmiştir. Serbest enerji yüzeyi, iki hal arasında bulunan yarı-açık bir halin bulunduğunu önermektedir ve çeşitli yerlerde birkaç ilave alt hal olduğunu ortaya çıkarmıştır. RBD yarı-açık halde iken, bir protomerin RBD yapısı aşağı ve yukarı haller arasındaki geçişin ortasında bulunmaktadır, kalan RBD yapıları ise aşağı halde bulunmaktadır. Bulunan yarı-açık hal, açık ve kapalı halden farklı bir etkileşim ağı göstermektedir ve ACE2 reseptörü ile bağlanma sırasında herhangi bir çakışma göstermemektedir. Bu bulgu, RBD-ACE2 bağlanmasının yarı-açık haldeki S proteini için de gerçekleşme olasılığını göstermektedir. Bu tez çalışmasında, SARS-CoV-2 S proteininin RBD yapısının yapısal özellikleri ve geçiş yolu araştırılmıştır. Bu tez çalışması, SARS-CoV-2 S proteininin RBD yapısının kapalı ve açık halde bulunurkenki bölgeler arası etkileşimleri, dinamiği ve çözücü erişilebilirliği hakkında bilgiler sağlamaktadır.
Açıklama
Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2020
Tez (Yüksek Lisans)-- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2020
Anahtar kelimeler
Biochemistry ,Bioengineering, Biotechnology, Biyokimya , Biyomühendislik ,Biyoteknoloji
Alıntı