Korean Society for Biotechnology and Bioengineering Journal Korean Society for Biotechnology and Bioengineering Journal

pISSN 1225-7117 eISSN 2288-8268

Article

Home All Articles View

Research Paper

Korean Society for Biotechnology and Bioengineering Journal 2024; 39(4): 128-135

Published online December 31, 2024 https://doi.org/10.7841/ksbbj.2024.39.4.128

Copyright © Korean Society for Biotechnology and Bioengineering.

비천연아미노산이 도입된 재조합 단백질의 생합성 예측을 위한 docking simulation platform 평가

Evaluation of Docking Simulation Platforms for Predicting Incorporation Efficiency of Non-Canonical Amino Acids

Yeojin Ko, Tae Wan Kim*&dagger,, and Jong-il Choi*&dagger,

Department of Biotechnology and Bioengineering, Chonnam National University, Gwangju 61186, Korea

Correspondence to:Tel: +82-62-530-1846, Fax: +82-62-530-1842
E-mail: choiji01@jnu.ac.kr (J. Choi), chekimtw@jnu.ac.kr

These authors equally contributed.

Received: November 11, 2024; Revised: December 5, 2024; Accepted: December 6, 2024

This study evaluated the docking simulation platforms for the incorporation of amber-suppression tRNA synthetase and non-canonical amino acids (ncAAs). Recombinant Escherichia coli harboring mutant green fluorescence proteins and orthogonal amber-suppression tRNA synthetase/tRNA pair was cultivated with different ncAAs, and the fluorescence and growth were measured. For molecular docking simulation of synthetase and each ncAA, three different platforms were used and the binding affinity predictions were examined. By comparing simulation results with experimental fluorescence protein expression, the reliability of each platform was assessed. AzF exhibited the highest expression levels and strong binding affinity in simulations, while pFF and pAcF showed lower expression and weaker affinity, demonstrating consistent trends between experimental and simulation results. In contrast, BpF displayed high affinity in simulations but low expression levels, which was attributed to ligand positioning outside the active site, as revealed by structural analysis. Among the tested docking platforms, DiffDock-L and DynamicBind showed better predictive accuracy than Autodock Vina. The results obtained in this study will serve as a valuable resource for the effective design for the biosynthesis of recombinant proteins incorporated with non-canonical amino acids.

Keywords: molecular docking, aminoacyl-tRNA synthetase, non-canonical amino acids, gfp expression

아미노산은 자연계에 다양한 형태로 존재하지만, 세포 내에서 단백질을 구성하는 아미노산은 20종으로 제한되어 있어 단백질의 기능적 다양성에는 한계가 있다. 반면, 천연 아미노산 외에 화학적으로 합성되어 번역 과정 동안 사용될 수 있는 비천연아미노산(non-canonical amino acids, ncAAs)은 단백질 내에 도입될 경우 새로운 기능기들을 추가할 수 있어 단백질의 구조와 기능을 확장할 수 있는 것으로 알려져 있다 [1-3]. 최근에는 genetic code expansion 기술이 synthetic biology의 주요 분야로 부각되면서, NMR을 통한 단백질의 구조 연구, 세포 내 단백질의 상호작용 분석 등 비천연아미노산을 도입하여 단백질의 기능성 연구와 더 나아가 재조합 단백질의 기능성을 향상시키는 연구가 활발히 진행되고 있다 [4-8].

비천연아미노산을 단백질에 효율적으로 도입하기 위해서는 특정 아미노산을 대응하는 tRNA에 결합시키는 아미노아실-tRNA 합성효소(aminoacyl-tRNA synthetase, aaRS)의 역할이 필수적이다 [9-12]. 특히, 비천연아미노산과 선택적으로 결합할 수 있도록 설계된 돌연변이 orthogonal mutant tRNA synthetase가 중요하게 작용한다 [12-14]. 이에 따라 다양한 비천연아미노산들과 결합 가능한 aaRS 돌연변이에 관한 연구가 진행되어 왔으며 다양한 비천연아미노산을 결합시킬 수 있는 돌연변이 aaRS가 개발되었으나 [13], 각 비천연아미노산과 돌연변이 aaRS 간의 결합 특성을 체계적으로 평가하는 docking simulation 연구는 상대적으로 미흡한 실정이다. 최근 들어 단백질의 modeling이나 단백질과 ligands 사이의 결합을 예측할 수 있는 molecular docking platform이 다양하게 개발되어 활용되고 있다. 본 연구에서는 이러한 platform 중 AMdock의 Autodock Vina, Neurosnap의 DiffDock-L, 및 DynamicBind를 선정하였다. 비천연아미노산이 첨가되어 발현되면 얻어지는 재조합 super-fold green fluorescent proteins의 발현 형광값과 세포 성장 데이터를 통해 다양한 비천연아미노산의 aaRS와의 결합에 대한 in vivo 실험 결과를 수집하고, 이를 다양한 docking platform을 활용하여 aaRS와 여러 비천연아미노산 간의 결합력과 구조적 안정성을 예측한 결과와 비교하고자 하였다. 이를 통해 docking simulation 결과가 실제 실험 결과를 얼마나 정확히 반영하는지 비교하고, 각 docking simulation platform의 prediction 신뢰도를 평가하였다. 이를 통해 비천연아미노산을 효율적으로 도입할 수 있는 단백질 설계와 합성을 위한 적합한 docking simulation platform을 제시하고자 한다.

2.1. 균주, plasmid 및 배양 조건

본 연구에서는 pSEVA631pt-sfGFP204amb와 pEVOL-pAzFC1-K776 두 개의 플라스미드를 포함한 Escherichia coli DH10B [F– mcrA Δ (mrr-hsdRMS-mcrBC) φ80lacZΔM15 ΔlacX74 recA1 endA1 araD139 Δ (ara- leu)7697 galU galK λ–rpsL (StrR) nupG] (Invitrogen, Waltham, MA, USA)를 숙주로 사용하였다 [15, 16]. 이 중 pSEVA631pt-sfGFP204amb는 형광 단백질(super-fold green fluorescent protein, sfGFP)의 204번째 아미노산에 amber codon이 삽입되어 비천연아미노산 para-azido-L-phenylalanine (AzF, Sigma-Aldrich, Burlington, MA)이 도입될 수 있도록 설계된 플라스미드로, 형광 단백질의 발현을 검증하는 데 사용된다 [4]. pEVOL-pAzF-C1-K776 플라스미드는 pEVOL-pAzF에서 유래하였으며, 비천연아미노산인 AzF의 형광 단백질로의 도입을 위해 변형된 아미노아실-tRNA 합성효소와 tRNACUA 유전자가 포함되어있다 [15].

균주 배양을 위해 10 g/L NaCl, 5 g/L tryptone, 10 g/L yeast extract의 조성을 가지는 Luria-Bertani (LB) 배지에 50 mg/L gentamicin (Thermofisher, Waltham, MA), 50 mg/L chloramphenicol (Sigma-Aldrich, Burlington, MA)를 첨가하였다. 본 연구에서 사용되는 비천연아미노산으로는 para-azido-L-phenylalanine (AzF, Sigma-Aldrich, Burlington, MA) [4], p-fluoro-L-phenylalanine (pFF, ChemImpex, Wood Dale, IL) [17], p-benzoyl-L-phenylalanine (BpF, ChemImpex, Wood Dale, IL) [18], p-acetyl-L-phenylalanine (pAcF, ChemImpex, Wood Dale, IL) [19]를 사용하였다. AzF, pFF, BpF, pAcF는 phenylalanine의 para위치에 각각 azide기, fluoro기, benzoyl기, acetyl기가 치환된 형태이다.

2.2. 세포 농도와 형광 단백질의 발현 측정

형광 단백질의 원활한 발현을 위해 0.2% Arabinose와 0.5mM AzF, pFF, BpF, pAcF 각각을 배양액에 첨가하였고, 37°C, 250 rpm에서 18시간 동안 배양하였다. 재조합 대장균에서 aaRS의 amber-suppression 활성 여부 (또는 비천연아미노산 도입 여부)는 비천연아미노산의 첨가에 따른 형광 단백질의 발현 정도로 확인하였다 [20]. 배양이 완료된 대장균의 형광 단백질의 발현 정도와 세포 농도의 정량적 측정은 마이크로플레이트 리더 (SpectraMax iD3 Multi-Mode Microplate Reader, Molecular Devices, San José, CA, USA)를 이용하여 수행하였다. 세포농도는 600 nm에서의 흡광도(OD600)로 측정하였고, 형광 단백질의 발현량은 485 nm에서의 excitation 파장값과 535 nm에서의 emission 파장 값으로 측정하였다 [16, 21, 22]. 형광 단백질 발현량 (fluorescence intensity)을 흡광도(OD600)로 나눈 값 (specific fluorescence intensity)으로 단위 세포 당 형광 단백질 발현량을 확인하였고, 실험 결과는 서로 다른 세 개의 colonies에서 유래한 재조합 대장균을 배양하여 측정한 평균값으로 표시하였다.

2.3. Amino-acyl tRNA synthetase modeling과 docking

Amino-acyl tRNA synthetase는 Swiss-model (www.swissmodel.expasy.org)을 이용하여 homology modeling을 수행하였으며, 서열 상동성(percentage identity) 97.71%의 높은 수치로 가장 유사한 상동성을 가지는 Methanocaldococcus jannaschii에서 유래한 Tyrosyl-tRNA synthetase (1J1U)를 template로 사용하였다. 1J1U의 active site와 ligand(tyrosine) 결합 부위를 시각적으로 강조한 결과를 Fig. 1에 제시하였다. pEVOL-pAzFC1-K776 플라스미드에 클로닝되어 있는 K776 aaRS 과 네 종류의 비천연아미노산의 docking prediction은 AMdock [23]의 Autodock Vina [24], Neurosnap의 DiffDock-L [25], DynamicBind [26]를 이용해 각각 수행하였다. 각각의 docking platform을 선정한 이유는 다음과 같다. AMdock의 Autodock Vina은, 계산 속도가 빠르고, 다양한 protein-ligand docking 연구에서 신뢰할 만한 prediction 정확도를 제공한다. Neurosnap의 DiffDock-L은 기계 학습 기반의 최신 docking platform으로, 복잡한 protein-ligand interaction을 높은 정확도로 예측한다. 마지막으로 DynamicBind는 deep equivariant generative model을 사용하여 단백질의 유연성을 반영한 protein-ligand 복합체 구조 예측에 뛰어난 성능을 보인다. 이후 pymol [27]을 통해 docking이 완료된 K776 aaRS와 template인 1J1U를 align시켜 active site를 확인하였다. 이를 통하여 예측된 docking 결과와 in vivo 실험 결과를 비교하고 docking platform의 신뢰성을 평가하였다.

Figure 1. Highlighted active site of Methanocaldococcus jannaschii Tyrosyl-tRNA synthetase (1J1U) structure. The active site is displayed in white, containing the ligand tyrosine (green). Residues forming hydrogen bonds with the ligand are labeled with their respective residue numbers and 3-letter amino acid codes in red.

3.1. 비천연아미노산에 따른 형광 단백질의 발현량 비교

이전의 연구 결과로부터 pEVOL-pAzF에 클로닝되어 있는 aaRS에서 유래한 돌연변이 중에서 K776 aaRS가 비천연아미노산 AzF와의 높은 결합능을 보였다 [14]. 돌연변이 pEVOLpAzF-C1-K776는 253번의 Leu이 Pro으로 변환된 것으로 확인되었다 [14]. 본 연구에서는 pSEVA631pt-sfGFP204amb와 pEVOL-pAzF-C1-K776 두 개의 플라스미드들을 포함한 재조합 대장균을 사용하여 specific fluorescence intensity를 측 정하였다.

Specific fluorescence intensity의 경우에는 AzF의 경우 control 대비 6.53배 더 큰 값을 보였다. 그에 비해, pFF, BpF, pAcF의 경우 control 대비 각각 1.20, 1.16, 1.16배의 값을 나타내며 control과 큰 차이가 없는 것으로 확인되어졌다 (Fig. 2). Specific fluorescence intensity는 orthogonal aaRS를 가지고 있는 균주가 각각의 비천연아미노산을 green fluorescence protein에도 얼마나 잘 도입하는지에 대한 정도를 나타낸다[15]. 이러한 실험 결과를 바탕으로, 비천연아미노산에 따른 K776 aaRS의 활성을 예측하기 위하여 Swiss-Model을 이용하여 homology model을 제작하고 이로부터 docking simulation을 진행하였다.

Figure 2. Specific fluorescence intensities of K776 aaRS with different ncAAs. The specific fluorescence intensity is the fluorescence intensity of sfGFP divided by the optical density of cell broth.

3.2. K776 aaRS modeling과 docking

K776 aaRS의 modeling은 Swiss-Model을 이용하여 수행하였다. Template는 Methanocaldococcus jannaschii의 TyrosyltRNA synthetase(1J1U)를 사용하였으며, 이후 docking은 세 가지 platform을 사용하여 진행하였다. AMdock의 Autodock Vina를 이용하여 수행된 docking simulation에서는 docking 과정을 최적화하기 위해 몇 가지 parameter를 설정하였다. Simple docking 옵션을 사용하여 ncAAs와 K776 aaRS 간의 최적의 binding pose를 예측하였으며, ligand와 protein의 interaction을 효과적으로 반영하기 위한 적합한 선택이었다. pH는 생리학적 조건인 7.4로 설정하였으며, docking 분석의 간소화와 효율성을 높이기 위해 receptor 구조에 포함된 금속이온에 대해서는 Keep Metals in Receptors 옵션을 비활성화하였다. 이후 자동 공간 검색 기능(automatic space search)을 사용하여 ligand가 결합 가능한 binding pocket을 우선 검색하고 자동으로 grid box의 위치와 크기를 설정하였다. 각 비천연아미노산에 대해 총 여덟 개의 binding pose가 예측되었고, Pymol을 통해 docking이 완료된 K776 aaRS를 template인 1J1U에 align하여 3D 구조를 확인하였다 (Fig. 3). 이후 aaRS 내부의 active site에 위치한 ligand의 docking 결과는 Fig. 4Table 1에 나타내었다. AzF의 경우, 2 및 3의 binding pose에서 affinity 값이 각각 -6.9 및 -7.0kcal/mol로 계산되었고, pFF와 pAcF는 각 binding site에서 동일하게 -6.9 및 -6.7 kcal/mol로 나타났다. 반면 BpF는 binding site별로 affinity 값에 약간의 차이를 보였으며, 특히 1번 binding pose에서 가장 낮은 -7.1 kcal/mol의 affinity 값을 기록했다. 여기서 binding site는 비천연아미노산이 K776 aaRS에 결합하는 위치를, affinity는 K776 aaRS와 비천연아미노산 간의 결합 세기를, ligand efficiency는 비천연아미노산 한 분자와 K776 aaRS 간의 binding energy를 의미한다.

Figure 3. Interaction models of K776 aaRS and ncAAs aligned with template 1J1U through AMdock. Model of K776 aaRS and AzF (A), of K776 aaRS and pFF (B), of K776 aaRS and BpF (C), and of K776 aaRS and pAcF (D), respectively.

Figure 4. Ligand site interactions from molecular docking of K776 aaRS and ncAA using AMdock, aligned with template 1J1U. The green ligand represents the tyrosine residue of 1J1U, while the other colored ligands correspond to the docked ncAAs. (A) Interaction model of K776 aaRS with AzF at binding site 2 and 3. (B) Interaction model of K776 aaRS with pFF at binding site 3, 4, and 6. (C) Interaction model of K776 aaRS with BpF at binding site 1, 2, 3, and 4. (D) Interaction model of K776 aaRS with pAcF at binding site 2 and 3.

Table 1 Affinity prediction of K776 aaRS and each ncAAs with AMdock

ncAABinding siteAffinityEstimated KIKI unitsLigand Efficiency
(kcal/mol)
AzF2−6.98.76uM−0.46
3−77.4uM−0.47
pFF3−6.98.76uM−0.53
4−6.98.76uM−0.53
6−6.98.76uM−0.53
BpF1−7.16.25uM−0.35
2−6.712.27uM−0.34
3−6.98.76uM−0.35
4−77.4uM−0.35
pAcF2−6.712.27uM−0.45
3−6.712.27uM−0.45


DiffDock-L을 통해 단백질 (aaRS)과 ligand (비천연아미노산)의 docking을 수행할 때, sample 개수를 300개로 설정하여 각 비천연아미노산의 rank 1 결과값을 Table 2에 나타냈다. DiffDock Confidence는 docking 예측의 신뢰도를 나타내며,이 값이 높을수록 예측된 결과의 신뢰도가 높다. SMINA Affinity는 kcal/mol 단위로 ligand와 단백질 간의 결합 친화도를 나타내며, 값이 낮을수록 결합이 강함을 의미한다. SMINA Intramolecular Energy는 ligand의 내부 에너지를 측정하여 ligand의 안정성을 평가하고, SMINA Minimized Affinity는 결합 상태를 최적화하여 최소 에너지로 계산된 affinity 값을 나타낸다. SMINA Minimized RMSD는 최적화된 ligand 구조와 초기 구조 간의 차이를 나타내며, 값이 낮을수록 두 구조 간 유사성이 높음을 뜻한다. 본 연구에서 사용된 모든 비천연아미노산들에서 SMINA Affinity 값보다 SMINA Minimized Affinity 값이 더 낮아졌으며, 특히 BpF의 경우 SMINA Minimized RMSD 값이 1.61로 상대적으로 컸다. 이는 BpF가 단백질 결합 부위에서 상당한 구조적 변화를 겪었음을 의미한다. 최종 affinity 평가는 구조 최적화를 통해 실제 결합 상황을 더 잘 반영하는 SMINA Minimized Affinity에 중점을 두었으며, BpF의 친화도는 -7.30 kcal/mol로 가장 낮아 네 종류의 ncAA 중 가장 강한 결합력을 보였다. AzF는 -7.05 kcal/mol, pAcF는 -6.80 kcal/mol, pFF는 -6.72 kcal/mol로 상대적으로 낮은 결합력을 나타냈다.

Table 2 Affinity prediction of K776 aaRS and each ncAAs with DiffDock-L

DiffDock ConfidenceSMINA AffinitySMINA Intramolecular EnergySMINA Minimized AffinitySMINA Minimized RMSD
AzF0.03−5.89715−0.10806−7.047030.3946
pFF−0.01−5.78935−0.10744−6.716440.36034
BpF−0.51−1.773250.54579−7.299111.61397
pAcF−0.24−4.83918−0.22753−6.804580.95911


DynamicBind을 통한 docking은 AMdock 및 DiffDock-L과 달리 단백질의 유연성을 고려하여 dynamic simulation을 수행하였다. 각각의 비천연아미노산에 대해 총 열 개의 binding pose가 예측되었으며, Pymol을 통해 template인 1J1U와 align한 결과, docking이 완료된 ligand가 모두 K776 aaRS의 active site에 위치한 것을 확인하였다. 이후 이 열 개의 binding pose를 1J1U의 tyrosine 결합 구조와 비교하여 위치와 방향성이 가장 유사한 ligand의 결과값을 Table 3에 제시하였다. 여기서 lddt(Local Distance Difference Test)는 ligand (비천연아미노산)과 결합한 단백질 (aaRS) 구조의 안정성을 평가하는 지표로, 값이 1에 가까울수록 결합 후 구조가 안정적임을 의미한다. Binding affinity는 ligand와 단백질 간의 결합 강도를 나타내며, DynamicBind에서 affinity 값이 높을수록 강한 결합을 뜻한다. BpF의 Rank 5는 affinity 값이 5.16 kcal/mol로 K776 aaRS와 강한 결합력을 가질 것으로 예상되지만, lddt 값이 0.58로 낮아 결합 구조에 대한 신뢰성이 떨어진다. 이는 예측된 구조의 정확성이 부족함을 시사하며, BpF의 affinity 값이 실제 결합 안정성과 일치하지 않을 가능성을 의미한다. AzF, pFF, pAcF의 lddt 값은 0.6 이상으로 구조의 정확성이 높고, affinity 값은 각각 5.14, 4.48, 4.45 kcal/mol이다. 이는 lddt 값이 높을수록 구조적 안정성이 증가하며 결합 친화도가 보다 정확하게 반영될 가능성이 높다는 것을 시사한다.

Table 3 Affinity prediction of K776 aaRS and each ncAAs with DynamicBind

ncAAranklddtaffinity
AzF20.62965.135146
pFF10.6337984.478184
BpF50.5824925.156695
pAcF30.6168614.453087


3.3. In vivo 결과와 docking prediction 결과 비교

비천연아미노산의 종류에 따른 형광 단백질 발현량, 즉 비천연아미노산과 aaRS의 결합능을 비교한 결과, AzF의 발현량이 가장 높았고, pFF, BpF, pAcF는 control과 유사한 낮은 발현량을 보였다 (Fig. 2). 이후, 세 가지 docking platform을 활용하여 진행한 docking prediction 예측 결과를 비교하였다. AMdock과 DiffDock-L의 affinity 값을 절댓값으로 변환하여 양수로 표시하였다 (Fig. 7). 세 가지 docking platform 모두 K776 aaRS에 대한 BpF의 affinity가 가장 높게 예측되었으며, AzF가 그 뒤를 이었고, pFF와 pAcF는 상대적으로 낮은 affinity 값을 보였다. 이는 비천연아미노산이 K776 aaRS에 효과적으로 결합할수록 형광 단백질의 발현량이 증가할 것이며, 이는 단백질 (aaRS)과 리간드 (비천연아미노산)간의 결합력이 높아지는 것과 밀접한 관계가 있을 가능성을 시사한다. BpF의 경우에는 형광 단백질의 발현량은 낮았으나, affinity 절대값은 높게 나타나 대조적인 경향을 보였다. K776 aaRS와 BpF의 docking 결과를 Pymol로 3D 구조 분석한 결과, BpF의 benzoyl 기가 K776 aaRS의 active site를 통과하는 것을 확인할 수 있었으며, 이는 Fig. 4 (C), Fig. 5 (C), Fig. 6 (C)에서 확인 가능하다. 이는 ligand의 bulky한 구조인 benzoyl 기와 K776 aaRS의 active site 주변의 residue 간의 공간적 충돌(spatial clash) 가능성이 있음을 의미하며, 이로 인해 결합의 효율성이 저하되어 실험적으로 낮은 형광 발현량으로 나타났다고 볼 수 있다. 또한, BpF의 DiffDock confidence와 DynamicBind의 lddt 값이 낮은 것으로 나타났다 (Table 2, 3). DiffDock confidence는 docking prediction의 신뢰도를 나타내며, 낮은 값은 예측된 결합 구조의 안정성이 부족함을 시사한다. lddt 값 역시 모델의 각 아미노산의 docking prediction 정확도를 반영하여 낮은 lddt 값은 해당 결합의 신뢰성이 낮음을 의미한다. 이러한 결과는 BpF의 높은 affinity 값에 대한 신뢰도가 낮음을 나타내며, BpF와 K776 aaRS의 결합이 예상보다 낮은 안정성을 가질 가능성을 시사한다. 추가적으로 BpF와 K776 aaRS의 결합 친화성을 개선할 수 있는 방안으로, benzoyl 기와 interaction 할 수 있는 친화적 residue를 active site에 도입하거나, 그 주변 구조를 조정하여 공간적 충동을 최소화할 수 있는 또 다른 돌연변이 aaRS 설계를 제안할 수 있다. Pymol을 통한 3D 구조 분석 결과, AMdock의 binding pose가 DiffDock-L 및 DynamicBind에 비해 적합하지 않은 것으로 나타났다. 이는 template인 1J1U와의 alignment에서, docking이 완료된 ligand가 1J1U의 tyrosine residue와 카복실기 및 아미노기의 방향성에서 일치하지 않았기 때문이다. 반면, DiffDock-L과 DynamicBind는 카복실기와 아미노기의 방향성이 잘 반영한 것으로 나타났다 (Fig. 4, Fig. 5, Fig. 6). 따라서, 단순히 affinity 값만을 기반으로 docking simulation 결과를 평가하기보다는, docking prediction의 정확도와 신뢰도를 반영하는 지표와 함께 해석하는 것이 중요하다. 이러한 3D 구조 분석을 통해 적절한 검증 과정을 거치는 것이 필요하며, 비록 단백질 모델링의 완벽성을 보장할 수는 없으나, 위에서 언급한 요소들을 고려할 때 DiffDock-L과 DynamicBind는 상대적으로 높은 정확도를 가진 프로그램으로 평가될 수 있다.

Figure 5. Ligand site interactions from molecular docking of K776 aaRS and ncAA using DiffDock-L, aligned with template 1J1U. The green ligand represents the tyrosine residue of 1J1U, while the other colored ligand corresponds to the docked ncAAs. (A) Interaction model of K776 aaRS with AzF located in the rank 1 binding pose. (B) Interaction model of K776 aaRS with pFF located in the rank 1 binding pose. (C) Interaction model of K776 aaRS with BpF located in the rank 1 binding pose. (D) Interaction model of K776 aaRS with pAcF located in the rank 1 binding pose.

Figure 6. Ligand site interactions from molecular docking of K776 aaRS and ncAA using DynamicBind, aligned with template 1J1U. The green ligand represents the tyrosine residue of 1J1U, while the other colored ligand corresponds to the docked ncAAs. (A) Interaction model of K776 aaRS with AzF located in the rank 2 binding pose. (B) Interaction model of K776 aaRS with pFF located in the rank 1 binding pose. (C) Interaction model of K776 aaRS with BpF located in the rank 5 binding pose. (D) Interaction model of K776 aaRS with pAcF located in the rank 3 binding pose.

Figure 7. Affinity values obtained from different docking tools. (A) using AMdock, (B) DiffDockL, and (C) using DynamicBind, respectively. Affinity values converted to absolute values for positive representation in Fig (A) and (B).

본 연구에서는 비천연아미노산을 재조합 단백질에 효과적으로 도입하기 위한 aaRS와의 결합을 예측할 수 있는 최적의 docking simulation platform을 평가하고자 하였다. 이를 위해 orthogonal amber-suppression tRNA 합성효소인 K776 aaRS와 다양한 비천연아미노산(AzF, pFF, BpF, pAcF) 간의 결합력을 docking simulation으로 예측하였고, 예측 결과와 실제 형광 단백질 발현량을 비교하여 각 docking program의 신뢰도를 검증하였다. 형광 단백질의 발현량의 실험 결과와 docking simulation 결과의 affinity를 비교한 결과 형광 단백질 발현량과 docking 친화도가 대체로 일치하였다. 하지만, 높은 affinity 값이라도 신뢰도가 낮을 경우 실험 결과와 docking simulation 결과가 상이하다는 것이 확인되어졌다. 본 연구 결과는 향후 비천연아미노산을 효율적으로 도입하는 재조합 단백질 합성 및 설계에 활용될 수 있을 것이다. 추가적으로, 본 연구는 특정 비천연아미노산(AzF, pFF, BpF, pAcF)과 K776 aaRS의 결합 특성에 중점을 두었으나, 다른 신규 비천연아미노산의 도입과 관련한 후속 연구는 특정 단백질의 구조적, 기능적 다양성 증가와 더불어 재조합 단백질 설계에 이어서 새로운 가능성을 열어줄 것으로 기대된다. 또한, 본 연구에서 사용한 세 가지 docking platform을 포함하여, 다양한 platform들의 비교 연구는 각 platform의 prediction 신뢰도를 종합적으로 평가할 수 있으며, 그 중 정교하게 분석할 수 있는 platform을 활용하여 실험 데이터와의 상관성을 높여 더욱 심화된 결과를 도출할 수 있을 것으로 기대된다. 이러한 후속 연구는 비천연아미노산을 기반으로 한 신약 개발 및 단백질 공학 분야에서 중요한 데이터를 제공할 것이다.

This research was supported by “Regional Innovation Strategy (RIS)” through the National Research Foundation of Korea (NRF) funded by the Ministry of Education (MOE) (2021RIS-002) and by Research Project (NNIBR20243103) of the Nakdonggang National Institute of Biological Resources.

  1. Esteves, C. I., M. M. M. Raposo, and S. P. Costa (2017) Noncanonical amino acids bearing thiophene and bithiophene: synthesis by an Ugi multicomponent reaction and studies on ion recognition ability. Amino Acids. 49: 921-930.
    Pubmed CrossRef
  2. Hartman, M. C. (2022) Non-canonical Amino Acid Substrates of. E. Coli Aminoacyl-tRNA Synthetases. ChemBioChem. 23: e202100299.
    Pubmed CrossRef
  3. Ngo, J. T., and D. A. Tirrell (2011) Noncanonical amino acids in the interrogation of cellular protein synthesis. Acc Chem Res. 44: 677-685.
    Pubmed KoreaMed CrossRef
  4. Chin, J. W., S. W. Santoro, A. B. Martin, D. S. King, L. Wang, and P. G. Schultz (2002) Addition of p-Azido-l-phenylalanine to the Genetic Code of Escherichia c oli. J Am Chem Soc. 124: 9026-9027.
    Pubmed CrossRef
  5. Davis, L., and J. W. Chin (2012) Designer proteins: applications of genetic code expansion in cell biology. Nat Rev Mol Cell Biol. 13: 168-182.
    Pubmed CrossRef
  6. Zhao, H., W. Ding, J. Zang, Y. Yang, C. Liu, L. Hu, Y. Chen, G. Liu, Y. Fang, and Y. Yuan (2021) Directed-evolution of translation system for efficient unnatural amino acids incorporation and generalizable synthetic auxotroph construction. Nat Commun. 12: 7039.
    Pubmed KoreaMed CrossRef
  7. Ledwitch, K. V., G. Künze, J. R. McKinney, E. Okwei, K. Larochelle, L. Pankewitz, S. Ganguly, H. L. Darling, I. Coin, and J. Meiler (2023) Sparse pseudocontact shift NMR data obtained from a non-canonical amino acid-linked lanthanide tag improves integral membrane protein structure prediction. J Biomol NMR. 77: 69-82.
    Pubmed KoreaMed CrossRef
  8. Aydin, Y., and I. Coin (2023) Genetically encoded crosslinkers to address protein-protein interactions. Protein Sci. 32: e4637.
    Pubmed KoreaMed CrossRef
  9. Kuhn, S. M., M. Rubini, M. Fuhrmann, I. Theobald, and A. Skerra (2010) Engineering of an orthogonal aminoacyl-tRNA synthetase for efficient incorporation of the non-natural amino acid O-methyl-L-tyrosine using fluorescence-based bacterial cell sorting. J Mol Biol. 404: 70-87.
    Pubmed CrossRef
  10. Neumann, H., A. L. Slusarczyk, and J. W. Chin (2010) De novo generation of mutually orthogonal aminoacyl-tRNA synthetase/tRNA pairs. J Am Chem Soc. 132: 2142-2144.
    Pubmed CrossRef
  11. Wang, L., and P. G. Schultz (2001) A general approach for the generation of orthogonal t. RNAs. Chem Biol. 8: 883-890.
    Pubmed CrossRef
  12. Lee, D. H., and J.-I. Choi (2024) Integration of Orthogonal aaRS/tRNA Pair into Escherichia Coli Genome for Efficient Incorporation of pAzF into. Protein. KSBB J. 39: 54-58.
    CrossRef
  13. Lee, D. H., J. G. Kim, T. W. Kim, and J.-I. Choi (2024) Development of orthogonal aminoacyl-tRNA synthetase mutant for incorporating a non-canonical amino acid. AMB Express. 14: 60.
    Pubmed KoreaMed CrossRef
  14. Lee, D. H., M. K. Kim, and J.-I. Choi (2023) Development of orthogonal aminoacyl tRNA synthetase mutant with enhanced incorporation ability with para-azido-. L-phenylalanine. Biotechnol Bioproc E. 28: 398-405.
    CrossRef
  15. Kim, J. A., and J.-I. Choi (2022) Expression of green fluorescence proteins with non-canonical amino acids in different Escherichia coli. Strains. KSBB J. 37: 58-63.
    CrossRef
  16. Scholz, O., A. Thiel, W. Hillen, and M. Niederweis (2000) Quantitative analysis of gene expression with an improved green fluorescent protein. Eur J Biochem. 267: 1565-1570.
    Pubmed CrossRef
  17. Hiyama, Y., J. V. Silverton, D. A. Torchia, J. Gerig, and S. Hammond (1986) Molecular structure and dynamics of crystalline pfluoro-D, L-phenylalanine. A combined x-ray/NMR investigation. J Am Chem Soc. 108: 2715-2723.
    CrossRef
  18. Kauer, J., S. Erickson-Viitanen, H. R. Wolfe Jr, and W. DeGrado (1986) p-Benzoyl-L-phenylalanine, a new photoreactive amino acid. Photolabeling of calmodulin with a synthetic calmodulin-binding peptide. J Biol Chem. 261: 10695-10700.
    Pubmed CrossRef
  19. Sun, R., H. Zheng, Z. Fang, and W. Yao (2010) Rational design of aminoacyl-tRNA synthetase specific for p-acetyl-. L-phenylalanine. Biochem Biophys Res Commun. 391: 709-715.
    Pubmed CrossRef
  20. Fisher, C. L., and G. K. Pei (1997) Modification of a PCR-based site-directed mutagenesis method. Biotechniques. 23: 570-574.
    Pubmed CrossRef
  21. Feilmeier, B. J., G. Iseminger, D. Schroeder, H. Webber, and G. J. Phillips (2000) Green fluorescent protein functions as a reporter for protein localization in Escherichia coli. J Bacteriol. 182: 4068-4076.
    Pubmed KoreaMed CrossRef
  22. Jeong, E. C., Y. B. Lim, and J.-I. Choi (2024) Mutation of Orthogonal Aminoacyl-tRNA Synthetase for Incorporating para-azido-Lphenylalanine and. Its Structural Modeling. KSBB J. 39: 78-82.
    CrossRef
  23. Valdés-Tresanco, M. S., M. E. Valdés-Tresanco, P. A. Valiente, and E. Moreno (2020) AMDock: a versatile graphical tool for assisting molecular docking with Autodock Vina and. Autodock. Biol Direct. 15. 4: 12.
    Pubmed KoreaMed CrossRef
  24. Trott, O., and A. J. Olson (2010) AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. J Comput Chem. 31: 455-461.
    Pubmed KoreaMed CrossRef
  25. Corso, G., A. Deng, B. Fry, N. Polizzi, R. Barzilay, and T. Jaakkola (2024) Deep confident steps to new pockets: Strategies for docking generalization. ArXiv. 2402: 18396.
    CrossRef
  26. Zhang, W., J. Lu, W. Huang, Z. Zhang, X. Jia, Z. Wang, L. Shi, C. Li, P. G. Wolynes, and S. Zheng (2024) DynamicBind: Predicting ligand-specific protein-ligand complex structure with a deep equivariant generative model. Nature Communications. 15: 1071.
    Pubmed KoreaMed CrossRef
  27. DeLano, W. L. (2002) Pymol: An open-source molecular graphics tool. CCP4 Newsl. Protein Crystallogr. 40: 82-92.