Which Continuous Group of Solvent Molecules to Choose Will Try to Add 0 Na Ions and 6 Cl Ions Jz4
我们必须下载将要使用的蛋白质结构文件。在本教程中,我们将使用T4溶菌酶L99A/M102Q(PDB代码 3HTB)。转到RCSB网站,并下载晶体结构的PDB文本。
source /opt/fastone/softwares/hpc-kits/hpc-kits.sh source /data/software/gromacs/gromacs-2020.3/bin/GMXRC cd /data/user/sam/project/gromacs/test5 1.1 生成拓扑结构
下载完结构后,您可以使用查看程序(例如VMD,Chimera,PyMOL等)将其可视化。查看了分子后,您将要去除结晶水,PO4,和BME。注意,这种方法并非普遍适用(即,结合了活性位点水分子的情况)。就我们的意图而言,我们不需要结晶水或其他物质,它们只是结晶助溶剂。相反,我们将专注于称为" JZ4"的配体,即2-丙基苯酚。
如果您希望使用.pdb文件的干净版本来检查工作,则可以在此处下载。我们现在面临的问题是,在GROMACS随附的任何力场中,JZ4配体都不是公认的实体,因此,如果您尝试使该文件通过它,则pdb2gmx将给出致命错误。如果在力场的.rtp(残基拓扑)文件中存在构建块的条目,则拓扑只能自动组装。既然不是这种情况,我们将分两步准备系统拓扑:
- 使用pdb2gmx准备蛋白质拓扑
- 使用外部工具准备配体拓扑
由于我们将分别准备这两种拓扑,因此必须将蛋白质和JZ4配体保存到单独的坐标文件中。像这样保存JZ4坐标:
grep JZ4 3HTB_clean.pdb > jz4.pdb 然后只需从3HTB_clean.pdb中删除JZ4行。 在这一点上,准备蛋白质拓扑结构是微不足道的。 我们将在本教程中使用的力场是CHARMM36,可从MacKerell实验室网站获得。 在此处,下载最新的CHARMM36力场压缩包和" cgenff_charmm2gmx.py"转换脚本,我们将在以后使用。 下载与您安装的Python版本相对应的转换脚本版本(Python 2.x或3.x)。
在工作目录中取消归档力场压缩包:
tar -zxvf charmm36-mar2019.ff.tgz 现在,您的工作目录中应该有一个" charmm36-mar2019.ff"子目录。 用pdb2gmx编写T4溶菌酶的拓扑:
grep -v 'JZ4' 3HTB_clean.pdb > 3HTB_clean_remove_jz4.pdb gmx pdb2gmx -f 3HTB_clean_remove_jz4.pdb -o 3HTB_processed.gro 出现提示时,选择默认的水模型。 该结构将由pdb2gmx处理,并且将提示您选择一个力场:
Select the Force Field: From current directory: 1: CHARMM36 all-atom force field (July 2017) From '/usr/local/gromacs/share/gromacs/top': 2: AMBER03 protein, nucleic AMBER94 (Duan et al., J. Comp. Chem. 24, 1999-2012, 2003) 3: AMBER94 force field (Cornell et al., JACS 117, 5179-5197, 1995) 4: AMBER96 protein, nucleic AMBER94 (Kollman et al., Acc. Chem. Res. 29, 461-469, 1996) 5: AMBER99 protein, nucleic AMBER94 (Wang et al., J. Comp. Chem. 21, 1049-1074, 2000) 6: AMBER99SB protein, nucleic AMBER94 (Hornak et al., Proteins 65, 712-725, 2006) 7: AMBER99SB-ILDN protein, nucleic AMBER94 (Lindorff-Larsen et al., Proteins 78, 1950-58, 2010) 8: AMBERGS force field (Garcia & Sanbonmatsu, PNAS 99, 2782-2787, 2002) 9: CHARMM27 all-atom force field (CHARM22 plus CMAP for proteins) 10: GROMOS96 43a1 force field 11: GROMOS96 43a2 force field (improved alkane dihedrals) 12: GROMOS96 45a3 force field (Schuler JCC 2001 22 1205) 13: GROMOS96 53a5 force field (JCC 2004 vol 25 pag 1656) 14: GROMOS96 53a6 force field (JCC 2004 vol 25 pag 1656) 15: GROMOS96 54a7 force field (Eur. Biophys. J. (2011), 40,, 843-856, DOI: 10.1007/s00249-011-0700-9) 16: OPLS-AA/L all-atom force field (2001 aminoacid dihedrals) 对于本教程,选择CHARMM36强制字段(选项1),该字段首先在列表中的"来自当前目录"下列出。
1.2 Prepare the Ligand Topology 准备配体拓扑
我们现在必须处理配体。但是,如何为力场无法自动识别的某些物种提供参数呢?正确处理配体是分子模拟中最具挑战性的任务之一。力场作者花了数年的时间来获得自洽的力场,将新物种引入该框架并非易事。任何新物种的力场参数必须以与原始力场一致的方式导出和验证。
对于OPLS,AMBER和CHARMM力场,此推导通常采用各种量子力学计算的形式。这些力场的主要文献描述了所需的过程。对于GROMOS力场,参数化方法尚不清楚,它依赖于凝聚相行为的经验拟合。也就是说,为每种原子类型计算一些初始电荷和Lennard-Jones参数,对其准确性进行评估并进行完善。尽管最终结果非常令人满意,即流体类似于现实世界中的流体,但推导过程可能很费力且令人沮丧。
由于这个原因,非常需要自动化工具。对于每个力场,都有一些方法或软件程序旨在提供与各种力场兼容的参数。并非所有这些都同样准确。有关一些示例,请参考下表:
表格来源: http://www.mdtutorials.com/gmx/complex/02_topology.html
1.2.1 将氢原子添加到JZ4 Add Hydrogen Atoms to JZ4
在本教程中,我们将使用CGenFF服务器生成JZ4拓扑。 单击上表中的链接访问该网站。 注册一个(免费)帐户并激活它。 CGenFF需要一个Sybyl .mol2文件作为其输入,以收集基本原子类型信息和绑定连接。 CHARMM也是一个全原子力场,这意味着所有H原子都被明确表示。 晶体结构通常不分配H坐标,因此必须将其内置。要生成.mol2文件并添加H原子,请使用Avogadro程序。 在Avogadro中打开jz4.pdb,然后从"构建"菜单中选择"添加氢"。 Avogadro会将所有H原子构建到JZ4配体上。 保存一个名为" jz4.mol2"的.mol2文件(文件->另存为…,然后从下拉菜单中选择Sybyl Mol2)。
在使用jz4.mol2之前,必须对其进行一些更正。 在您喜欢的纯文本编辑器中打开jz4.mol2,您将找到:
@<TRIPOS>MOLECULE ***** 22 22 0 0 0 SMALL GASTEIGER @<TRIPOS>ATOM 1 C4 24.2940 -24.1240 -0.0710 C.3 167 JZ4167 -0.0650 2 C7 21.5530 -27.2140 -4.1120 C.ar 167 JZ4167 -0.0613 3 C8 22.0680 -26.7470 -5.3310 C.ar 167 JZ4167 -0.0583 4 C9 22.6710 -25.5120 -5.4480 C.ar 167 JZ4167 -0.0199 5 C10 22.7690 -24.7300 -4.2950 C.ar 167 JZ4167 0.1200 6 C11 21.6930 -26.4590 -2.9540 C.ar 167 JZ4167 -0.0551 7 C12 22.2940 -25.1870 -3.0750 C.ar 167 JZ4167 -0.0060 8 C13 22.4630 -24.4140 -1.8080 C.3 167 JZ4167 -0.0245 9 C14 23.9250 -24.7040 -1.3940 C.3 167 JZ4167 -0.0518 10 OAB 23.4120 -23.5360 -4.3420 O.3 167 JZ4167 -0.5065 11 H 25.3133 -24.3619 0.1509 H 1 UNL1 0.0230 12 H 23.6591 -24.5327 0.6872 H 1 UNL1 0.0230 13 H 24.1744 -23.0611 -0.1016 H 1 UNL1 0.0230 14 H 21.0673 -28.1238 -4.0754 H 1 UNL1 0.0618 15 H 21.9931 -27.3472 -6.1672 H 1 UNL1 0.0619 16 H 23.0361 -25.1783 -6.3537 H 1 UNL1 0.0654 17 H 21.3701 -26.8143 -2.0405 H 1 UNL1 0.0621 18 H 21.7794 -24.7551 -1.0588 H 1 UNL1 0.0314 19 H 22.2659 -23.3694 -1.9301 H 1 UNL1 0.0314 20 H 24.5755 -24.2929 -2.1375 H 1 UNL1 0.0266 21 H 24.0241 -25.7662 -1.3110 H 1 UNL1 0.0266 22 H 23.7394 -23.2120 -5.1580 H 1 UNL1 0.2921 @<TRIPOS>BOND 1 4 3 ar 2 4 5 ar 3 3 2 ar 4 10 5 1 5 5 7 ar 6 2 6 ar 7 7 6 ar 8 7 8 1 9 8 9 1 10 9 1 1 11 1 11 1 12 1 12 1 13 1 13 1 14 2 14 1 15 3 15 1 16 4 16 1 17 6 17 1 18 8 18 1 19 8 19 1 20 9 20 1 21 9 21 1 22 10 22 1 需要进行的第一个更改是在MOLECULE标题中。 将" *****"替换为" JZ4",例如:
@ <TRIPOS>分子 JZ4 接下来,固定残基名称和编号,使它们都相同。 该.mol2文件仅包含一个分子,因此应仅指定一个残基名称和编号。 编辑后,jz4.mol2的更正的ATOM部分应显示为:
@<TRIPOS>ATOM 1 C4 24.2940 -24.1240 -0.0710 C.3 1 JZ4 -0.0650 2 C7 21.5530 -27.2140 -4.1120 C.ar 1 JZ4 -0.0613 3 C8 22.0680 -26.7470 -5.3310 C.ar 1 JZ4 -0.0583 4 C9 22.6710 -25.5120 -5.4480 C.ar 1 JZ4 -0.0199 5 C10 22.7690 -24.7300 -4.2950 C.ar 1 JZ4 0.1200 6 C11 21.6930 -26.4590 -2.9540 C.ar 1 JZ4 -0.0551 7 C12 22.2940 -25.1870 -3.0750 C.ar 1 JZ4 -0.0060 8 C13 22.4630 -24.4140 -1.8080 C.3 1 JZ4 -0.0245 9 C14 23.9250 -24.7040 -1.3940 C.3 1 JZ4 -0.0518 10 OAB 23.4120 -23.5360 -4.3420 O.3 1 JZ4 -0.5065 11 H 25.3133 -24.3619 0.1509 H 1 JZ4 0.0230 12 H 23.6591 -24.5327 0.6872 H 1 JZ4 0.0230 13 H 24.1744 -23.0611 -0.1016 H 1 JZ4 0.0230 14 H 21.0673 -28.1238 -4.0754 H 1 JZ4 0.0618 15 H 21.9931 -27.3472 -6.1672 H 1 JZ4 0.0619 16 H 23.0361 -25.1783 -6.3537 H 1 JZ4 0.0654 17 H 21.3701 -26.8143 -2.0405 H 1 JZ4 0.0621 18 H 21.7794 -24.7551 -1.0588 H 1 JZ4 0.0314 19 H 22.2659 -23.3694 -1.9301 H 1 JZ4 0.0314 20 H 24.5755 -24.2929 -2.1375 H 1 JZ4 0.0266 21 H 24.0241 -25.7662 -1.3110 H 1 JZ4 0.0266 22 H 23.7394 -23.2120 -5.1580 H 1 JZ4 0.2921 最后,请注意@
perl sort_mol2_bonds.pl jz4.mol2 jz4_fix.mol2 在下一步中使用" jz4_fix.mol2"。
1.2.2 使用CGenFF生成JZ4拓扑
现在可以使用jz4_fix.mol2文件生成拓扑了。访问CGenFF服务器,登录到您的帐户,然后单击页面顶部的"上载分子"。上传jz4_fix.mol2,CGenFF服务器将以CHARMM"流"文件(扩展名为.str)的形式快速返回拓扑。将其内容从Web浏览器保存到名为" jz4.str"的文件中。您也可以在这里下载此文件的副本。
CHARMM流文件包含所有拓扑信息-原子类型,电荷和绑定连接。它还有一些附加的粘结参数部分,这些参数是通过类比为力场未涵盖的任何内部相互作用生成的。 CGenFF还为每个参数提供罚分,即评估分配的参数的可靠性。低于10的任何东西都被认为可以立即使用。介于10到50之间的值表示必须对拓扑进行一些验证,并且任何大于50的惩罚通常需要手动重新参数化。罚分是CGenFF服务器最重要的功能之一。许多其他服务器生成拓扑,它们是"黑匣子",用户只需要隐式信任即可。在没有验证的情况下将整个研究项目放在自动程序上非常危险。较差的配体拓扑会导致大量的时间浪费和不可靠的结果。始终验证新参数化物种的拓扑!至少应对照力场中现有的部分检查电荷的大小和分配给配体的原子类型。
检查jz4.str的内容,并查看charge和新的二面体参数的惩罚。它们都非常低,表明该拓扑的质量非常好,可以直接用于我们的仿真。
CHARMM格式的JZ4拓扑很好,但是如果我们尝试在GROMACS中运行仿真,它就没有用。使用我们先前从MacKerell网站下载的cgenff_charmm2gmx.py脚本。脚本名称将包含版本_py2或_py3,但为简单起见,此处省略了此信息,但是您将需要使用为Python版本下载的脚本的实际名称。使用以下命令执行转换:
activate3 python3 cgenff_charmm2gmx_py3_nx2.py JZ4 jz4_fix.mol2 jz4.str charmm36-mar2019.ff 请注意:此脚本需要NetworkX软件包,版本1.11-与NetworkX 2.x不兼容,并且将退出并显示明显错误。
成功转换结束时,请注意以下屏幕输出:
============ DONE ============ Conversion complete. The molecule topology has been written to jz4.itp Additional parameters needed by the molecule are written to jz4.prm, which needs to be included in the system .top ============ DONE ============ 该配体引入了新的结合参数,这些参数不是现有力场的一部分,并且将这些参数写入到名为" jz4.prm"的文件中,该文件采用GROMACS .itp文件的格式。 我们将在短期内处理此文件,但重要的是要注意它的存在。 现在将配体拓扑写入" jz4.itp",其中包含配体[分子类型]定义。
1.2.3 建立综合体 Build the Complex
在pdb2gmx中,我们有一个名为" 3HTB_processed.gro"的文件,其中包含蛋白质的已加工,与力场相符的结构。 我们还从cgenff_charmm2gmx.py获得了" jz4_ini.pdb",它具有所有必需的H原子,并且与JZ4拓扑中的原子名称匹配。 使用editconf将此.pdb文件转换为.gro格式:
gmx editconf -f jz4_ini.pdb -o jz4.gro 将3HTB_processed.gro复制到要操作的新文件中,例如,将其称为" complex.gro",因为在蛋白质中添加JZ4会生成我们的蛋白质-配体复合物。 接下来,只需复制jz4.gro的坐标部分并将其粘贴到complex.gro中,在蛋白质原子的最后一行之下,在框矢量之前,如下所示:
163ASN C 1691 0.621 -0.740 -0.126 163ASN O1 1692 0.624 -0.616 -0.140 163ASN O2 1693 0.683 -0.703 -0.011 5.99500 5.19182 9.66100 0.00000 0.00000 -2.99750 0.00000 0.00000 0.00000 添加以后
163ASN C 1691 0.621 -0.740 -0.126 163ASN O1 1692 0.624 -0.616 -0.140 163ASN O2 1693 0.683 -0.703 -0.011 1JZ4 C4 1 2.429 -2.412 -0.007 1JZ4 C7 2 2.155 -2.721 -0.411 1JZ4 C8 3 2.207 -2.675 -0.533 1JZ4 C9 4 2.267 -2.551 -0.545 1JZ4 C10 5 2.277 -2.473 -0.430 1JZ4 C11 6 2.169 -2.646 -0.295 1JZ4 C12 7 2.229 -2.519 -0.308 1JZ4 C13 8 2.246 -2.441 -0.181 1JZ4 C14 9 2.392 -2.470 -0.139 1JZ4 OAB 10 2.341 -2.354 -0.434 1JZ4 H1 11 2.531 -2.436 0.015 1JZ4 H2 12 2.366 -2.453 0.069 1JZ4 H3 13 2.417 -2.306 -0.010 1JZ4 H4 14 2.107 -2.812 -0.407 1JZ4 H5 15 2.199 -2.735 -0.617 1JZ4 H6 16 2.304 -2.518 -0.635 1JZ4 H7 17 2.137 -2.681 -0.204 1JZ4 H8 18 2.178 -2.476 -0.106 1JZ4 H9 19 2.227 -2.337 -0.193 1JZ4 H10 20 2.458 -2.429 -0.214 1JZ4 H11 21 2.402 -2.577 -0.131 1JZ4 H12 22 2.374 -2.321 -0.516 5.99500 5.19182 9.66100 0.00000 0.00000 -2.99750 0.00000 0.00000 0.00000 由于我们已经在.gro文件中添加了22个以上的原子,因此请增加complex.gro的第二行以反映此更改。 现在,坐标文件中应该有2636个原子。
1.2.4 建立拓扑(修改topol.top)
在系统拓扑中包括JZ4配体的参数非常容易。 在包含位置限制文件后,只需在topol.top中插入一行,显示#include" jz4.itp"。 位置限制的包含表明"蛋白质"分子类型部分的结束。
; Include Position restraint file #ifdef POSRES #include "posre.itp"
0 Response to "Which Continuous Group of Solvent Molecules to Choose Will Try to Add 0 Na Ions and 6 Cl Ions Jz4"
Post a Comment