使用AutoDock Vina软件进行药物筛选
本文以AutoDock Vina软件为例,介绍如何在E-HPC上进行高性能计算实现虚拟药物筛选。
背景信息
分子对接(Molecular docking)是虚拟药物筛选中的关键环节。本文通过模拟小分子配体和生物大分子受体相互作用的过程,预测配体与受体的结合模式和亲和力,模拟实现对药物的筛选。目前商业应用较广泛的Specs、Enamine和ChemDiv化合物库,均可提供大量配体模拟计算配体和给定受体的相互作用。由于不同配体之间没有依赖,因此可以大规模并行处理。本文同样适用于其它大批量、高并发处理需求的生物、医药等场景。
AutoDock Vina作为一款开源的分子对接软件,具有速度快、算法准确等优点,特别适用于搭建基于分子对接的虚拟筛选,它基于MGLTools工具包进行使用。MGLTools包括AutoDock Tools(ADT)和Python Molecular Viewer(PMV)。ADT用来为Vina生成输入文件,PMV用来查看结果。更多信息,请参见AutoDock Vina和MGLTools。
准备工作
创建E-HPC集群。
具体操作,请参见使用向导创建集群。您需要注意以下配置参数:
参数
说明
硬件参数
部署方式为标准,包含2个管控节点,1个计算节点和1个登录节点。
节点均采用ecs.c7.large实例规格,配置为2 vCPU,4 GiB内存,Ice Lake处理器,2.7 GHz。
软件配置
镜像选择CentOS 7.6公共镜像,调度器选择pbs,开启VNC。
创建集群用户,本实践中以Vina为例。具体操作,请参见创建用户。
集群用户用于登录集群,进行编译软件、提交作业等操作,配置用户权限时,权限组请选择sudo权限组。
安装运行AutoDock Vina所需的软件。具体操作,请参见安装软件。
需安装的软件如下:
ehpc-app-server:版本为1.1.4
intel-mpi:版本为2018
为计算节点绑定EIP。
说明计算节点在下载安装AutoDock Tools软件时需要使用公网地址。配置完成后,您可以按需为其解绑EIP。
在每个计算节点中安装AutoDock Vina软件及所需运行库。
登录E-HPC控制台。
执行如下命令下载并安装Vina软件。
在左侧导航栏,选择资源管理 > 节点与队列。
在集群列表中选择目标集群。
在节点类型列表中选择计算节点。
在目标节点的操作列,选择更多 > 详情。
在计算节点详情页,单击远程连接,以root用户登录该节点。
cd /opt wget https://vina.scripps.edu/wp-content/uploads/sites/55/2020/12/autodock_vina_1_1_2_linux_x86.tgz #下载vina tar xzvf autodock_vina_1_1_2_linux_x86.tgz #解压 ./autodock_vina_1_1_2_linux_x86/bin/vina --help #查看安装结果 cp /opt/autodock_vina_1_1_2_linux_x86/bin/vina /usr/bin/vina
在管控节点安装AutoDock Tools软件。
登录E-HPC控制台。
在集群页面,在右侧单击远程连接,以root用户登录集群。
执行如下命令,安装AutoDock Tools软件。
cd /usr/local wget https://ccsb.scripps.edu/download/532/mgltools_x86_64Linux2_1.5.7.tar.gz #下载AutoDock Tools tar -zxvf mgltools_x86_64Linux2_1.5.7.tar.gz cd mgltools_x86_64Linux2_1.5.7 ./install.sh cp bin/adt /usr/local/bin/adt yum install mesa-libGLU #安装AutoDock Tools所需的mesa-libGLU软件包。
操作步骤
登录E-HPC控制台。
安装Git及下载作业文件。
在集群页面,在右侧单击远程连接,以Vina用户登录集群。
执行如下命令,下载本文用到的操作命令和代码。
git clone https://code.aliyun.com/best-practice/022.git
执行如下命令检查作业文件。
cd 022 ls
当回显如下时,说明已下载完成。
解压作业文件到当前目录。
tar xzvf vina-ehpcarrayjob.tar.gz
在vina-ehpcarrayjob目录下,删除conf.txt文件中的以下两行。
receptor = 1fkn_rgd.pdbqt ligand = $file
提交作业并查看作业运行结果。
登录E-HPC客户端。
具体操作,请参见登录客户端。
在左侧导航栏,选择应用中心。
单击Vina应用。
在弹出的应用信息面板,配置作业参数。
参数类型
参数
描述
基础参数
作业名称
自定义设置,如Vina4。
作业队列
运行该作业的队列,如workq。
CPU核数
单个节点的CPU核数,如8。
节点数
运行该作业所需的计算节点数,如1。
输出日志
作业运行日志的输出路径。
应用参数
图形界面参数
选择VNC。
受体(刚性)
选择受体文件,如/home/Vina/022/vina-ehpcarrayjob/1fkn_rgd.pdbqt。
配体
选择配体文件,如/home/Vina/022/vina-ehpcarrayjob/test/ligand_1.pdbqt
配置文件
选择配置文件,如/home/Vina/022/vina-ehpcarrayjob/conf.txt
输出文件目录
自定义设置输出目录,如/home/Vina/022。
是否需要GUI
是
单击提交。
查看作业执行情况。
在左侧导航栏,选择作业查询。
设置查询条件,查询作业执行情况。
当作业状态为FINISHED时,表示作业执行完成,单击详情可以查看作业详细信息。
查看作业运行结果。
在左侧导航栏,选择会话管理,然后单击VNC,打开VNC窗口。
在弹出的AutoDockTools窗口中,查看作业结果。