首页 弹性高性能计算E-HPC 最佳实践 使用AutoDock Vina软件进行药物筛选

使用AutoDock Vina软件进行药物筛选

本文以AutoDock Vina软件为例,介绍如何在E-HPC上进行高性能计算实现虚拟药物筛选。

背景信息

分子对接(Molecular docking)是虚拟药物筛选中的关键环节。本文通过模拟小分子配体和生物大分子受体相互作用的过程,预测配体与受体的结合模式和亲和力,模拟实现对药物的筛选。目前商业应用较广泛的Specs、Enamine和ChemDiv化合物库,均可提供大量配体模拟计算配体和给定受体的相互作用。由于不同配体之间没有依赖,因此可以大规模并行处理。本文同样适用于其它大批量、高并发处理需求的生物、医药等场景。

AutoDock Vina作为一款开源的分子对接软件,具有速度快、算法准确等优点,特别适用于搭建基于分子对接的虚拟筛选,它基于MGLTools工具包进行使用。MGLTools包括AutoDock Tools(ADT)和Python Molecular Viewer(PMV)。ADT用来为Vina生成输入文件,PMV用来查看结果。更多信息,请参见AutoDock VinaMGLTools

准备工作

  1. 创建E-HPC集群。

    具体操作,请参见使用向导创建集群。您需要注意以下配置参数:

    参数

    说明

    硬件参数

    部署方式为标准,包含2个管控节点,1个计算节点和1个登录节点。

    节点均采用ecs.c7.large实例规格,配置为2 vCPU,4 GiB内存,Ice Lake处理器,2.7 GHz。

    软件配置

    镜像选择CentOS 7.6公共镜像,调度器选择pbs,开启VNC。

  2. 创建集群用户,本实践中以Vina为例。具体操作,请参见创建用户

    集群用户用于登录集群,进行编译软件、提交作业等操作,配置用户权限时,权限组请选择sudo权限组

  3. 安装运行AutoDock Vina所需的软件。具体操作,请参见安装软件

    需安装的软件如下:

    • ehpc-app-server:版本为1.1.4

    • intel-mpi:版本为2018

  4. 为计算节点绑定EIP。

    说明

    计算节点在下载安装AutoDock Tools软件时需要使用公网地址。配置完成后,您可以按需为其解绑EIP。

  5. 在每个计算节点中安装AutoDock Vina软件及所需运行库。

    1. 登录E-HPC控制台

    2. 执行如下命令下载并安装Vina软件。

    3. 在左侧导航栏,选择资源管理 > 节点与队列

    4. 集群列表中选择目标集群。

    5. 节点类型列表中选择计算节点。

    6. 在目标节点的操作列,选择更多 > 详情

    7. 在计算节点详情页,单击远程连接,以root用户登录该节点。

      cd /opt
      wget https://vina.scripps.edu/wp-content/uploads/sites/55/2020/12/autodock_vina_1_1_2_linux_x86.tgz   #下载vina
      tar xzvf autodock_vina_1_1_2_linux_x86.tgz #解压
      ./autodock_vina_1_1_2_linux_x86/bin/vina --help #查看安装结果
      cp /opt/autodock_vina_1_1_2_linux_x86/bin/vina /usr/bin/vina 
  6. 在管控节点安装AutoDock Tools软件。

    1. 登录E-HPC控制台

    2. 集群页面,在右侧单击远程连接,以root用户登录集群。

    3. 执行如下命令,安装AutoDock Tools软件。

      cd /usr/local
      wget https://ccsb.scripps.edu/download/532/mgltools_x86_64Linux2_1.5.7.tar.gz   #下载AutoDock Tools
      tar -zxvf mgltools_x86_64Linux2_1.5.7.tar.gz
      cd mgltools_x86_64Linux2_1.5.7
      ./install.sh
      cp bin/adt /usr/local/bin/adt
      yum install mesa-libGLU #安装AutoDock Tools所需的mesa-libGLU软件包。

操作步骤

  1. 登录E-HPC控制台

  2. 安装Git及下载作业文件。

    1. 集群页面,在右侧单击远程连接,以Vina用户登录集群。

    2. 执行如下命令,下载本文用到的操作命令和代码。

      git clone https://code.aliyun.com/best-practice/022.git
    3. 执行如下命令检查作业文件。

      cd 022
      ls

      当回显如下时,说明已下载完成。下载vina

    4. 解压作业文件到当前目录。

      tar xzvf vina-ehpcarrayjob.tar.gz
    5. 在vina-ehpcarrayjob目录下,删除conf.txt文件中的以下两行。

      receptor = 1fkn_rgd.pdbqt
      ligand = $file
  3. 提交作业并查看作业运行结果。

    1. 登录E-HPC客户端。

      具体操作,请参见登录客户端

    2. 在左侧导航栏,选择应用中心

    3. 单击Vina应用。

    4. 在弹出的应用信息面板,配置作业参数。

      参数类型

      参数

      描述

      基础参数

      作业名称

      自定义设置,如Vina4。

      作业队列

      运行该作业的队列,如workq。

      CPU核数

      单个节点的CPU核数,如8。

      节点数

      运行该作业所需的计算节点数,如1。

      输出日志

      作业运行日志的输出路径。

      应用参数

      图形界面参数

      选择VNC。

      受体(刚性)

      选择受体文件,如/home/Vina/022/vina-ehpcarrayjob/1fkn_rgd.pdbqt。

      配体

      选择配体文件,如/home/Vina/022/vina-ehpcarrayjob/test/ligand_1.pdbqt

      配置文件

      选择配置文件,如/home/Vina/022/vina-ehpcarrayjob/conf.txt

      输出文件目录

      自定义设置输出目录,如/home/Vina/022。

      是否需要GUI

    5. 单击提交

  4. 查看作业执行情况。

    1. 在左侧导航栏,选择作业查询

    2. 设置查询条件,查询作业执行情况。

    3. 当作业状态为FINISHED时,表示作业执行完成,单击详情可以查看作业详细信息。查看作业运行详情

  5. 查看作业运行结果。

    1. 在左侧导航栏,选择会话管理,然后单击VNC,打开VNC窗口。

    2. 在弹出的AutoDockTools窗口中,查看作业结果。

      查看作业运行结果
阿里云首页 弹性高性能计算 相关技术圈