全部产品

北京HPC使用容器服务

更新时间:2017-06-07 13:26:11   分享:   

操作流程

  1. 登录HPC容器管理界面,如果页面提示您还未开通容器服务,请单击开通。
  2. 单击左侧导航的集群页,选中右上角的创建集群旁边的小三角,单击创建本地集群,跳转到下面的页面:

    创建本地集群

  3. 设置集群的名称和网络类型,单击创建集群

    集群名称可以设置一个名称用于标示集群。名称要求在同一个用户和同一个region下唯一。目前使用的region是cn-beijing-hpc

    地域选项请一定选择HPC地域。如果您的界面上没有HPC地域,请提工单将您的阿里云账号告诉我们,为您开通相关权限。

    网络类型请一定选择Overlay网络。并且请一定注意不要使用192.168.0.0/16,建议使用172.80.0.0/16

    是否新增节点默认不创建节点。

    创建本地集群细节

  4. 添加节点

4.1 回到集群页面,在已经创建的集群右侧单击更多下拉框,选择添加已有实例

添加实例

4.2 查看需要在HPC机器上执行的脚本,特别注意其中的长串

token

4.3 登录到HPC机器

(1) 清理已有的nvidia docker和docker。如果这是您新购买的北京HPC,请略过此步。如果这不是您第一次注册HPC容器集群,未避免兼容问题请在机器上运行以下脚本:

  1. docker volume rm $(docker volume ls -q)
  2. docker rm -f $(sudo docker ps -aq)
  3. service nvidia-docker stop
  4. service docker stop
  5. rpm -qa|grep nvidia-docker|xargs yum remove -y
  6. rpm -qa|grep docker|xargs yum remove -y
  7. rm -rf /etc/docker
  8. rm -rf /disk2/docker
  9. ifconfig docker0 down
  10. brctl delbr docker0
  11. ifconfig docker_gwbridge down
  12. brctl delbr docker_gwbridge

(2) 在HPC机器中下载并运行注册脚本。注意c46e89653c69d0fcedc156d19b6e2156f5668001 是步骤3.2中的长串,请根据您在3.2步中的实际情况设置。 --advertise-interface 是与外界通信的网络接口,北京HPC一律是bond0.700

  1. curl -Ls http://aliyuncontainerservice.oss-cn-hangzhou-internal.aliyuncs.com/hpc/1.12.3/attachNodeScript | sudo -H bash -s c46e89653c69d0fcedc156d19b6e2156f5668001 --advertise-interface bond0.700 --override-kernel-check

5. 访问https://cs.console.aliyun.com/#/node查看节点列表

hpc node

6. 现在您的机器上已经成功安装并运行了docker和nvidia-docker服务,可以开始利用容器服务部署应用了。

本文导读目录
本文导读目录
以上内容是否对您有帮助?