混合云场景自建K8S集群使用飞天AI加速工具提升训练和推理的性能。

直达最佳实践

点击查看最佳实践详情

更多最佳实践

点击查看更多阿里云最佳实践

场景描述

本文介绍了混合云场景中,自建 Kubernetes服务,线下集群+云上弹性扩展阿里云GPU服务实例+飞天AI加速工具,并采用阿里云CPFS存储,运行AI训练+AI推理作业的操作步骤。

解决的问题

  • 利用云企业网打通两个地域的VPC,自建Kubernetes集群。
  • 使用飞天AI加速工具运行训练和推理作业。
  • 使用CPFS存储共享数据。

部署架构图

混合云使用飞天AI加速工具架构图