基于合规需求和安全考虑,阿里云Kubernetes与自建的Kubernetes在功能上有部分区别,请在使用阿里云Kubernetes前仔细阅读本文档。

集群规划

阿里云容器服务支持弹性裸金属服务器(神龙),您可以根据业务场景进行选择CPU型或GPU型。
  • 弹性裸金属服务器

    是基于阿里云完全自主研发的下一代虚拟化技术而打造的新型计算类服务器产品,兼具虚拟机的弹性和物理机的性能及功能特性。例如,用户独占计算资源、加密计算、兼容多种专有云、异构指令集处理器支持。

  • GPU云服务器

    是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。

网络规划

  • 容器集群基础设施(云服务器 ECS)的网络类型选择:专有网络VPC或经典网络。
    • 专有网络VPC:推荐使用。

      采用二层隔离,相对经典网络而言,VPC 具有更高的安全性和灵活性。

    • 经典网络

      采用三层隔离,所有经典网络类型实例都建立在一个共用的基础网络上。

  • Kubernetes集群内Pod之间进行通信的网络插件选择:Terway或Flannel。
    • Terway :推荐使用。

      阿里云容器服务自研的网络插件,将阿里云的弹性网卡分配给容器,支持基于Kubernetes标准的NetworkPolicy来定义容器间的访问策略,支持对单个容器做带宽的限流。对于不需要使用Network Policy的用户,可以选择Flannel,其他情况建议选择Terway。

    • Flannel

      使用的是简单稳定的社区的Flannel CNI 插件,配合阿里云的VPC的高速网络,能给集群高性能和稳定的容器网络体验,但功能偏简单,支持的特性少,例如:不支持基于Kubernetes标准的Network Policy。

容量规划

  • 基础容量:用户可以根据自己的成本和预算规划一个可满足初期业务正常运行的容量。
  • 弹性容量:随后可以配置动态扩缩容随时调整集群规模。
    • horizontal pod autoscaling

      Kubernetes根据指标触发容量扩缩容,自动地伸缩在replication controller、deployment或replica set上Pod的数量。

    • cluster-autoscaler

      通过节点自动伸缩组件实现容量扩缩容,可以按需弹出普通实例、GPU实例、竞价付费实例,支持多可用区、多实例规格、多种伸缩模式,满足不同的节点伸缩场景。

数据规划

  • 数据库数据

    阿里云关系型数据库(RDS)是一种稳定可靠、可弹性伸缩的在线数据库服务。基于阿里云分布式文件系统和SSD盘高性能存储,RDS支持MySQL、SQL Server、PostgreSQL、PPAS和MariaDB TX引擎。

  • 存储数据

    阿里云对象存储服务(OSS),是阿里云提供的海量、安全、低成本、高可靠的云存储服务。

  • 容器镜像

    容器镜像服务提供安全的应用镜像托管能力,精确的镜像安全扫描功能,稳定的中国及国外镜像构建服务,便捷的镜像授权功能,方便用户进行镜像全生命周期管理。分为默认实例版和企业版。

安全防护

  • 基础架构安全

    设置合理的安全组规则。

  • 镜像安全

    使用私有镜像并定义镜像安全扫描。

  • K8S应用安全

    设置不同服务间互相访问的网络安全策略等。

基础运维

  • 监控配置:云监控、ARMS可供用户选择,提供全方位的集群及应用监控,并可根据阈值设定触发报警通知。
    • 云监控作为云服务的监控管理入口,能让您快速了解各产品实例的状态和性能。云监控从站点监控、云服务监控、自定义监控三个方面来为您提供服务。通过云监控管理控制台,您可以看到当前服务的监控项数据图表,清晰了解服务运行情况。同时可以通过设置报警规则,管理监控项状态,及时获取异常信息。
    • 应用实时监控服务(ARMS)是一款应用性能管理产品,包含前端监控,应用监控和Prometheus监控三大子产品,涵盖了浏览器,小程序,APP,分布式应用和容器环境等性能管理,能帮助您实现全栈式的性能监控和端到端的全链路追踪诊断, 让应用运维更加高效。
  • 日志配置:用户可将自建的日志收集方案切换成阿里云上企业级的日志产品LOG